Você está na página 1de 93

UNIVERSIDADE DO OESTE DE SANTA CATARINA

UNOESC CAMPUS DE XANXERÊ

APOSTILA DE ESTATÍSTICA

Xanxerê
2008
SUMÁRIO

1 CONSIDERAÇÕES INICIAIS ...........................................................................................................................4


1.1 Definição de Estatística................................................................................................................................4
1.2 História da estatística ..................................................................................................................................4
1.3 Uso da estatística em diferentes áreas de aplicação .........................................................................5
1.4 Estatística Descritiva e Inferência Estatística ...................................................................................5
2 ESTATÍSTICA DESCRITIVA............................................................................................................................7
2.1 Organização e apresentação dos dados ...................................................................................................7
2.2 Dados Qualitativos (ou dados Categorizados).......................................................................................8
2.3 Dados Quantitativos....................................................................................................................................12
9) Apresente os dados da tabela a seguir na forma de um gráfico. Use o computador.................... 20
3 DESCRIÇÃO PARAMÉTRICA ...........................................................................................................................21
3.1 Parâmetros que Descrevem a Posição ou Tendência Central...........................................................21
3.1.1 Média ........................................................................................................................................................21
3.1.2 Mediana – md ........................................................................................................................................ 24
3.1.3 Quartis e extremos............................................................................................................................ 26
3.1.4 Moda - Mo.............................................................................................................................................. 27
3.2 Parâmetros que descrevem a dispersão ou a variabilidade ............................................................ 28
3.2.1 Amplitude Total - A............................................................................................................................ 29
3.2.2 Variância................................................................................................................................................ 29
3.2.3 Desvio Padrão........................................................................................................................................31
3.2.4 Coeficiente de variação – C.V.......................................................................................................... 32
3.2.5 Erro padrão da média ........................................................................................................................ 33
4 INTRODUÇÃO À PROBABILIDADE ............................................................................................................. 39
4.1 Modelos........................................................................................................................................................... 39
4.1.1 Modelos Determinísticos................................................................................................................... 39
4.1.2 Modelos Probabilísticos..................................................................................................................... 39
4.2 Espaço amostral Equiprovável...................................................................................................................41
4.3 Definição de Probabilidade: ......................................................................................................................41
4.5 Eventos Independentes............................................................................................................................. 48
5 ESTIMAÇÃO DE PARÂMETROS.................................................................................................................... 50
5.1 Introdução ..................................................................................................................................................... 50
5.2 Estimação por ponto e por intervalo...................................................................................................... 50
5.2.1 Intervalo de confiança para proporção ........................................................................................ 50
5.2.2 Intervalo de confiança para média................................................................................................ 52
6 PLANEJAMENTO DE UMA PESQUISA ...................................................................................................... 56
6.1 Aspectos Gerais ........................................................................................................................................... 56
6.2 Técnicas de Amostragem.......................................................................................................................... 58
6.2.1 Planejamento de amostras................................................................................................................ 58
6.2.2 Tamanho da amostra.......................................................................................................................... 58
6.2.3 Amostragem Aleatória Simples (AAS)......................................................................................... 60
6.2.4 Amostragem Estratificada (AE) .....................................................................................................61
6.2.5 Amostragem por Conglomerado (AC)............................................................................................ 63
6.2.6 Amostragem Sistemática (AS)....................................................................................................... 65
6.2.7 Amostragens não Aleatórias ........................................................................................................... 66
7 CORRELAÇÃO E REGRESSÃO ........................................................................................................................ 68
3

7.1 Variáveis Correlacionadas ......................................................................................................................... 68


7.2 Diagramas de Dispersão............................................................................................................................ 68
7.3 Coeficiente de Correlação de Pearson (rXY)........................................................................................ 70
7.4 Regressão Linear Simples......................................................................................................................... 73
7.4.1 Estimativas dos Parâmetros a e b.................................................................................................. 74
ANEXOS .................................................................................................................................................................... 80
ANEXO I - REVISÃO DE MATEMÁTICA ..................................................................................................81
ANEXO II - TABELA DE NÚMEROS ALEATÓRIOS............................................................................. 90
ANEXO III - CADASTRO DE PRODUTORES DE LARANJA DOCE ..................................................91
4

1 CONSIDERAÇÕES INICIAIS

1.1 DEFINIÇÃO DE ESTATÍSTICA

Segundo Memória (2004) o vocábulo estatística foi criado em 1746 e sua


criação é atribuída ao professor alemão, Gottfried Achenwall (1719-1772), da
Universidade de Göttingen.
Pelo Dicionário Brasileiro de Estatística, o termo estatística refere-se ao
conjunto dos processos que têm por objeto a observação, a classificação formal
e a análise dos fenômenos coletivos, ou de massa e, por fim, a indução das leis a
que eles obedecem. Pode ser também a apresentação tabular ou gráfica de
resultados da observação de fenômenos de massa, ou o modelo probabilístico de
um fenômeno físico.
O Dicionário Aurélio traz estatística como sendo parte da matemática em
que se investigam os processos de obtenção, organização e análise de dados
sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de
tirar conclusões e fazer predições com base nesses dados. Outra definição é que
estatística é qualquer parâmetro de uma amostra, como por exemplo, a sua
média, o seu desvio padrão, a sua variância.
Se consultarmos o livro “Curso de Estatística Experimental” do professor
Frederico Pimentel-Gomes, veremos que o mesmo define a estatística como a
matemática aplicada aos dados de observação, sendo que a estatística
experimental se ocupa do estudo dos experimentos, seu planejamento, execução
e análise. Portando, pode-se afirmar que a estatística, no sentido acadêmico, é a
ciência que trata da coleta, apuração, classificação e análise de dados (Vieira,
2004).

1.2 HISTÓRIA DA ESTATÍSTICA

O livro de Memória (2004) relata que o interesse sobre as populações e


riquezas por parte dos governos já vêm de muito tempo, principalmente, para fins
militares e tributários. Na China, Confúcio relatou levantamentos realizados a
mais de 4000 anos. O uso sistemático de informações de caráter estatístico
pelos faraós, no Egito, também foi evidenciado em pesquisas arqueológicas. Para
os cristãos é bem conhecido o recenseamento dos judeus, ordenado pelo
Imperador Augusto.
A prática dos recenseamentos tem sido continuada nos tempos modernos,
sendo que um dos exemplos no Brasil, é aquele realizado pela Fundação IBGE a
cada decênio. O Levantamento Agropecuário Catarinense1 realizado
recentemente é outro exemplo disso.
Dos recenseamentosos passou-se à tentativa de tirar conclusões a partir
dos dados numéricos, o que ocorreu na Inglaterra, somente no século XVII, e que

1
Consultar www.cepa.epagri.sc.gov.br
5

foi denominado de Aritmética Política, que evoluiu e deu origem ao que se chama
hoje de demografia.
Com o passar do tempo foram surgindo vários métodos estatísticos e sua
utilização foi sendo disseminada. A computação científica acelerou a
disseminação dos métodos estatísticos por facilitar sua aplicação pelos usuários
leigos e mesmo pelos conhecedores da estatística. Antes do computador era
possível estudar os métodos teoricamente, contudo, para sua aplicação na prática
se fazia necessário a simplificação dos cálculos. Hoje em dia, com a utilização da
informática é possível criar um método estatístico e usar o computador para
fazer as análises (cálculos), por mais complicadas que elas sejam.
Enfim o “desenvolvimento da estatística teve origem nas aplicações, pois
nenhuma disciplina tem interagido tanto com as demais disciplinas em suas
atividades do que ela, dado que é por sua natureza a ciência do significado e do
uso dos dados” (Memória, 2004, p.12).

1.3 USO DA ESTATÍSTICA EM DIFERENTES ÁREAS DE APLICAÇÃO

A estatística é usada em vários contextos, como em eleições para medir o


resultado das mesmas ou para prevê-los, no caso de pesquisa de opinião. É usada
também nos censos e acompanhamentos para resumir os resultados obtidos.
Contudo seu uso não se restringe a isso, ela é usada também para comparar
objetos quanto as suas características, ou ajustando modelos, permitindo, dessas
formas, tomadas de decisão a partir dos resultados obtidos.
Na atualidade, a estatística é usada como ferramenta de tomada de
decisão nas mais variadas áreas do conhecimento, desde a lingüística até a
biologia molecular ou outro ramo mais moderno da ciência. Por causa da sua
disseminação durante o final do século XX, é até difícil identificar os usos da
estatística e as áreas em que é aplicada.

1.4 ESTATÍSTICA DESCRITIVA E INFERÊNCIA ESTATÍSTICA

Estatística é a ciência dos dados, envolvendo o desenvolvimento de


processos, métodos e técnicas de coleta, classificação e organização, resumo,
análise e interpretação dos dados. Pode ser dividida em Estatística Descritiva e
Inferência Estatística.

i) Estatística descritiva: técnicas que dizem respeito à sintetização e à


descrição de dados numéricos (apresentação em forma de tabelas e gráficos).

ii) Inferência estatística: técnicas por meio das quais são tomadas
decisões sobre uma população estatística, baseando-se unicamente na observação
de uma amostra, ou seja, é o ato de generalizar resultados da parte (amostra)
para o todo (população). Devido ao fato de que tais decisões são tomadas em
condições de incerteza, requer-se na inferência estatística o uso da TEORIA
6

DAS PROBABILIDADES, que fornece bases para os métodos que usamos quando
fazemos generalizações com base em dados observados. A teoria das
probabilidades é o elo de ligação entre a estatística descritiva e inferência
estatística.

REFERÊNCIAS

CORDEIRO, G.M. Cronologia de Alguns Conceitos e Fatos Importantes da


Estatística. Disponível em <http:www.redeabe.org.br>. Acesso em 05 out 2005.
DEMÉTRIO, C.G.B. Modelos Lineares Generalizados em Experimentação
Agronômica. Piracicaba: ESALQ/USP, 2001.
FERREIRA, A.B.H. Novo Aurélio Século XXI: o dicionário da língua
portuguesa. 3.ª ed. Rio de Janeiro: Nova Fronteira, 1999.
MEMÓRIA, J.M.P. Breve história da estatística. Brasília: Embrapa Informação
Tecnológica, 2004. 111 p. (Texto para discussão, 21)
PIMENTEL-GOMES, F. Curso de Estatística Experimental. 14.ª ed. Piracicaba:
O autor, 2000. 477 p.
RODRIGUES, S.R. Dicionário Brasileiro de Estatística. 2.ª ed. Rio de Janeiro:
Fundação IBGE, 1970. 350 p.
VIEIRA, S. BIOESTATÍSTICA: TÓPICOS AVANÇADOS. 2.ª ED. RIO DE JANEIRO:
ELSEVIER, 2004. 216 P.
7

2 ESTATÍSTICA DESCRITIVA

2.1 ORGANIZAÇÃO E APRESENTAÇÃO DOS DADOS

Com o advento da informática, o mundo encheu-se de dados. As empresas


têm dados de suas atividades, de seus funcionários, de seus clientes etc. Mas
para que esses dados sejam informativos, necessitamos organizá-los, resumí-los
e apresentá-los de forma adequada. Este é o papel da estatística descritiva.
Na análise exploratória de dados, além de descrever os dados, buscamos
conhecer algumas características do processo ou fenômeno, com base nos dados.
Com o uso adequado de tabelas, gráficos e medidas, podemos descobrir certas
estruturas que não eram evidentes nos dados brutos. Hoje, também se usa a
expressão mineração de dados, que significa a busca por relacionamentos não
triviais, que podem estar escondidos em grandes massas de dados. Em geral,
numa mineração de dados, são aplicadas técnicas estatísticas e computacionais.

Algumas definições

Dados: “ matéria prima da estatística”. São obtidos da medição de determinada


característica ou propriedade do objeto, pessoa ou fenômeno. Esses itens
medidos são denominados variáveis.

Variável: características que podem ser observadas (ou medidas) em cada


elemento da população, sob as mesmas condições, podendo assumir valores
diferentes de indivíduo para indivíduo. Ex.: altura da planta, rendimento de grãos,
peso do animal, tempo de duração de uma lâmpada ...

De um modo geral, dividem-se as variáveis em dois grupos:

a) Variáveis Quantitativas: quando os possíveis resultados de uma variável são


números de uma certa escala (descrevem quantidades e podem ser comparadas a
conjuntos numéricos);

a.1) Variáveis Quantitativas Contínuas: usadas para descrever dados


contínuos, isto é, aqueles que podem, teoricamente, assumir qualquer valor de um
subconjunto dos números reais.
Exemplos: altura de inserção da primeira espiga de milho, rendimento de
grãos de feijão, ganho de peso diário de um suíno...

a.2) Variáveis Quantitativas Discretas: usadas para descrever dados


discretos, isto é, aqueles que assumem apenas determinados valores no campo
dos números reais. Geralmente envolvem problemas de contagem.
Exemplos: número de larvas de moscas por fruto, número de grãos por
espiga ...
8

b) Variáveis Qualitativas: quando os possíveis resultados são atributos


(descrevem qualidades, categorias), e uma medição numérica não é possível.

b.1) Variável Qualitativa Ordinal: quando houver um sentido de


ordenação em seus possíveis valores.
Exemplos: Conceitos atribuídos ao sabor de um alimento (ruim, bom e
ótimo); Classe de renda dos alunos do curso de Agronomia (baixa, média e alta).

b.2) Variável Qualitativa Nominal: quando não houver sentido de


ordenação em seus valores.
Exemplos: Sexo de um animal (M e F), Descendência Alemão, Italiano).

Descrição e Exploração de Dados:

Vamos considerar que os dados já foram efetivamente observados, sejam


de uma amostra ou de uma população de elementos. Temos como objetivo básico
introduzir técnicas que permitam organizar, resumir e apresentar estes dados,
de tal forma que possamos interpretá-los de acordo com os objetivos da
pesquisa. Um dos primeiros passos para analisar um arquivo de dados,
especialmente quando o número de observações for grande, é a distribuição de
freqüências de cada variável.
A distribuição de freqüências consiste na organização de dados de acordo
com as ocorrências dos diferentes resultados observados.
Por exemplo, ao observar a variável sexo, num conjunto de indivíduos,
estaremos classificando cada indivíduo ou na categoria masculino, ou na categoria
feminino. A contagem de quantos elementos existem em cada categoria forma
uma distribuição de freqüências dos dados dessa variável, que pode ser
apresentada numa tabela ou em um gráfico. As freqüências podem ser
apresentadas de forma absoluta (número de homens e número de mulheres) ou de
forma relativa (porcentagem de homens e porcentagem de mulheres) ou, ainda,
de ambas as formas. Normalmente, freqüências absolutas são preferidas quando
o número de observações é pequeno. Por outro lado, quando queremos fazer
comparações, como estudar as distribuições de homens e mulheres em duas
turmas, as freqüências relativas são mais informativas.
A seguir, será discutida a construção e a apresentação de distribuições de
freqüências para variáveis qualitativas e quantitativas, respectivamente.

2.2 DADOS QUALITATIVOS (OU DADOS CATEGORIZADOS)

Para construir uma tabela de distribuição de freqüências com dados de


uma variável qualitativa, basta contar a quantidade de resultados observados em
cada categoria.
9

Exemplos:

1) Ocorrência de variedades de laranjeiras em 80 propriedades rurais da região


oeste Catarinense.
PRODUTOR VARIEDADE PRODUTOR VARIEDADE PRODUTOR VARIEDADE PRODUTOR VARIEDADE
1 TOBIAS 21 VALÊNCIA 41 VALÊNCIA 61 F. MURCHA
2 VALÊNCIA 22 VALÊNCIA 42 VALÊNCIA 62 VALENCIA
3 RUBI 23 TOBIAS 43 VALÊNCIA 63 TOBIAS
4 F. MURCHA 24 RUBI 44 RUBI 64 VALÊNCIA
5 VALÊNCIA 25 VALÊNCIA 45 VALÊNCIA 65 VALENCIA
6 TOBIAS 26 VALÊNCIA 46 RUBI 66 F. MURCHA
7 VALÊNCIA 27 VALÊNCIA 47 VALÊNCIA 67 VALÊNCIA
8 VALÊNCIA 28 RUBI 48 VALÊNCIA 68 VALÊNCIA
9 HAMILIN 29 VALÊNCIA 49 RUBI 69 RUBI
10 VALÊNCIA 30 F. MURCHA 50 VALÊNCIA 70 VALENCIA
11 RUBI 31 VALÊNCIA 51 VALÊNCIA 71 F. MURCHA
12 HAMILIN 32 VALÊNCIA 52 RUBI 72 VALENCIA
13 VALÊNCIA 33 HAMILIN 53 RUBI 73 TOBIAS
14 VALÊNCIA 34 VALÊNCIA 54 VALÊNCIA 74 VALÊNCIA
15 RUBI 35 TOBIAS 55 RUBI 75 TOBIAS
16 VALÊNCIA 36 HAMILIN 56 VALÊNCIA 76 VALÊNCIA
17 VALÊNCIA 37 RUBI 57 VALÊNCIA 77 VALÊNCIA
18 RUBI 38 VALÊNCIA 58 TOBIAS 78 HAMILIN
19 VALÊNCIA 39 RUBI 59 VALÊNCIA 79 VALÊNCIA
20 RUBI 40 RUBI 60 VALÊNCIA 80 VALÊNCIA

a) Tabelas de freqüência

Para construir a distribuição de freqüências com os dados de uma variável


qualitativa, basta contar a quantidade de resultados observados em cada
categoria.

Tabela 1. Distribuição de Freqüências das variedades de laranjeiras em 80


propriedades da região Oeste Catarinense.
Variedades Freqüência Porcentagem

Total

A primeira coluna da Tabela mostra todas as categorias previamente


estabelecidas da variável ‘Variedades’. A segunda coluna resulta da contagem de
quantas observações se identificam em cada categoria: são as freqüências
observadas. Finalmente, a terceira coluna apresenta uma medida relativa da
freqüência de cada categoria.
10

2) Para adequar os produtos às preferências dos clientes, um projetista de


páginas da Internet pretende conhecer o perfil dos indivíduos que acessam um
de seus sites. Pensando nisso, ele fez uma pesquisa e levantou algumas
características dos visitantes do seu site, tais como sexo, a idade, o nível de
instrução e o provedor utilizado. Geralmente esse tipo de pesquisa envolve
centenas ou milhares de respondentes, mas aqui consideraremos apenas uma
amostra de 40 pessoas. Os resultados da pesquisa estão apresentados a seguir:
Indivíduo Provedor Indivíduo Provedor Indivíduo Provedor Indivíduo Provedor
1 C 11 C 21 B 31 A
2 A 12 A 22 A 32 A
3 B 13 B 23 A 33 B
4 B 14 D 24 B 34 C
5 C 15 A 25 A 35 B
6 B 16 B 26 A 36 D
7 D 17 B 27 B 37 B
8 B 18 C 28 D 38 B
9 B 19 D 29 D 39 B
10 A 20 B 30 C 40 C

Tabelas de freqüência

Para construir a distribuição de freqüências com os dados de uma variável


qualitativa, basta contar a quantidade de resultados observados em cada
categoria.

Tabela 1. Distribuição de Freqüências do provedor usado pelo visitante do site.


Provedor Freqüência Porcentagem

Total

A primeira coluna da Tabela mostra todas as categorias previamente


estabelecidas da variável provedor. A segunda coluna resulta da contagem de
quantas observações se identificam em cada categoria: são as freqüências
observadas. Finalmente, a terceira coluna apresenta uma medida relativa da
freqüência de cada categoria.
11

b) Representações gráficas

As representações gráficas fornecem, em geral, uma visualização mais


sugestiva do que as tabelas. Elas constituem-se numa forma alternativa de
apresentação de distribuições de freqüências. O gráfico de barras e o gráfico de
setores são particularmente importantes na representação de distribuições de
freqüências de dados categorizados.
Para representar graficamente a distribuição de freqüências, devemos
construir um par de eixos cartesianos. No eixo horizontal (abscissa) construímos
uma escala para representar os diferentes valores da variável em estudo,
enquanto que no eixo vertical (ordenada), representamos as freqüências de
ocorrência de cada valor. O eixo vertical (das freqüências) deve sempre iniciar
no zero e o eixo horizontal (dos valores da variável) pode iniciar próximo ao
menor valor da variável.
No gráfico de barras, cada categoria é representada por uma barra de
comprimento proporcional à sua freqüência, conforme identificação do eixo
horizontal. Opcionalmente, podem-se apresentar as categorias no eixo horizontal
e a freqüência no eixo vertical. É o chamado gráfico de colunas.

Para construir um gráfico de setores (pizza), basta fazer uma relação


entre um ângulo, em graus, e a freqüência observada em cada categoria. Sabe-se
que setor de circunferência é formado por um ângulo de 360º que equivale a
100% da área da circunferência. Assim, para obter o setor cuja área representa
uma determinada freqüência, basta resolver uma regra de três simples. Com a
ajuda de um transferidor, podemos construir o gráfico.
12

2.3 DADOS QUANTITATIVOS

a) Variáveis Discretas

A construção de distribuições de freqüências de dados resultantes de


variáveis discretas pode ser feita de forma análoga à distribuição de freqüências
de dados categorizados.

Exemplo: Número de partos das 64 vacas em período de lactação na Fazenda do


Senhor Fandrigo no dia 12/02/2007:

3 4 2 1 7 6 2 3 3 1 1 2 4 5 4 3
5 3 2 1 3 3 1 4 3 2 1 6 2 2 4 2
5 1 2 1 2 2 3 2 3 1 5 5 5 2 2 1
4 3 2 1 1 2 3 3 2 1 2 2 1 3 2 4

A tabela com a distribuição de freqüências é construída através da


contagem das repetições de cada resultado (ou valor) observado.

Tabela 2. Distribuição de Freqüências do número de partos das 64 vacas em


período de lactação na Fazenda do Senhor Fandrigo no dia 12/02/2007.
Freqüência de Porcentagem de
Número de Partos
Vacas Vacas

O gráfico pode ser elaborado traçando-se riscos verticais sobre os valores


efetivamente observados (a altura deve ser proporcional à freqüência observada)
ou substituindo os riscos por retângulos com mesma largura e justapostos.
13

Normalmente, três informações principais são procuradas quando estamos


explorando uma variável quantitativa:

i) faixa em que os valores ocorrem com maior freqüência (faixa de valores


típicos);

ii) valores discrepantes, que podem ter sido originados de erros de mensuração
ou digitação, mas também podem corresponder a elementos que apresentam
comportamento muito diferente dos demais;

iii) forma da distribuição, a fim de compará-la com modelos probabilísticos, o que


nos permite usar técnicas mais avançadas de análise.

b) Variáveis Contínuas

Para as variáveis contínuas não faz muito sentido contar as repetições de


cada valor, pois, considerando que dificilmente os valores se repetem, não
chegaríamos a um resumo apropriado dos dados observados.
Podemos construir distribuições de freqüências agrupando resultados em
classes pré-estabelecidas. As classes são pequenos intervalos mutuamente
exclusivos, tais que, quando reunidos, abrangem todo o conjunto de dados. As
classes devem ser construídas de tal forma que todo valor observado pertença a
uma e apenas uma classe. Por simplicidade e para facilitar a interpretação,
consideraremos todas as classes com a mesma amplitude.
Para construção de uma distribuição em classes de freqüências, são
necessárias algumas observações:

i) Rol: é toda seqüência de dados numéricos colocados em ordem crescente ou


decrescente. Ex.: 6; 5; 10; 8; 9; 6; 7; 4; 10; 7. Apresentando em rol:

ii) Classes: qualquer intervalo que contenha um rol da amostra.

[4, 5[ ou 4|--- 5
[5, 8[ ou 5|--- 8
[8, 10[ ou 8|--- 10

iii) A diferença entre o maior e o menor elemento de uma classe, nessa ordem, é
chamada de amplitude de classe. Ex.: amplitude da classe [5, 8[ é 8–5 = 3.

iv) Os extremos de cada classe não precisam ser elementos da amostra, mas se o
forem, um mesmo elemento não pode pertencer a duas classes simultaneamente;
14

Deste modo surge a necessidade de definir a natureza do intervalo de


classe, se é aberto ou fechado. Quando o intervalo de classe é aberto, os limites
da classe não pertencem a ela, e quando o intervalo é fechado, os limites de
classe pertencem à classe em questão.
Notação:
- Intervalos abertos: ]12 – 14[;
- Intervalos fechados: [12 – 14] ou (12-14);
- Intervalos mistos - são fechados em um extremo e abertos no outro:
[12 – 14[
Para este tipo de intervalo pode-se utilizar ainda a seguinte notação:
12|-- 14.

v) É conveniente que, dentre duas classes consecutivas, o extremo à direita


(aberto) da primeira coincida com o extremo à esquerda (fechado) da segunda;

Exemplos:

1) Teores de P (mg/dm3) de 45 amostras de solo de uma propriedade em


Canoinhas, SC.
8,2 7,1 6,2 5,5 7,2
10,0 7,4 6,6 9,5 6,6
9,1 9,4 14,5 10,8 10,8
7,6 6,2 6,2 5,6 8,0
11,0 6,6 5,6 7,3 5,3
7,3 7,9 13,6 8,7 9,9
7,0 5,5 5,5 5,6 8,5
8,7 6,3 6,4 8,9 4,3
7,7 8,1 13,0 9,6 10,5

2) Os dados a seguir representam o tempo (em segundos) para carga de um


aplicativo, num sistema compartilhado (50 observações):
5,2 8,4 8,2 5,7 5,4 4,8 6,2 6,9 4,9 8,2
5,1 5,0 5,0 7,0 5,4 5,7 7,3 6,2 6,7 4,7
4,9 4,9 8,3 7,3 5,6 6,8 5,5 5,0 6,0 6,3
5,3 5,7 8,9 5,4 6,0 9,1 6,8 5,1 5,9 7,1
6,4 6,2 9,9 6,3 4,8 5,6 4,9 6,5 5,7 14,1

Passos para a construção de uma tabela de dados agrupados em classes de


freqüências:
15

1º) Organize um rol;

2º) Escolha o número k de classes. A escolha do número de classes é arbitraria,


existindo, no entanto, regras que podem ser utilizadas:

- k = n ou
- Fórmula de Sturges: k = 1+ 3,32 log 10 n (n é o número de observações)

3º) Amplitude total (A):

Maior valor -> Xmáx=


Menor valor -> Xmín=
Amplitude Total = A = Xmáx - Xmín =

4º) Amplitude das classes (h):

A
h=
k −1

Conhecida a amplitude de classes, determina-se então os intervalos de


classe. Os limites inferior (Linf) e superior (Lsup) das classes devem ser escolhidos
de modo que o menor valor observado esteja localizado no ponto médio (PM) da
primeira classe:

Linf + Lsup
PM =
2

Assim, o limite inferior da primeira classe será:

h
Linf = menor valor − .
2

Os demais limites são obtidos somando-se h ao limite anterior.

5º) Construção da tabela:


16

Tabela 3. Distribuição de freqüências da variável teor de P (mg/dm3) para um


determinado solo.
Número de Porcentagem
Ponto Porcentagem
Classes de observações observações
Médio acumulada (Fa)
P (n) (Fr)

Total
Fr: freqüência relativa da classe = obtém-se dividindo a freqüência F de uma classe pela
freqüência total. É usual apresentar-se em porcentagem; Fa: freqüência acumulada.
Representação gráfica:

a) Histogramas

A representação gráfica dos dados agrupados em uma tabela de classes de


freqüências é feita por meio de um histograma. É a forma mais usual de
apresentação de distribuição de freqüências de variáveis contínuas. Os
histogramas são constituídos por um conjunto de retângulos com as bases
assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto médio da
classe que representa, e cuja altura é proporcional a freqüência da classe. Se as
amplitudes de classe forem todas iguais, as alturas serão numericamente iguais
às freqüências das classes. Porém, se os intervalos de classe não tiverem todos a
mesma amplitude, as alturas dos retângulos deverão ser convenientemente
ajustadas, afim de que as áreas dos mesmos sejam proporcionais às freqüências
das classes.

i) Separam-se os elementos da amostra em classes de mesma amplitude e


representam-se essas classes no eixo das abscissas;
ii) Constroem-se os retângulos cujas bases coincidem com as classes; a
altura de cada retângulo representa a freqüência da classe correspondente.

Construir um histograma com os dados da Tabela 3.

b) Polígonos de freqüência

Polígono de freqüência é um gráfico de análise no qual as freqüências das


classes são localizadas sobre perpendiculares levantadas nos ponto médio das
classes. Pode ser obtido pela simples união dos pontos médios dos topos dos
retângulos de um histograma. Completa-se o polígono unindo-se as extremidades
da linha que une os pontos representativos das freqüências de classe aos pontos
17

médios das classes imediatamente anterior e posterior as classes extremas, que


têm freqüência nula.

c) Ogivas

Ogiva é o nome dado a um polígono de freqüências acumuladas, nas quais as


freqüências acumuladas são localizadas sobre perpendiculares levantadas nos
limites inferiores ou superiores das classes, dependendo se a ogiva representar
as freqüências acumuladas abaixo ou acima, respectivamente.
18

EXERCÍCIOS

1) Os dados abaixo representam 50 leituras de temperatura (ºC) de um pasteurizador de leite:

74,8 74,0 74,7 74,4 75,9 76,8 74,3 74,9 77,0 75,1
73,8 74,4 74,8 76,8 73,6 72,9 72,9 74,6 75,0 75,1
75,3 73,4 74,7 73,4 74,2 74,9 74,5 77,1 74,6 74,8
76,4 73,2 76,5 75,6 73,5 76,2 74,7 76,0 75,8 77,3
76,3 74,1 75,0 76,0 74,7 75,2 77,5 74,7 73,3 74,3

a) construa uma tabela de classes de freqüências;


b) apresente a distribuição em um histograma;
c) faça um gráfico da distribuição acumulada. Indique no gráfico a porcentagem aproximada de
observações abaixo de 75ºC;

2) Foram anotados os tempos decorridos entre a incidência de uma certa doença e sua cura, em
50 pacientes. Estes tempos são os seguintes, em horas:

21 44 114 323 99 90 20 66 39 16
47 96 27 74 82 92 69 43 33 12
41 84 127 61 35 74 02 83 03 13
41 10 02 24 80 87 40 14 82 58
16 35 24 120 67 37 126 31 56 04

Construa um histograma e comente sobre alguns aspectos relevantes desta distribuição.

3) A tabela seguinte apresenta os salários (R$) dos funcionários de duas empresas.

Empresa A Empresa B
400 1200 300 280 700 190 230 840 120 620 355
350 620 340 620 550 2100 380 190 230 160 720
480 720 310 620 1700 3200 1100 230 310 990 580
1800 1320 920 780 1100 510 160 110 630 340 350
720 830 400 2900 830 320 3500 190 230 420
130 190 980 320 1540 920 420 210 290 380
420 380 590 1320 2720 3000 520 200 330 240

Faça uma descrição comparativa usando gráficos apropriados.

4) Na tabela a seguir constam os pesos médios de frutos em cinco variedades de macieira (Malus
doméstica) em um experimento em blocos ao acaso com quatro repetições.

BLOCOS
Cultivar
I II III IV
---------------------- g ----------------------
Gala 142 144 145 139
Golden 139 138 144 131
Fuji 140 134 136 144
Catarina 151 136 137 136
Joaquina 153 155 152 150

Faça uma descrição comparativa das cultivares usando um gráfico apropriado.


19

5) Na tabela a seguir constam os números de insetos (Parastenopa sp) por planta, coletados
mensalmente em um erval do município de Chapecó, SC.

Tabela 1 - Número de Parastenopa sp por planta de Erva-mate.


Paras- Paras- Paras-
Ano Mês tenopas Ano Mês tenopas Ano Mês tenopas
2003 Julho 4 2004 Julho 3 2005 Julho 2
2003 Agosto 3 2004 Agosto 0 2005 Agosto 0
2003 Setembro 1 2004 Setembro 0 2005 Setembro 0
2003 Outubro 0 2004 Outubro 0 2005 Outubro 4
2003 Novembro 12 2004 Novembro 4 2005 Novembro 12
2003 Dezembro 1 2004 Dezembro 1 2005 Dezembro 6
2004 Janeiro 8 2005 Janeiro 4 2006 Janeiro 16
2004 Fevereiro 20 2005 Fevereiro 7 2006 Fevereiro 2
2004 Março 15 2005 Março 3 2006 Março 8
2004 Abril 26 2005 Abril 5 2006 Abril 0
2004 Maio 4 2005 Maio 1 2006 Maio 0
2004 Junho 3 2005 Junho 2 2006 Junho 1

Elabore uma tabela e um gráfico apropriados.

6) Faça uma descrição comparativa entre as cultivares de aveia dadas na tabela a seguir usando
gráficos apropriados.

Produções totais de aveias forrageiras obtidas em Chapecó, SC. Ano 2004.


Repetições
CULTIVARES 1 2 3 4
IAPAR 61 (T) 4.102 3.821 4.803 4.171
PRETA REGIONAL 2.553 3.290 3.019 3.758
SI 0061 USA 4.316 4.069 4.735 4.003
FAPA 2 (T) 2.924 3.689 3.555 4.129
CFT 99415 3.334 4.670 4.801 4.852
ER 96148-1 2.831 2.936 3.874 3.395
SI 98105-b 4.380 5.075 3.855 3.784
CEPAA 013 5.194 5.590 4.675 5.326
CEPAA 014 5.771 6.082 5.920 5.633

7) Faça uma descrição comparativa do Teor de Argila (%) entre as três profundidades
apresentadas na tabela a seguir usando gráficos apropriados.

Camadas
0-2,5 cm 2,5-5,0 cm 5,0-10,0 cm
------------------------- % -------------------------
40 41 41 41 41 41 44 43 45
41 45 45 42 45 45 43 46 49
46 45 41 43 43 41 46 46 41
42 41 45 39 41 45 39 40 45
40 45 42 40 49 44 42 49 41
20

8) Apresente em um gráfico os resultados da Tabela 1:

Tabela 1 – Produção de grãos de milho com utilização de diferentes sistemas de preparo do solo e
fontes de adubo. Chapecó, SC.

Manejo do Solo
Fonte de Nitrogênio Preparo Convencional Plantio Direto
-1
------------------ kg ha ------------------
Nitrato de Amônio 8288 Aa 8618 Aa
Esterco de Suínos 8212 Aa 8762 Aa
Esterco de Aves 7850 Aa 7044 Bb
Testemunha 5395 Ba 5428 Ca
Médias seguidas de letras diferentes maiúsculas (na coluna) e minúsculas (na linha) têm mais de 95% de probabilidade de
serem diferentes pelo teste de Tukey.

9) Apresente os dados da tabela a seguir na forma de um gráfico. Use o computador.

Precipitação total mensal e anual (mm) observada na Estação Meteorológica do Centro de


Pesquisa para Agricultura Familiar (Cepaf).
1987 1988 1989 1990 1991 1992 1993 1994 1995 1996
Janeiro 222,9 249,4 245,2 239,1 235,4 150,2 263,2 130,2 261,4 313,8
Fevereiro 166,5 223,9 162,1 171,7 87,6 485,2 275,3 439,2 157,8 227,6
Março 38,0 106,4 138,2 168,8 52,1 261,4 96,9 105,7 151,3 191,2
Abril 239,0 256,9 184,0 413,6 163,9 167,2 57,6 236,5 134,2 67,0
Maio 289,5 283,1 93,7 331,1 63,9 482,9 213,0 270,9 42,8 62,5
Junho 156,3 102,6 104,4 339,9 345,8 152,2 134,7 212,9 186,1 227,5
Julho 156,9 30,4 119,0 115,1 126,9 292,0 179,6 351,7 97,5 130,4
Agosto 111,6 21,4 206,9 173,6 102,4 163,0 52,7 35,0 99,9 281,5
Setembro 41,9 66,4 297,2 329,7 75,1 174,2 286,2 153,2 250,3 221,4
Outubro 295,3 158,0 204,4 334,2 167,6 206,9 233,1 320,6 264,1 330,3
Novembro 144,9 128,2 125,7 249,8 91,6 254,4 163,9 236,8 59,6 146,6
Dezembro 223,5 79,8 91,1 152,4 406,5 117,6 167,6 94,4 142,3 244,9
21

3 DESCRIÇÃO PARAMÉTRICA

3.1 PARÂMETROS QUE DESCREVEM A POSIÇÃO OU TENDÊNCIA CENTRAL

Após a descrição dos dados por meio de tabelas e gráficos, apresenta-se


uma descrição mais condensada. A descrição dos dados será feita usando
medidas de certas características populacionais conhecidas como parâmetros ou
de avaliações amostrais dessas características, conhecidas como estimativas dos
parâmetros.

3.1.1 Média

a) Dados não agrupados

Seja (x1, x2, ..., xn) uma amostra de n observações de certa variável. A
média aritmética dessas observações é definida por:

x + x 2 + x3 + ... + x n ∑x i
x= 1 = i =1

n n

Exemplo:

Notas finais relativas aos alunos de três turmas.


Média da
Turma Notas dos alunos
Turma
A 4 5 5 6 7 7 8
B 1 2 4 6 9 10 10
C 0 6 7 7 7,5 7,5

b) Dados agrupados em tabelas de freqüências (variáveis discretas)

Nesse caso tem-se a média aritmética ponderada dos números x1, x2, x3, ...,
xn com pesos f1, f2, f3, ..., fn:

n n

x . f + x 2 . f 2 + x3 . f 3 + ... + x n . f n ∑ xi . f i ∑ x .f i i
x= 1 1 = i =1
= i =1

f 1 + f 2 + f 3 + ... + f n n

∑f
n
i
i =1
22

Exemplo:

Notas dos alunos da turma A


Nota (xj) Freqüência (fj) xj.fj

TOTAL

c) Dados agrupados em tabelas de classes de freqüências (variáveis


contínuas)

∑m k . fk
x= i =1

n
* mk: ponto médio da classe k.

Exemplo:

Distribuição de freqüências da variável diâmetro médio, em cm, de Pinus elliotti


com 14 anos.
Diâmetro médio Nº de Árvores (fk) mk mk.fk
(cm)
13,7 |--- 14,9 4
14,9 |--- 16,2 1
16,2 |--- 17,4 5
17,4 |--- 18,6 9
18,6 |--- 19,9 2
19,9 |--- 21,1 4
TOTAL

FATOS: A média definida em (a) é definida como média aritmética e em


(b) e (c) média aritmética ponderada.

Propriedades da média

Como o cálculo da média utiliza todos os dados, estaremos “errando” em


relação a muitos deles. Considere 5 alturas em cm: 148, 153, 158, 169, 178

Então x =
23

Os erros ou desvios da altura média até a altura de cada aluno é:

ê1 = x1 − x =
ê2 = x2 − x =
ê3 = x3 − x =
ê4 = x4 − x =
ê5 = x5 − x =

* Usa-se ê pois é uma estimativa;


* Embora os erros pareçam “grandes”, nenhum outro valor tomado como
referencial para um conjunto de dados leva a um “erro total” tão pequeno quanto
a média.

Teorema: A soma dos erros em relação à média amostral é zero:

n n n

∑ êi = 0 ;
i =1
∑ êi . fi = 0 ;
i =1
∑ ê
i =1
k . fk = 0 .

Exemplo: Mostrar o Teorema 1 usando os dados das Tabelas 1, 2, 3.

Apesar da média apresentar excelentes propriedades, em certos casos ela


pode não ser o parâmetro mais adequado para descrever o conjunto dos dados.
Isto pode ocorrer, entre outros casos, quando existem dados aberrantes,
extremos ou discrepantes.

Exemplo: Salários de 10 empregados da empresa “ESTATÍSTICA” (em salários


mínimos).

1,2 1,2 1,3 1,5 1,7


1,8 1,9 2,1 2,3 12,0

Calculando a média com todos os salários:

Calculando a média sem o salário mais discrepante tem-se uma média mais
realista:

Isto ocorre porque a média é extremamente influenciável por valores


aberrantes. Outros parâmetros de posição como a mediana e a moda não sofrem
tal influência.
24

3.1.2 Mediana – md

A mediana avalia o centro de um conjunto de valores, sob o critério de ser


o valor que divide a distribuição ao meio, deixando os 50% menores valores de um
lado e os 50% maiores valores do outro lado. Por exemplo, o conjunto de valores
{3, 3, 4, 5, 8} tem como mediana o valor 4, pois a quantidade de valores menores
que 4 é igual a 2, a mesma quantidade de valores superiores a 4.

a) Dados não agrupados:

n +1
a.1) Rol Impar: a mediana é igual ao valor numérico do elemento
2

Exemplo: 1,2 1,2 1,3 1,5 1,7 1,8 1,9 2,1 2,3

n +1
n=9 ⇒
2

n
a.2) Rol Par: a mediana é igual à média dos valores numéricos dos elementos e
2
n
+1
2

Exemplo: 1,2 1,2 1,3 1,5 1,8 1,9 1,9 2,1 2,3 2,5

n
n = 10 ⇒ =
2

n
+1 =
2

md = =

b) Dados dispostos numa tabela de freqüências:

A identificação da mediana é feita por meio da freqüência acumulada. O


critério é o mesmo do caso anterior.
25

Exemplo:

Notas dos alunos da turma A.


Nota (xj) Freqüência (fj) Fac

TOTAL

Como o rol é par, sua mediana é a média dos valores numéricos dos
n n
elementos = 15 e + 1 = 16 .
2 2

c) Dados agrupados em tabelas de classes de freqüências:

Neste caso o estimador assume a forma

n 
 − Fant 
md = l md + 2 .a md
 f md 
 
 

em que:

lmd: limite inferior da classe mediana;


Fant: freqüência acumulada direta da classe anterior à classe mediana;
fmd: freqüência absoluta simples da classe mediana;
amd: amplitude da classe mediana;

Notas de 200 alunos


xk fk Fac
0 |--- 2 28
2 |--- 4 40
4 |--- 6 50
6 |--- 8 65
8 |--- 10 17
TOTAL

Como o rol é par, sua mediana é a média dos valores numéricos dos
n n
elementos e + 1.
2 2
26

3.1.3 Quartis e extremos

Na maioria dos casos práticos, o pesquisador tem interesse em conhecer


outros aspectos relativos ao conjunto de valores, além de um valor central, ou
valor típico. Algumas informações relevantes podem ser obtidas através dos
quartis, como veremos a seguir. Os quartis são valores que dividem uma série
ordenada de dados (ROL) em quatro grupos, cada um reunindo 25% das
observações. O primeiro quartil (Q1) é o valor abaixo do qual estão os 25%
menores valores; O segundo quartil (Q2) é a própria mediana, que separa os 50%
menores dos 50% maiores valores. O terceiro quartil (Q3) é o valor abaixo do
qual estão 75% dos valores da série. A amplitude ou desvio entre quartis é a
diferença Q3 - Q1 . Note que entre Q1 e Q3 estão os 50% valores mais centrais.
Com os dados ordenados crescentemente, temos:

n +1 n +1 3( n + 1 )
posição de Q1: posição de Q2: posição de Q3:
4 2 4

Exemplo:

Observações: 15, 18, 5, 7, 9, 11, 3, 5, 6, 8, 12.

n +1
posição de Q1: =
4

n +1
posição de Q2: =
2

3( n + 1 )
posição de Q3: =
4
27

3.1.4 Moda - Mo

Dada uma variável X (xi, i=1, 2, ..., n), define-se moda de X (Mo) como o
valor que ocorre com maior freqüência. Para um conjunto de dados a moda pode
não ser única, bem como pode não existir.

a) Dados não agrupados: a moda é obtida por simples contagem

Exemplos:
155 161 163 163 168 168 168 169 172 è Mo =
Marcas de calças: Z D Z F F Z D E E Z Z Z Z D L L F E è Mo =

b) Dados estão dispostos numa tabela de freqüências: basta tomar o elemento


associado à maior freqüência.

Exemplo:
xj fj
0 2
1 5
2 15
3 8
TOTAL
Mo = , pois tem maior freqüência.

c) Dados agrupados em tabelas de classes de freqüências:

 ∆1 
Mo = l Mo +  .a Mo
 ∆1 + ∆ 2 
em que:
lMo: limite inferior da classe modal;
∆ 1 : fMo – fAnt; fAnt: freqüência absoluta simples da classe anterior à classe modal;
∆ 2 : fMo – fPost; fPost: freqüência absoluta simples da classe posterior à classe
modal;
fMo: freqüência da classe modal;
aMo: amplitude da classe modal;

xk fk
0 |--- 2 28
2 |--- 4 40
4 |--- 6 50
6 |--- 8 65
8 |--- 10 17
TOTAL
28

3.2 PARÂMETROS QUE DESCREVEM A DISPERSÃO OU A VARIABILIDADE

Para melhorar o resumo dos dados, podemos apresentar, ao lado da média


aritmética, uma medida de dispersão desses dados. As medidas de dispersão são
estatísticas descritivas que visam fornecer o grau de variabilidade das
observações em relação a um valor central (geralmente a média aritmética).

Suponhamos o seguinte exemplo:

Para preencher uma vaga na empresa “ESTATÍSTICA”, três candidatos


foram submetidos a seis provas sobre conhecimentos de interesse da empresa.

Distribuição das notas de três candidatos na empresa “ESTATÍSTICA”.


PROVAS
CANDIDATOS
1 2 3 4 5 6
A 6,5 7,5 8,0 8,0 8,5 9,5
B 6,0 7,0 8,0 8,0 9,0 10,0
C 7,5 8,0 8,0 8,0 8,0 8,5

Que candidato escolher?

Calcule a média, a mediana e a moda das notas de cada um dos candidatos e


observe se algum desses parâmetros pode ser utilizado na escolha do candidato.

CANDIDATOS MÉDIA MEDIANA MODA

Essa situação pode evidenciar o fato de que as medidas de tendência


central nem sempre são suficientes para descrever plenamente um conjunto de
dados.
Suponha como critério de desempate, escolher o candidato que apresentou
notas mais homogêneas, isto é, aquele que apresentou menor dispersão em suas
notas. Nesse caso, a fim de quantificar tal característica, vamos definir algumas
medidas de dispersão.
29

3.2.1 Amplitude Total - A

Amplitude de um conjunto de dados é a diferença entre o maior e o menor


valor observado. Calculando-se a amplitude total das notas dos candidatos à
empresa “ESTATÍSTICA”:

A(A) = Xmáx(A) – Xmín(A) =


A(B) = Xmáx(B) - Xmín(B) =
A(C) = Xmáx(C) - Xmín(C) =

PROBLEMA: A amplitude considera somente os valores extremos do conjunto de


dados e, assim, seria mais conveniente considerarmos uma medida que utilizasse
todas as observações.

3.2.2 Variância

Dada uma variável X: xi, i = 1, ..., n, define-se a sua Variância como a média
aritmética dos quadrados dos erros dos elementos da amostra em relação à
média.

a) Dados não agrupados:

n n   n  
2


2
eˆi ∑ ( xi − x )
2
  ∑ xi  
1  n 2  i =1  
s =
2 i =1

n −1
= i =1

n −1
ou s =
2
∑ xi − n 
n − 1  i =1
 
 

Exemplos:

i) Variância das notas.


CANDIDATOS
A B C
( x1 − x ) 2

( x2 − x ) 2
( x3 − x )2
( x4 − x ) 2
( x5 − x ) 2
( x6 − x )2
s2 = s2 = s2 =

E então, qual candidato deve ser escolhido?


30

ii) Rendimento familiar mensal, em salários mínimos, de 40 famílias.


2,5 1,0 1,0 2,1 10,7 3,7 1,6 0,1 0,3 0,7
0,4 3,5 11,1 2,5 0,2 5,1 3,1 5,6 2,7 4,3
5,7 0,1 1,0 1,1 4,3 6,3 1,4 8,2 1,9 1,4
0,4 1,6 2,4 1,1 2,9 1,7 2,1 0,9 0,6 2,1
Fonte: Dados fictícios.

b) Dados agrupados em tabelas de freqüência:

v v   v  
2

∑ eˆ
2
fj ∑ (x − x )2 . f j  ∑ x j f j  
j j
   
 j =1 
v
1
ou s 2 = ∑ j j
j =1 j =1
s2 = = −
2
x f 
n −1 n −1 n − 1  j =1 n 
 
 

Exemplos:

i) Variância dos dados de sementes germinadas por vaso.


xj fj (x j − x)2 eˆ j
2
eˆ j . f j
2

0 12
5 30
7 18
8 7
10 12
TOTAL
s2 =

ii) Número de Diatrea saccharalis por colmo de cana-de-açúcar.


Insetos por Nº de colmos
colmo observados
xi fi
3 20
4 50
5 30
Total 100
Fonte: Dados fictícios.
31

c) Dados agrupados em tabelas de classes de freqüência:

c c   c  
2

∑ eˆ k
2
fk ∑ (m k − x) . fk
2
  ∑ mk f k  
∑ mk f k −  k =1 n  
1 c
s = k =1
= k =1
ou s =
2 2 2

n −1 n −1 n − 1  k =1
 
 

Exemplos:

i) Desvio médio dos dados de ganho de peso (em Kg).


xk fk mk mk . f k ( mk − x ) 2 eˆk . f k
2

10 |--- 15 2
15 |--- 20 8
20 |--- 25 10
25 |--- 30 5
TOTAL

ii) Consumo de matéria seca por novilhos (Kg).


Consumo(Kg) Nº de Novilhos
xi fi
10,0 |--- 10,4 10
10,4 |--- 10,8 30
10,8 |--- 11,2 30
11,2 |--- 11,6 20
Total 90
Fonte: Dados fictícios.

3.2.3 Desvio Padrão

Como a variância de um conjunto de dados é calculada em função dos


desvios quadráticos, sua unidade de medida equivale à unidade de medida dos
dados ao quadrado. Nesse contexto, é mais comum trabalhar com a raiz quadrada
positiva da variância. Essa medida é conhecida como desvio padrão, o qual é
expresso na mesma unidade dos dados em análise.

s = s2

Tanto a variância quanto o desvio padrão são medidas que fornecem


informações complementares à informação contida na média aritmética. Estas
medidas avaliam a dispersão do conjunto de valores em análise.
Ao compararmos os desvios padrão de vários conjuntos de dados, podemos
avaliar quais se distribuem de forma mais (ou menos) dispersa. O desvio padrão
32

será sempre positivo e será tão maior quanto mais dispersos forem os valores
observados. A Tabela a seguir mostra o desvio padrão das notas de cada uma das
três turmas de alunos (A, B e C).

Notas finais de três turmas de estudantes e as medidas descritivas dessas


notas.
Nº de
TURMA Notas Média Desvio Padrão
Alunos
A 4 5 5 6 6 7 7 8 8 6,0 1,31
B 1 2 4 6 6 9 10 10 8 6,0 3,51
C 0 6 7 7 7 7,5 7,5 7 6,0 2,69

Analisando a Tabela, verificamos através das médias, que os alunos


tenderam a ter as notas em torno de seis, mas, pelos desvios padrão, concluímos
que os alunos da Turma A obtiveram notas relativamente próximas uma das
outras, quando comparados aos alunos das outras turmas. Por outro lado, as notas
dos alunos da Turma B foram as que se apresentaram de forma mais
heterogênea.

3.2.4 Coeficiente de variação – C.V.

O C.V. é uma medida de variabilidade relativa. É utilizado para a


comparação da precisão de um experimento.

s2 s
CV (%) = 100. = 100. 
x x

Para análise e interpretação do resultado obtido no coeficiente de


variação, podemos utilizar as seguintes regras práticas:

a) se o resultado do C.V. for menor que 10%, significa que há pouca variabilidade
na distribuição, ou seja, todos os valores da variável estão bem próximos do valor
da média.

b) se o C.V. estiver entre 10% e 30%, significa que há variabilidade pouco


expressiva, ou seja, indica uma distribuição regular da variável.

c) se o C.V. for maior que 30%, existe uma grande variabilidade na distribuição,
ou seja, os resultados estão distantes da média.
33

3.2.5 Erro padrão da média

É uma medida que fornece uma idéia da precisão com que a média foi
estimada.

s
sx =
n

em que s é o desvio padrão e n o número de observações que a média foi


calculada.

Notas finais de três turmas de estudantes e as medidas descritivas dessas


notas.
Nº de Desvio Erro
TURMA Notas Média
Alunos Padrão Padrão
A 4 5 5 6 6 7 7 8 8 6,0 1,31
B 1 2 4 6 6 9 10 10 8 6,0 3,51
C 0 6 7 7 7 7,5 7,5 7 6,0 2,69
34

EXERCÍCIOS

1) Vinte e cinco residências foram sorteadas e visitadas por um entrevistador que


perguntou sobre o número de televisores. Determine as diversas medidas de posição e
interprete os resultados: 2,2,2,3,1,2,1,1,1,1,0,1,2,3,2,2,3,1,1,3,1,2,1,0,2.

2) Num experimento, 16 coelhos foram alimentados com uma nova ração e seu peso
avaliado ao fim de um mês. Os dados referentes ao ganho de peso (em Kg) foram os
seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5; 2,2; 4,4
a) Utilizando os dados brutos, determine a média, a moda e mediana desse conjunto;
b) Organize uma tabela de classes freqüências com faixas de amplitude 0,2 a partir de
1,5 e calcule a média, a moda e a mediana.
c) Elimine a observação 4,4 e calcule novamente a média, a mediana e a moda. Comente
as diferenças em relação ao item a.

3) Calcule a média, a mediana e a moda dos dados da Tabela 1:

Tabela 1. Salários mensais de 100 operários.


Salário Mensal Nº de operários Ponto Médio (m) fi.m
(R$) (fi)
240 |---- 259 7
259 |---- 278 20
278 |---- 297 33
297 |---- 316 25
316 |---- 335 11
335 |---- 354 4
100
Fonte: Dados fictícios.

4) Foram feitas medidas em operários da construção civil a respeito da taxa de


hemoglobina no sangue (g/cm3):

11,1 12,2 11,7 12,5 13,9 12,3 14,4 13,6 12,7 12,6
11,3 11,7 12,6 13,4 15,2 13,2 13,0 16,9 15,8 14,7
13,5 12,7 12,3 13,5 15,4 16,3 15,2 12,3 13,7 14,1

Calcule a média, a mediana e a moda: a) Com os dados brutos; b) Com os dados


agrupados em uma tabela de classes de freqüência, com classes de amplitude 1 a partir
do 11.

5) O valor médio de comercialização da saca de milho de 60Kg na bolsa de cereais é


apresentado abaixo, em reais, para os últimos 40 meses:
6,1 6,2 6,7 6,5 6,9 6,3 7,4 7,6 7,7 7,6
7,3 7,7 7,6 7,4 7,2 7,2 7,3 7,6 7,5 7,4
7,5 7,7 8,2 8,3 8,1 8,1 8,1 7,9 7,8 7,4
7,5 7,6 7,5 7,6 7,4 7,3 7,4 7,5 7,5 7,4
35

Calcule a média, a mediana e a moda: a) Com os dados brutos; b) Com os dados


agrupados em uma tabela de classes de freqüência, com classes de amplitude 0,4 a
partir do 6.

6) As notas finais de estatística para alunos do curso de Tecnologia em Informática


foram as seguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5, 6, 4, 6, 6, 3, 8, 4, 5, 4, 5, 5, 7, 5, 4,
5, 6, 3, 8, 4, 5 e 6.

a) Determine a média e a mediana.


b) Separe o conjunto de dados em dois grupos denominados aprovados, com nota pelo
menos igual a 5, e reprovados para os demais. Compare a variância desses dois grupos.

7) O departamento de atendimento ao consumidor de uma concessionária de veículos


recebe, via telefone, as reclamações dos clientes. O número de chamadas nos últimos 30
dias foram anotados e os resultados foram: 3, 4, 5, 4, 4, 5, 6, 9, 4, 4, 5, 6, 4, 4, 3, 6, 7,
4, 4, 5, 7, 8, 8, 5, 7, 5, 4, 5, 7 e 6.

a) Construa uma tabela de freqüências;


b) Calcule a média e o desvio padrão.
c) Admitindo que cada telefonema acarreta serviços sob a garantia avaliados em R$
50,00 por chamada, calcule a média das despesas oriundas do atendimento ao
consumidor.

Para cada conjunto de dados a seguir, calcule a média, a variância, o desvio padrão
e o coeficiente de variação. Com base nessas medidas, comente as principais diferenças
entre os conjuntos de valores de cada tabela.

8) Os dados a seguir são leituras da pressão do homogeneizador de um laticínio.

Leite tipo C Leite UHT


3,0 3,1 3,0 3,0 3,0 2,9 3,0 2,2 2,2 2,3 2,2 2,2 2,2 2,2
3,1 2,9 3,0 3,0 3,0 3,0 3,0 2,2 2,4 2,6 2,6 2,4 2,2 2,4
3,0 3,0 3,0 3,0 2,9 2,9 3,0 2,6 2,2 2,6 2,4 2,0 2,4 2,8

Tabela 1 – Rendimento de grãos de milho em um experimento de competição de


cultivares de milho, conduzidos no delineamento inteiramente ao acaso com quatro
repetições. Xanxerê, SC, safra 2005/2006.
REPETIÇÕES
Cultivar 1 2 3 4
----------- t/ha -----------
ASTECA 6,8 6,7 6,9 6,0
BR 106 5,2 4,4 6,1 4,8
CATETO 5,1 5,3 5,2 4,0
CUNHA 4,6 4,5 6,0 4,8
FUNDACEP 4,4 5,4 5,6 5,3
IPC 5,3 4,8 5,5 5,9
36

Tabela 2 – Peso médio de frutos em cinco variedades de macieira (Malus doméstica) em


um experimento em blocos ao acaso com quatro repetições.
BLOCOS
Variedades
I II III IV
--------------- g ---------------
Gala 142 144 145 139
Golden 139 138 144 131
Fuji 140 134 136 144
Catarina 151 136 137 136
Joaquina 153 155 152 150

Tabela 3 – Rendimento de grãos de milho em um experimento para comparação de fontes


de nitrogênio em dois sistemas de plantio, conduzido no delineamento blocos ao acaso
com quatro repetições. Chapecó, SC, safra 2005/2006.
BLOCOS
Plantio Adubo
1 2 3 4
------------- kg/ha -------------
E. AVES 8317 8617 10889 10753
E. SUÍNOS 8881 10347 12204 9373
CONVENCIONAL
NADA 5146 5801 6003 6991
NITRATO 9308 11200 9720 11305

E. AVES 9045 8912 8621 9656


E. SUÍNOS 9171 12312 10373 11752
DIRETO
NADA 5222 6087 5536 6474
NITRATO 11233 9709 11086 10845

Tabela 4 – Rendimento massa seca em um experimento para comparação de épocas de


aplicação do adubo em duas fontes de nitrogênio, conduzido no delineamento blocos ao
acaso com quatro repetições. Chapecó, SC, safra 2005/2006.
MS MILHETO
Fonte de N Época de Aplicação Blocos MS AVEIA (kg/ha) (kg/ha)
1 4097 9317
Plantio 2 6835 11696
Nitrato de Amônio

3 4695 9216
1 3977 8411
Após 1º corte 2 4979 9812
3 4293 9473
1 4216 8703
Parcelado 2 épocas 2 3988 8794
3 4753 10512
1 3356 8869
Plantio 2 3906 7422
Esterco de Suínos

3 2678 11789
1 4262 8895
Após 1º corte 2 3510 7898
3 3671 8017
1 4608 7767
Parcelado 2 épocas 2 3896 7761
3 3553 8883
37

9) Um novo medicamento para cicatrização está sendo testado e um experimento foi


feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes
de cirurgia. Uma amostra de trinta cobaias forneceu os seguintes valores:

15 17 16 17 14 17 16 16 17 15
18 14 17 15 14 15 16 17 18 18
17 15 16 14 18 18 16 15 14 16

a) Apresente os dados em uma tabela de freqüências;


b) Obtenha as medidas de posição e dispersão para os dados brutos e para os dados
tabelados;
c) Que porcentagem de observações estão abaixo dos 16 dias?

10) Um questionário foi aplicado aos vinte funcionários de uma empresa fornecendo os
dados apresentados na tabela:

Funcionário Curso Idade Salário (R$) Anos de Empresa


(completo)
1 Superior 34 1100,00 8
2 Superior 43 1450,00 10
3 Médio 31 960,00 5
4 Médio 37 960,00 4
5 Médio 28 600,00 4
6 Médio 25 600,00 4
7 Médio 27 450,00 2
8 Fundamental 22 456,00 6
9 Fundamental 21 456,00 6
10 Fundamental 26 450,00 5
11 Superior 29 1330,00 10
12 Médio 37 960,00 5
13 Médio 24 600,00 4
14 Superior 25 1500,00 11
15 Médio 27 850,00 7
16 Médio 22 850,00 7
17 Médio 21 550,00 5
18 Fundamental 26 350,00 1
19 Fundamental 33 350,00 1
20 Fundamental 40 350,00 1

a) Classifique as variáveis;
b) Construa tabelas de freqüências para as variáveis;
c) Calcule as medidas de posição e dispersão para as variáveis idade e salário (dados
brutos);
d) Calcule as medidas de posição e dispersão para a variável salário dentro de cada
curso.
38

11) A idade dos 20 ingressantes num certo curso de pós-graduação de uma universidade
foi o seguinte:

22 22 22 22 22 23 23 24 24 24
25 25 26 26 26 26 27 28 35 40

a) Apresente os dados em uma tabela de freqüências, incluindo a freqüência relativa;


b) Obtenha as medidas de posição e dispersão para os dados brutos e para os dados
tabelados;
c) Idades atípicas parecem ter ocorrido este ano. Após sua retirada do conjunto de
dados, refaça os itens a e b.
39

4 INTRODUÇÃO À PROBABILIDADE

4.1 MODELOS

Quando se emprega matemática no estudo de fenômenos de observação,


deve-se começar por construir um modelo matemático para esses fenômenos.

4.1.1 Modelos Determinísticos

Nesse caso as condições sob as quais um experimento é executado


determina o resultado do experimento.

Exemplo: Distância percorrida por um objeto lançado verticalmente ao solo

S = -16t2 + v0t (v0 = velocidade inicial e t = tempo de queda)

Esse modelo nos dá o valor de S tão logo os valores de v0 e t sejam


fornecidos. Assim, se o experimento for repetido um certo número de vezes
conservando-se fixos os valores de v0 e t esperamos observar o mesmo valor de
S.

4.1.2 Modelos Probabilísticos

São aplicados em situações que envolvem algum tipo de incerteza ou


variabilidade. Descrevem experimentos aleatórios, ou seja, são aqueles cujos
resultados podem não ser os mesmos, ainda que repetidos em condições
idênticas. Nesse caso, as condições de execução de um experimento não
determinam o resultado final, mas o comportamento probabilístico do resultado
observável.

Exemplos: - Lançamento de um dado;


- Lançamento de uma moeda;
- Tempo de vida útil de uma lâmpada.

Características:

a) Cada experimento pode ser repetido indefinidamente sob condições


inalteradas;

b) Não se pode afirmar a ocorrência de um resultado particular, mas pode-se


descrever o conjunto de todos os possíveis resultados.

c) Quando o experimento for realizado repetidamente os resultados individuais


parecem ocorrer de forma acidental. Porém repetindo-se um grande número de
40

vezes uma regularidade surgirá, o que possibilita a construção de um modelo


matemático preciso, com o qual se analisará o experimento.
O conjunto de todos os possíveis resultados de um experimento aleatório
denomina-se Espaço Amostral (E). Todo subconjunto do espaço amostral
denomina-se Evento (A). Dizemos que um evento ocorre quando um dos
resultados que o compõem ocorre.

Exemplos:

a) Lançamento de um dado e observação da face voltada para cima:

E={
A : ocorrer par = {

b) Jogar uma moeda quatro vezes e observar o número de caras obtidas:

E={
A : ocorrem duas caras = {

c) Tempo de duração de uma lâmpada até queimar:

E = { t /t ≥ 0 }
A : a lâmpada queima em menos de três horas = {

d) O número de mensagens que são transmitidas corretamente por dia em uma


rede de computadores:

E={
A={

e) Número de dias que chove em Xanxerê durante o mês de março:

E={
A : há de 18 a 24 dias chuvosos = {

Alguns conceitos da teoria dos conjuntos:

Como um evento é um subconjunto do espaço amostral, então todos os


conceitos da teoria de conjuntos podem ser aplicados a eventos. Considerando A
e B eventos quaisquer, veja as principais operações:
41

Operação Notação Conjunto Evento


a) união A ∪ B Reúne os elementos de Ocorre quando ocorrer
ambos os conjuntos pelo menos um deles
(A, B ou ambos)
b) interseção A ∩ B Formado somente pelos Ocorre quando ocorrer
elementos que estão em ambos eventos (A e B)
AeB
c) complementar A Formado pelos Ocorre quando não
elementos que não ocorrer o evento A
estão em A (não A)

Eventos são ditos mutuamente exclusivos se e somente se eles não


puderem ocorrer simultaneamente.

A e B são mutuamente exclusivos ⇔ A ∩ B = φ

4.2 ESPAÇO AMOSTRAL EQUIPROVÁVEL

Um dado foi lançado 1000 vezes. O número de vezes que ocorreu cada face
é chamado Freqüência Absoluta dessa face; a razão da freqüência absoluta para
o número de vezes que foi realizado o experimento é chamado de freqüência
relativa dessa face:

Face Freqüência Absoluta Freqüência Relativa


1 165
2 168
3 165
4 163
5 169
6 170
1000
* As Freqüências Relativas são valores próximos.

“Um espaço amostral é equiprovável se as freqüências relativas de seus


elementos tendem a um mesmo valor quando o número de experimentos aumenta
indefinidamente”.

4.3 DEFINIÇÃO DE PROBABILIDADE:

Sejam E um espaço amostral equiprovável, finito e não vazio e A ⊂ E . A


probabilidade de ocorrer algum elemento de A -P(A) – é:
42

n( A) número de resultados favoráveis


P( A) = =
n( E ) número de resultados possíveis

Exemplo: Lançam-se dois dados honestos. Calcular as probabilidades:

A = Soma dos valores iguais a 7;


B = Resultado do primeiro dado é igual a 6;
C = Os resultados nos dois dados são iguais;
D = A soma nos dois dados é 2.

*Determinar o espaço amostral.

Propriedades:

Seja um experimento aleatório e um espaço amostral (E) equiprovável


associado a ele. A cada evento (A) associaremos um número real denominado
probabilidade de ocorrência de A, P(A), que deve satisfazer as seguintes
propriedades:

I) P(φ ) = 0 (φ evento impossível)

n(φ ) 0
P(φ ) = = =0
n( E ) n ( E )

II) P( E ) = 1 (O evento E coincide com o espaço amostral e é chamado de evento


certo)

n( E )
P( E ) = =1
n( E )

III) 0 ≤ P( A) ≤ 1 pois φ ⊂ A ⊂ E ⇒ n(φ ) ≤ n( A) ≤ n( E )

n(φ ) n( A) n( E )
∴ ≤ ≤
n( E ) n( E ) n( E )

0 ≤ P( A) ≤ 1

IV) Sejam A ⊂ E e A o evento complementar de A, então:

P( A) + P( A ) = 1

Como A ∪ A = E e A ∩ A = φ : n( A) + ( A ) = n( E )
43

n( A) n( A ) n( E )
∴ + =
n( E ) n( E ) n( E )

P( A) + P( A ) = 1

V) Sejam A e B eventos quaisquer, então:

P( A ∪ B) = P( A) + P( B) − P( A ∩ B)

n( A ∪ B) = n( A) + n( B) − n( A ∩ B)

n( A ∪ B) n( A) n( B) n( A ∩ B)
= + −
n( E ) n( E ) n( E ) n( E )

∴ P( A ∪ B) = P( A) + P( B) − P( A ∩ B) (Regra da soma das probabilidades)

VI) Se A, B e C são eventos mutuamente exclusivos ( A ∩ B ∩ C = φ ):

P( A ∪ B ∪ C ) = P( A ) + P( B ) + P( C )

RESUMINDO:

I) P(φ ) = 0 (φ evento impossível)


II) P( E ) = 1 (E: evento certo)
III) 0 ≤ P( A) ≤ 1
IV) P( A) + P( A ) = 1
V) P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
VI) P( A ∪ B) = P( A) + P( B) (A e B mutuamente exclusivos: A ∩ B = φ )
44

EXERCÍCIOS

1) Uma urna contém exatamente 20 bolas numeradas de 1 a 20. Retira-se, ao acaso, uma bola da
urna. Qual é a probabilidade de se obter uma bola com um número múltiplo de 2 ou 3?

2) Suponha que a tabela seguinte represente uma possível divisão dos alunos do primeiro ano de
três cursos da UNOESC/XANXERÊ, no ano de 2006. Lembre-se de que um aluno não pode estar
matriculado em mais de um curso ao mesmo tempo.

Tabela 1. Distribuição dos alunos do primeiro ano de 2003 quanto ao sexo e ao curso.
CURSO
Tecnólogo em
Direito Arquitetura
Sexo Informática TOTAL
(I) (D) (A)
Masculino (M) 160 30 15 205
Feminino (F) 40 10 10 60
Total 200 40 25 265
Fonte: Dados hipotéticos.

- Considere o experimento escolha ao acaso de um aluno do primeiro ano e verificar qual o curso
está cursando e a qual sexo pertence.
- Considere ainda os seguintes eventos: M: ser do sexo masculino; F: ser do sexo feminino; I:
estar cursando Tecnólogo em Informática; D: estar cursando Direito; A: estar cursando
Arquitetura;

Calcular as seguintes probabilidades: P(M), P(F), P(I), P(D), P(A), P(E), P(M ∪ F), P(I ∪ D),
P(M ∩ F), P(M ∪ D), P(M ∪ A), P(F ∪ I), P(F ∪ D), P(F ∪ A), P( D ),P( M ),P(I ∪ M)

3) Seja o evento passar na disciplina A e B o evento passar na disciplina B. Considerando


P(A)=1/2, P(B)=2/3 e P(A ∩ B)=1/4, calcular e interpretar: P( A ), P( B ), P(A ∪ B), P( A ∩ B ).

4) Uma urna contém bolas coloridas. Retirando-se uma bola dessa urna, a probabilidade de se
obter uma bola vermelha é 0,64. Qual é a probabilidade de se obter uma bola que não seja
vermelha?

5) Uma urna contém bolas brancas e bolas azuis. Retirando-se, ao acaso, uma bola da urna, a
probabilidade de se obter uma bola azul é o quádruplo da probabilidade de se obter uma bola
branca. Qual é a probabilidade de se obter uma bola branca?

6) No lançamento de duas moedas, qual a probabilidade de se obter pelo menos uma cara?

7) Uma urna contém cinco bolas vermelhas, três bolas azuis e quatro bolas brancas. Retira-se, ao
acaso, uma bola da urna. Qual é a probabilidade de sair uma bola vermelha ou uma bola azul?

8) Extraindo-se aleatoriamente uma carta de um baralho comum com 52 cartas, qual é a


probabilidade de se obter uma carta de paus ou uma figura (rei, dama ou valete)?

9) Se, para uma pessoa que visita uma cidade, as probabilidades de ela visitar o edifício A, B ou
ambos são 0,92, 0,33 e 0,29 respectivamente, qual é a probabilidade de essa pessoa visitar ao
menos um dos prédios?
45

10) As probabilidade de uma pessoa, acusada de dirigir um carro descuidadamente, ser multada,
ter sua licença cassada ou ambas são 0,88, 0,62 e 0,55. Qual é a probabilidade de uma pessoa
acusada de dirigir descuidadamente ser multada ou ter sua licença cassada?

11) A probabilidade de uma pessoa que pára em um posto de gasolina pedir verificação do nível do
óleo é 0,28, a probabilidade de pedir a verificação da pressão dos pneus é 0,11 e a probabilidade
de solicitar ambas é 0,04. Qual é a probabilidade de uma pessoa que pára em um posto de gasolina
solicite
a) verificação do nível de óleo, ou da pressão dos pneus, ou ambas;
b) nem verificação do nível do óleo nem verificação da pressão dos pneus?

12) As probabilidades de que, em um ano qualquer, uma jovem assista a um jogo de futebol, a um
jogo de tênis, ou a ambos, são 0,37, 0,13 e 0,10. Determine a probabilidade de que, em um ano
qualquer, uma jovem assista
a) a um jogo de futebol ou a um jogo de tênis;
b) nem a um jogo de futebol nem a um jogo de tênis.

13) Uma universidade tem 10 mil alunos dos quais 4 mil são considerados esportistas. Temos ainda
que 500 alunos são do curso de Biologia diurno, 700 da Biologia noturno, 100 são esportistas e da
Biologia diurno e 200 são esportistas e da Biologia noturno. Um aluno é escolhido ao acaso.
Pergunta-se a probabilidade de:
a) Ser esportista;
b) Ser esportista e aluno da Biologia noturno;
c) Não ser da Biologia;
d) Ser esportista ou aluno da Biologia;
e) Não ser esportista nem aluno da Biologia.

14) Sejam A e B dois eventos em um dado espaço amostral, tais que P ( A) = 0, 2 , P ( B ) = p ,


P( A ∪ B) = 0,5 e P( A ∩ B) = 0,1 . Determine o valor de p.

15) Dois processadores A e B são colocados em teste por 50 mil horas. A probabilidade de que um
erro de cálculo aconteça em processador do tipo A é de 1/30, no tipo B, 1/80 e em ambos,
1/1000. Qual a probabilidade de que:

a) Pelo menos um dos processadores tenha apresentado um erro?


b) Nenhum processador tenha apresentado erro?

16) Uma urna contém 6 bolas brancas e 8 vermelhas. Retirando-se três bolas, qual a probabilidade
de serem brancas?

17) Num rebanho de 100 bovinos, formado por 52 animais da raça X, 27 da raça Y, 10 da raça Z e
os demais da raça W, escolhendo-se um animal ao acaso qual a probabilidade de que seja da raça
X ou Y?

18) Qual a probabilidade de, escolhido um subconjunto de {a, b, c, d, e} com três elementos, ele
possuir a letra a?

19) Numa amostragem de ladrilhos, 8 são do tipo A, 6 do tipo B e 2 são do tipo C. Um ladrilho é
retirado ao acaso. Qual a probabilidade de ele não ser do tipo C? E de ele ser do tipo A ou do tipo
C? Se forem retirados dois ladrilhos, qual a probabilidade de ambos serem do tipo A?
46

4.4 PROBABILIDADE CONDICIONAL

Uma urna contém exatamente vinte etiquetas numeradas de 1 a 20. Retira-


se uma etiqueta da urna. Sabendo-se que o número da etiqueta é par, qual é a
probabilidade de que esse número seja 2?

Como sabemos que o número da etiqueta retirada é par, temos como


espaço amostral o seguinte conjunto:

A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20} ∴ n(A)=10

O evento que queremos é B = {2} ∴ n(B) = 1.

n( B ) 1
Logo, P( B) = =
n( A) 10

Note que o fato de sabermos que ocorreu o evento “número par” faz com
que o espaço amostral fique reduzido a este evento.

DEFINIÇÃO:

Chama-se probabilidade condicional de um evento B a probabilidade de


esse evento ocorrer considerando-se que já ocorreu um evento A.

“P(B/A) = Probabilidade de B, dado A“.

Analisemos o seguinte problema genérico: o espaço amostral E de um


experimento aleatório é equiprovável, finito e não vazio. A e B são eventos de E,
com A ≠ ∅. Ao realizar-se o experimento, ocorre o evento A. Qual é a
probabilidade de também ter ocorrido o evento B?

Devemos calcular P(B/A). Como sabemos que ocorreu o evento A, o espaço


amostral fica reduzido a esse evento. O evento B, por sua vez, só poderá ocorrer
na intersecção de A e B. Assim, temos que:

n( A ∩ B)
P( B / A) =
n( A)

Note que no denominador temos a probabilidade do evento que


supostamente aconteceu, mas calculada nas condições originais do experimento.
47

Se houver interesse no oposto, isto é, na probabilidade de ocorrência de A


condicionada à ocorrência prévia de B, sendo P( B ) > 0 , temos

n( A ∩ B )
P( A / B ) =
n( B )

Note que se A e B forem mutuamente exclusivos, então P(B/A) = 0.

Exemplos:

1) Dois dados são lançados. Sabe-se que os números observados são ímpares.
Qual a probabilidade de que a soma seja 8?

2) No lançamento de um dado, considerar os seguintes eventos A= {1, 2, 3, 4}; B =


{3, 4, 5, 6}. Qual é a probabilidade de ocorrer o evento B, sabendo-se que
ocorreu o evento A?

3) no lançamento de dois dados, sabe-se que se obteve nas faces voltadas para
cima a soma dos pontos igual a 6. Qual é a probabilidade de que essas faces
apresentem o mesmo número de pontos?

4) Uma urna contém exatamente 20 bolas, numeradas de 1 a 20. Retirando-se ao


acaso uma bola dessa urna, observa-se que o número é menor que 8. qual é a
probabilidade de que esse número seja par?

5) Uma moeda é lançada duas vezes. Calcule a probabilidade de:


a) obter cara no segundo lançamento;
b) obter cara no segundo lançamento, sabendo que obtivemos cara no primeiro
lançamento.

6) De uma urna com 5 bolas de cores diferentes, foram sorteadas


sucessivamente duas bolas. Sabendo-se que a primeira bola sorteada era
vermelha e que esta foi reposta na urna, qual é a probabilidade de que, na
segunda retirada, também tenha saído a bola vermelha?
48

4.5 EVENTOS INDEPENDENTES

Definição:

Seja um espaço amostral E, finito e não vazio. Sejam A e B eventos de E.


Dizemos que A e B são eventos independentes se, e somente se:

P(A/B) = P(A) E P(B/A) = P(B)

O evento A é independente do evento B se a probabilidade de A não é


afetada pela ocorrência ou não ocorrência de B.

Exemplos:

1) As probabilidades de um estudante ser aprovado em matemática, inglês e


ambos são:
P(M) = 0,70 P(I) = 0,8 P(M ∩ I) = 0,56
Verifique se os eventos M e I são independentes.

2) A probabilidade de chover em determinada cidade no dia de Natal (N), no dia


de ano novo (A) ou em ambos são:
P(N) = 0,60 P(A) = 0,60 P(N ∩ A) = 0,42
Verifique se os eventos N e A são independentes.

Regra Especial da Multiplicação (eventos independentes)

Se A e B são eventos independentes, então:

P( A ∩ B ) = P( A ).P( B )

Ou seja, a probabilidade de ocorrência simultânea de dois eventos


independentes é, simplesmente, o produto de suas probabilidades respectivas.
49

EXERCÍCIOS

1) Qual é a probabilidade de se obter duas caras em duas jogadas de uma moeda equilibrada?

2) Qual é a probabilidade de se obter três coroas em três jogadas de uma moeda equilibrada?

3) Qual é a probabilidade de se obter dois ases em seguida, quando se extraem duas cartas de um
baralho comum de 52 cartas, se:
a) a primeira carta é reposta no baralho antes da extração da segunda carta;
b) a primeira carta extraída não é reposta antes da extração da segunda carta?

4) De 100 pessoas que solicitaram emprego como programador, 40 possuíam experiência (A), 30
possuíam um certificado profissional (C). Vinte dos candidatos possuíam tanto experiência com
certificado profissional.
a) Qual a probabilidade de um candidato aleatoriamente escolhido tenha experiência ou
certificado (ou ambos)?

b) Qual a probabilidade de um candidato aleatoriamente escolhido tenha experiência ou


certificado, mas não ambos?

c) Qual a probabilidade de um candidato escolhido ao acaso tenha um certificado, dado que tenha
experiência anterior?

d) Verifique se a posse de um certificado e a experiência anterior são eventos dependentes ou


independentes.

5) Em uma grande empresa há dois departamentos: Produtos Marítimos (M) e Produtos para
Oficinas (O). A probabilidade de que a divisão de M tenha, neste ano, uma margem de lucro de no
mínimo 10% é estimada em 0,30; a probabilidade de que a divisão de O tenha uma margem de
lucros de pelo menos 10% é 0,20; e a probabilidade de que ambas divisões tenham uma margem de
lucro de no mínimo 10% é 0,06.

a) A divisão de M alcançou a margem de lucro de 10%. Qual a probabilidade de a outra divisão


também ter alcançado?

b) Verifique se as metas de lucro das duas divisões são eventos estatisticamente independentes.

6) Com referência à Tabela 1, qual a probabilidade de que uma família aleatoriamente escolhida
tenha uma renda familiar (a) entre R$300,00 e R$499,00 ; (b) menos de R$500,00; c) um dos
dois extremos: menos de R$300,00 ou pelo menos R$900,00?

Tabela 1. Renda familiar anual de 500 famílias.


Categoria Níveis de renda (R$) Nº de famílias
1 Menos do que 300,00 60
2 300,00 – 499,99 100
3 500,00 – 699,99 160
4 700,00 – 899,99 140
5 900,00 e mais 40
TOTAL 500
Fonte: Dados hipotéticos.
50

5 ESTIMAÇÃO DE PARÂMETROS

5.1 INTRODUÇÃO

Nos processos biológicos é praticamente impossível medir todos os


indivíduos da população. Por essa razão, os pesquisadores trabalham com dados
amostrais ou experimentais. Desse modo, todas as inferências estatísticas são
baseadas nas distribuições amostrais e na teoria probabilística.
Se for retirada uma amostra de tamanho n de uma população, pode-se
obter estimativas dos parâmetros populacionais. Assim, se o parâmetro sob
estudo é a média populacional ( µ ), então o estimador apropriado é fornecido por
n
m = (∑ xi ) / n , sendo m um estimador do parâmetro µ . Como podem ser retiradas
i =1

várias amostras, podem-se obter inúmeras estimativas de m. A distribuição de m,


independentemente da distribuição populacional, será aproximadamente normal. É
conhecido também que a distribuição de m será mais próxima da normal,
independente da distribuição populacional, à medida que n cresce. Quando se tem
n maior ou igual a 30, a aproximação é considerada boa.

5.2 ESTIMAÇÃO POR PONTO E POR INTERVALO

A estimação pode ser obtida basicamente de duas formas. A primeira,


obtendo-se um único valor amostral para estimar o parâmetro populacional; esse
tipo é denominado de estimação pontual ou por ponto. Convém salientar que o
estimador é uma variável aleatória, que é função dos elementos amostrais. Desta
forma a estimativa por ponto pode variar entre as amostras, estando, pois,
sujeitas a erros de estimação, devido ao procedimento de aleatorização e à
variabilidade inerente à população da qual a amostra foi retirada. Assim,
dificilmente a estimativa obtida será igual ao verdadeiro valor do parâmetro.
No segundo processo, denominado estimação por intervalo, é construído
um intervalo com uma probabilidade pré-fixada de conter o parâmetro
populacional. O método de estimação denominado intervalo de confiança (IC),
incorpora à estimativa pontual do parâmetro informações a respeito de sua
variabilidade. Um IC para um parâmetro é construído com uma probabilidade de
que o intervalo contenha o verdadeiro parâmetro. Essas probabilidades são, em
geral, fixadas em 95% ou 99%, e são denominadas “nível de confiança”.

5.2.1 Intervalo de confiança para proporção

Em muitas situações, o principal parâmetro de interesse é alguma


proporção p. Por exemplo:
- a proporção de plantas doentes em uma população de plantas;
- a proporção de itens defeituosos em uma linha de produção;
51

- a proporção de consumidores que vão comprar certo produto;


- a proporção de mensagens que chegam adequadamente ao seu destino.

Seja uma população caracterizada por uma variável que assume o valor 0 ou
1, conforme o elemento tenha ou não certo atributo de interesse. Por exemplo,
nas peças que saem de uma linha de produção, o código 0 pode identificar peça
boa e o código 1 peça defeituosa. Note que p representa a proporção de
elementos com o atributo na população.
Observada efetivamente a amostra, e chamando de p̂ a proporção obtida
nesta amostra, podemos definir um intervalo de confiança para p, com nível de
confiança de 95%, por:
pˆ (1 − pˆ )
IC ( p,95%) = pˆ ± Z γ ,
n
sendo Z γ um valor tabelado, p̂ é a proporção observada do evento e n é o
tamanho da amostra.
Quando a população é finita, ou seja, o tamanho da população é conhecido,
deve-se promover o ajustamento do intervalo pela expressão:
pˆ (1 − pˆ ) N − n
IC ( p,95%) = pˆ ± Z γ . ,
n N −1
em que N se refere ao tamanho populacional.

Em suma, embora p seja um parâmetro populacional desconhecido, é


possível, com base em uma mostra aleatória simples, construir um intervalo que
deve conter p com alto nível de confiança.
É bastante usual o nível de confiança de 95%, mas o intervalo pode ser
construído com um nível (γ ) qualquer.

Tabela – Valores tabelados para alguns níveis de confiança


γ 80% 90% 95% 98% 99% 99,5% 99,8%
zγ 1,282 1,645 1,960 2,326 2,576 2,807 3,090

Exemplos:

a) Desejando saber a incidência de uma doença em uma população de


plantas, 100 delas foram amostradas. Destas, 28 estavam contaminadas por uma
doença. Determine o IC para a proporção de doença com 95% de confiança.

b) Na avaliação de dois sistemas computacionais, A e B, foram selecionadas


400 cargas de trabalho (tarefas) – supostamente uma amostra aleatória da
infinidade de cargas de trabalho que poderiam ser submetidas a esses sistemas.
O sistema A foi melhor em 60% dos casos. Construir intervalos de confiança para
52

p, proporção de vezes que o sistema A é melhor que o sistema B, considerando


todas as possíveis cargas de trabalho, usando níveis de confiança de 95% e 99%.

5.2.2 Intervalo de confiança para média

Observada efetivamente a amostra, e chamando de x a média aritmética


dos dados, podemos definir um intervalo de confiança para µ , com nível de
confiança γ , por:

i) Quando a amostra for grande (n ≥ 30):


s
,
IC ( µ , γ ) = x ± z γ
n
sendo Z γ um valor tabelado, s é o desvio padrão da amostra e n é o tamanho da
amostra.
Quando a população é finita, deve-se promover o ajustamento do intervalo
pela expressão:
s N −n
IC ( µ , γ ) = x ± z γ . ,
n N −1
em que N se refere ao tamanho populacional.

Exemplos:

a) Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem se


comportado como uma variável aleatória com média 350mL e desvio padrão de
3mL. Após alguns problemas na linha de produção, suspeita-se que houve
alteração da média. Uma amostra de 50 latas acusou média de 346mL. Construa
um intervalo de confiança para o novo valor da quantidade média de cerveja
inserida nas latas, com nível de confiança de 95%, supondo que não tenha
ocorrido alteração no desvio padrão do processo.

b) De uma população de plantas de tamanho N=400, foi retirada uma amostra de


tamanho n=100. A média da amostra para a altura das plantas foi de 130,2 cm e a
variância foi de 69,2888cm2. Faça o IC para a média populacional com 90% de
confiança.

ii) Quando a amostra for pequena (n < 30):

s
IC ( µ , γ ) = x ± tγ
n
53

em que t γ é um valor tabelado da distribuição t de Student.


Quando a população é finita, deve-se promover o ajustamento do intervalo
pela expressão:
s N −n
IC ( µ , γ ) = x ± tγ .
n N −1

em que N se refere ao tamanho populacional.

Exemplos:

i) Deseja-se avaliar a dureza esperada do aço produzido sob um novo processo.


Uma amostra de 10 corpos de prova do aço produziu os seguintes resultados:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiança para a média, com um nível de
confiança de 95%.

ii) A distribuição de probabilidade do ganho de peso diário de uma determinada


raça de suínos, num certo período de engorda, é normal com média de 700g e
variância de 1600g2. Entretanto foram feitas modificações no sistema de manejo
com finalidade de melhorar ainda mais a eficiência da raça. Amostraram-se 10
animais cuja média de ganho foi de 730g. Quais os prováveis limites para esta
raça nesse sistema em termos de ganho de peso diário com uma confiança de
95%?

iii) Construir um intervalo com 95% de confiança para o peso de pencas de


bananas (em gramas) das cultivares dadas a seguir.

Peso dos cachos de banana em três variedades. Urussanga, SC.


Pacovan Prata Thap Maeo
Planta Peso 1o. Peso 2o. Peso 1o. Peso 2o. Peso 1o. Peso 2o.
cacho cacho cacho cacho cacho cacho

1 16714 16148 15284 7064 26282 12536


2 13956 20102 12198 6118 17320 15006
3 16748 17782 13578 9848 22584 15880
4 12436 12688 13288 11174 22838 27254
5 13892 15718 14540 15270 24258 29704
6 14780 22066 12198 8922 20168 21298
7 18986 10046 11854 11888 22960 28372
8 17476 11206 14124 14292 22362 22890
9 16424 15530 13142 12246 19890 19578
10 12976 12532 14648 7698 23156 24906
11 15002 10040 13256 9604 22858 29816
12 13522 11256 11516 9980 20638 24348
54

EXERCÍCIOS

1) Ao se realizar uma contagem de eritrócitos em 144 mulheres encontrou-se em


média 5,35 milhões e desvio padrão 0,4413 milhões de glóbulos vermelhos.
Determine os limites de confiança de 99% para a média populacional.

2) Um conjunto de 12 animais de experiência receberam uma dieta especial


durante 3 semanas e produziram os seguintes aumentos de peso (g):
30, 22, 32, 26, 24, 40, 34, 36, 32, 33, 28 e 30.
Determine um intervalo de 90% de confiança para a média.

3) Construa um intervalo de 95 % de confiança para um dos seguintes casos:


σ
Média Amostral Tamanho da Amostra
a) 16,0 2,0 16
b) 37,5 3,0 36
c) 2,1 0,5 25
d) 0,6 0,1 100

4) Numa tentativa de melhor o esquema de atendimento, um médico procurou


estimar o tempo médio que gasta com cada paciente. Uma amostra aleatória de
49 pacientes, colhida num período de 3 semanas, acusou uma média de 30 min.,
com desvio padrão de 7 min. Construa um intervalo de 95% de confiança para o
verdadeiro tempo médio de consulta.

5) Solicitou-se a 100 estudantes de um colégio que anotassem suas despesas com


alimentação e bebidas no período de uma semana. Há 500 estudantes no colégio.
O resultado foi uma despesa de R$40,00 com um desvio padrão de R$10,00.
Construa um intervalo de 95% de confiança para a verdadeira média.

6) Uma amostra aleatória de 100 fregueses da parte da manhã de um


supermercado revelou que apenas 10 não incluem leite em suas compras.

a) qual seria a estimativa percentual dos fregueses que compram leite pela parte
da manhã. (α = 5% é o nível de significância, ou seja, o erro que se está
cometendo ao afirmar que o parâmetro está entre o limite inferior e superior do
IC).

b) construir um intervalo de 90% de confiança para a verdadeira proporção dos


fregueses que não compram leite pela manhã.

7) Uma amostra aleatória de 40 homens trabalhando num grande projeto de


construção revelou que 6 não estavam usando capacetes protetores. Construa um
55

intervalo de 99% de confiança para a verdadeira proporção dos que não estão
usando capacetes neste projeto.

8) De 48 pessoas escolhidas aleatoriamente de uma longa fila de espera de um


cinema, 25% acharam que o filme principal continha demasiada violência.

a) construa um intervalo de 95% de confiança para a verdadeira proporção, se há


100 pessoas na fila;

b) construa um intervalo de 95% de confiança para a verdadeira proporção, se há


500 pessoas na fila.

9) Em uma fábrica, colhida uma amostra (n = 30) de certa peça, obtiveram-se as


seguintes medidas para os diâmetros: 10 11 11 11 12 12 12 12 13 13 13 13 13 13 13
13 13 13 13 13 14 14 14 14 14 15 15 15 16 16

a) estimar a média e a variância;

b) construir um intervalo de confiança para a média, sendo α = 5%.

c) construir um intervalo de 95 % de confiança para a média, supondo que a


amostra tenha sido retirada de uma população de 100 peças, sendo α = 5%.
56

6 PLANEJAMENTO DE UMA PESQUISA

6.1 ASPECTOS GERAIS

Para que os resultados de uma análise estatística de dados produzam


informações úteis, os dados precisam ser coletados de forma planejada. A Figura
a seguir ilustra as principais etapas de uma pesquisa, enfatizando que os métodos
estatísticos precisam ser pensados ainda na fase de planejamento da pesquisa.

Definição do problema e
objetivos

Planejamento da Pesquisa

Execução da pesquisa

Metodologia Dados Metodologia


da área de estatística
estudo

Análise dos dados

Resultados

Conclusões

Embora a Figura ilustre as etapas da pesquisa em seqüência, na fase do


planejamento é necessário também pensar na forma de análise dos dados, pois,
dependendo da análise estatística que se deseja fazer, o projeto de pesquisa
deve ter suas peculiaridades.
Em função do problema e dos objetivos da pesquisa devemos decidir entre
uma pesquisa observacional e uma pesquisa experimental. Numa pesquisa
observacional (ou de levantamento) as características de uma população são
levantadas (observadas ou medidas), mas sem manipulação. É o caso de um censo
57

demográfico, pesquisas eleitorais, pesquisas de mercado, inspeção da qualidade,


etc. Em todos estes casos, quer-se ter idéia de certa população tal qual ela é na
natureza ou processo.
Nas pesquisas experimentais, grupos de indivíduos (ou objetos) são
manipulados para se avaliar o efeito de diferentes tratamentos. É o caso de
verificar o rendimento de um processo químico para diferentes temperaturas de
reação, que são manipuladas de acordo com o interesse prático.

Reconhecimento do problema e definição dos objetivos.

Acumulação de dados, informações, etc.

Formulação de uma hipótese Planejamento da


Experimento Pesquisa
Experimental

Escolha do Método
de Pesquisa
Levantamento por Execução do
Amostragem Experimento

Planejamento Coleta de Dados

Análise de Dados

Interpretação dos Resultados

Preparo do Relatório

Etapas de um programa experimental


58

6.2 TÉCNICAS DE AMOSTRAGEM

Em diversos estudos não é possível examinar todos os elementos da


população de interesse, seja pelo custo, pela inacessibilidade ou dimensão da
população. Assim, é necessário fazer generalizações seguras – com base em
amostras – sobre as populações das quais se extraíram as amostras. A inferência
estatística nos dá elementos para realizar, com grande grau de segurança, as
conclusões obtidas de uma amostra representativa.
Deve-se lembrar que, uma população consiste de todas as observações
concebíveis (ou hipoteticamente possíveis) de um determinado fenômeno,
enquanto uma amostra é simplesmente parte da população. Além disso, as
populações podem ser finitas (número fixo de elementos, medidas ou
observações) ou infinitas (contêm um número infinito de elementos).

6.2.1 Planejamento de amostras

Em estatística, um planejamento de amostra é um plano definido,


completamente determinado antes da coleta de quaisquer dados, e que tem por
objetivo a obtenção de uma amostra de uma dada população.
Nenhum plano de amostragem garante que a amostra seja exatamente
semelhante à população da qual foi extraída. Uma amostra aleatória permite
estimar o valor do erro possível, isto é, permite identificar se a amostra
representa a população ou não. As amostras não aleatórias não apresentam esta
característica.
Os problemas de amostragem podem ser mais ou menos complexos,
dependendo das populações e das variáveis que se deseja estudar. Na indústria,
onde amostras são retiradas para efeito de controle de qualidade dos produtos e
materiais, em geral os problemas de amostragem são mais simples de resolver.
Em pesquisas sociais, econômicas ou de opinião, a complexidade dos problemas de
amostragem é normalmente bastante grande. Em tais casos, deve-se ter muito
cuidado quanto à caracterização da população e ao processo usado para
selecionar a amostra.
Em resumo, a obtenção de soluções adequadas para o problema de
amostragem exige bom-senso e experiência. Abordaremos a seguir alguns tipos
de planejamento amostral mais estudados.

6.2.2 Tamanho da amostra

Uma questão que entra em jogo é, qual deve ser o tamanho mínimo de uma
amostra para que ela seja representativa da população em estudo?

Para isso, é necessário que sejam abordados os conceitos a seguir:


59

O termo parâmetro é usado para designar alguma característica descritiva


dos elementos da população. De forma análoga, chamaremos de estatística
alguma característica descritiva dos elementos da amostra. Por exemplo, na
população dos funcionários de uma empresa, a percentagem de funcionários
favoráveis a um programa de treinamento é um parâmetro. Numa amostra a ser
retirada de 200 destes funcionários, a percentagem de favoráveis ao programa
de treinamento, nesta amostra, é uma estatística.
Ao observarmos efetivamente uma amostra de 200 funcionários, se
encontramos 60% de favoráveis, este valor é chamado de estimativa do referido
parâmetro. Então, uma estimativa é o valor acusado por uma certa estatística,
considerando a particular amostra observada.
Chamamos de erro amostral a diferença entre o valor que a estatística
pode acusar e o verdadeiro valor do parâmetro que se deseja estimar.
Para a determinação do tamanho da amostra, o pesquisador precisa
especificar o erro amostral tolerável, ou seja, o quanto ele admite errar na
avaliação dos parâmetros de interesse. Por exemplo, na divulgação de pesquisas
eleitorais, é comum encontrarmos no relatório algo como: a presente pesquisa
tolera um erro de 2%. Isto quer dizer que, quando a pesquisa aponta determinado
candidato com 20% de preferência do eleitorado, está afirmando, na verdade,
que a preferência por este candidato é um valor do intervalo de 18% a 22% (ou
seja, 20% ± 2%).
A especificação do erro amostral tolerável deve ser feita sob um enfoque
probabilístico, pois, por maior que seja a amostra, existe sempre o risco de o
sorteio gerar uma amostra com características bem diferentes das da população
de onde ela está sendo extraída.
A seguir, apresenta-se uma forma bastante genérica usada em pesquisas
em que se deseja estimar diversos parâmetros, especialmente proporções de
ocorrência de determinados atributos. Como a abordagem apresentada é
bastante genérica, ela pode fornecer um tamanho de amostra bastante superior
ao tamanho que seria necessário para uma dada situação específica.
Quando conhecemos o tamanho da população, o tamanho da amostra pode
ser dado por:

N
n=
E N +1
2

em que:
n: tamanho (número de elementos) da mostra;
N: tamanho (número de elementos) da população;
E: erro amostral tolerável.

Exemplos:

a) Se uma população em estudo tem 300 elementos e tolera-se um erro de 5%,


qual deve ser o tamanho da amostra?
60

b) Para avaliar o grau de satisfação de 210 donos de restaurantes de Balneário


Camboriú, qual deve ser o tamanho mínimo de uma amostra aleatória simples, se
admitirmos que o erro amostral não ultrapassa a 3%? Se admitirmos que o erro
amostral não ultrapassa a 5%, qual é o tamanho mínimo da amostra?

c) Se o objetivo fosse avaliar o grau de satisfação dos clientes dos restaurantes,


estimados em 25.000 clientes, qual o tamanho da amostra para os dois casos de
erros: 3% e 5%.

6.2.3 Amostragem Aleatória Simples (AAS)

É um método de selecionar, sem reposição, n elementos de uma população


de tamanho N (conhecido e finito), em que cada elemento tem a mesma chance de
ser selecionado.

Definição: Uma amostra de tamanho n extraída de uma população finita de


tamanho N é aleatória se é escolhida de modo que cada uma C Nn amostras
 1 
possíveis tem a mesma chance,  n  , de ser escolhida.
 CN 

Exemplo: Uma população consiste dos N = 5 elementos a, b, c, d e e. Quantas e


quais são as amostras possíveis de tamanho três? Qual a probabilidade de cada
uma dessas amostras ser escolhida?

Resumindo: “Uma amostra aleatória é aquela em que todos os elementos da


população têm probabilidade conhecida e diferente de zero de pertencer à
amostra”.

A utilização de uma amostragem probabilística garante a


representatividade da amostra, pois o acaso será o único responsável por
eventuais discrepâncias entre população e amostra.
61

Procedimento para obtenção de uma AAS de tamanho n:

1º) Enumerar os N elementos da população de 1 a N.


2º) Sortear por meio de dispositivos aleatórios e sem reposição, n números
compreendidos de 1 a N.
3º) Os elementos correspondentes aos números escolhidos formarão a amostra.

Exemplo: Com o objetivo de estudar o grau de conhecimento da língua espanhola


dos 83 funcionários de um hotel, vamos examinar uma amostra aleatória simples
de tamanho 8. Devemos dispor da listagem com o nome de todos os funcionários
do hotel e associar um número a cada nome. Para escolhermos os 8 funcionários
basta tomar 8 números aleatórios do conjunto {01, 02, 03,..., 83}. Os funcionários
associados aos números selecionados formarão a amostra.

6.2.4 Amostragem Estratificada (AE)

Consiste em dividir a população em subgrupos denominados estratos. Esses


estratos devem ser internamente mais homogêneos do que a população toda, com
respeito às variáveis em estudo. Em tais casos, se o sorteio dos elementos da
amostra for realizado sem se levar em consideração a existência de estratos,
pode acontecer que diversos estratos não sejam convenientemente
representados na amostra e não tenhamos uma amostra representativa da
população.
A amostragem estratificada consiste em especificar quantos elementos da
amostra serão retirados em cada estrato. Sobre os diversos estratos da
população, são realizadas seleções aleatórias, de forma independente. A amostra
completa é obtida através da agregação das amostras de cada estrato.
O esquema abaixo representa uma pequena área com laranjeiras de três
diferentes variedades. Deseja-se estimar o número total de frutos dessa área
observando-se apenas 10 laranjeiras. Como você realizaria a amostragem? Você
recomendaria o uso da amostragem aleatória simples? Por quê?

• • • • • • • • • • • •
• • • • • • • • • • • • Legenda Variedade
• • • • • • • • • • • • • A
• • • • • • • • • • • • X B
x x x x x * * * * * * * * C
x x x x x * * * * * * *
x x x x x * * * * * * *
x x x x * * * * * *

Na amostragem estratificada, a população de N indivíduos é,


primeiramente, dividida em L sub-populações chamadas estratos com,
62

respectivamente, N1, N2, ..., NL unidades, de tal forma que não tenham elementos
em comum. Em seguida, é realizada uma AAS dentro de cada estrato. É uma das
mais utilizadas já que as populações têm estratos geralmente bem definidos.
Nesses casos pode-se utilizar uma alocação proporcional, ou seja, o número ni de
elementos amostrados em cada estrato é proporcional ao tamanho Ni de cada um
dos estratos (i = 1, ..., L) - os tamanhos das amostras dos diferentes estratos são
proporcionais aos tamanhos dos estratos.

Amostragem estratifica proporcional: a proporcionalidade do tamanho de cada


estrato da população é mantida na amostra.

Amostragem estratifica uniforme: selecionamos o mesmo número de elementos


de cada estrato. É o processo usual quando se deseja comparar os diversos
estratos.

Procedimento para obtenção de uma amostra estratificada de tamanho n


considerando:
N: número de elementos da população;
L: número de estratos;
Ni: número de elementos do estrato i (Obs.: N = N1 + N2 + ...+ NL);
n: tamanho da amostra a ser selecionada.

n
1º) Calcular a fração da amostragem dada por f =
N
2º) Calcular o número de elementos a serem sorteados em cada estrato:

n1 ≅ N 1 f , n2 ≅ N 2 f , ..., n L ≅ N L f com n = n1 + n2 + K + n L .

N 1 x1 + N 2 x 2 + K + N L x L
3º) Cálculo da média: x AE = , em que xi é a média
N
aritmética dos ni elementos amostrados do estrato i.

O objetivo da estratificação é formar camadas de tal modo que haja


alguma relação entre o fato de estar em determinado estrato e a resposta
procurada no estudo e que, dentro de cada estrato, haja tanta homogeneidade
quanto possível.

Exemplos:

a) Deve-se extrair uma AE de tamanho n = 60 de uma população de tamanho N =


4000, que consiste de três estratos de tamanhos N1 = 2000, N2 = 1200 e N3 =
63

800. Para que a alocação seja proporcional, qual deve ser o tamanho da amostra a
ser extraída de cada estrato?

b) A figura abaixo apresenta os diâmetros (cm) de uma população de árvores. Os


valores em negrito representam as árvores com 3 anos de idade, os valores em
itálico, as árvores com 5 anos e os valores restantes, árvores com 4 anos (x
representam árvores mortas).

11,8 20,0 31,5 39,6 32,1 34,7 35,4


15,9 19,5 10,1 14,6 30,8 38,9 31,2 38,1 34,1
17,8 12,5 12,6 19,4 39,1 x 36,6 32,4 34,8
10,3 11,0 19,0 13,1 15,5 35,5 32,1 32,8 33,9 32,1 50,2
16,3 17,9 16,6 14,0 10,2 37,6 36,6 34,3 30,3 33,9 57,0
13,7 13,4 x 18,0 14,6 39,9 34,3 34,6 30,0 35,3 59,4 56,2
15,3 10,3 18,3 11,1 17,2 34,8 33,2 39,1 34,9 39,6 57,6 52,1
15,7 10,5 18,9 11,9 10,1 36,8 36,6 35,4 31,9 34,2 59,4 50,3
13,7 12,0 14,6 16,4 14,3 39,9 32,7 39,2 33,2 30,3 50,5 53,9
16,6 18,5 16,6 19,5 37,3 37,8 34,3 31,4 38,9 30,9 x 53,1
14,2 15,1 19,5 35,1 31,2 34,8 39,5 31,7 34,4 60,0 58,6
16,3 19,1 32,2 36,7 38,5 39,5 33,6 34,3 31,4 53,8 55,2
19,3 36,7 37,9 38,1 x 36,5 33,7 x 53,5 52,8
17,3 35,2 39,8 39,2 36,5 33,7 39,0 56,9 53,5
34,6 39,0 32,9 31,1 31,8 32,8 56,0

i) Realizar duas amostragens estratificadas de tamanho 9 com 3 unidades por


estrato.
ii) Realizar duas amostragens estratificadas proporcionais de tamanho 9.
iii) Realizar duas amostragens AE proporcionais, calculando o tamanho da
amostra para 5% e 1% de erro.
iv) Para cada uma das amostras obtidas nos itens acima, calcule a média dentro
de cada estrato e de cada amostra.

6.2.5 Amostragem por Conglomerado (AC)

Chamamos de conglomerado um agrupamento de elementos da população.


Por exemplo, numa população de domicílios de uma cidade, os quarteirões formam
64

conglomerados de domicílios. Ao avaliar a qualidade das laranjas de um


carregamento, as caixas de laranja são os conglomerados.
Uma amostra por conglomerado é uma AAS na qual cada unidade de
amostragem é um grupo ou conglomerado de elementos da população. O primeiro
passo para se usar este processo é especificar conglomerados apropriados (os
elementos em um conglomerado devem ter características similares). Como regra
geral, o número de elementos de um conglomerado deve ser pequeno em relação
ao tamanho da população e o número de conglomerados, razoavelmente grande.
Tanto no caso da AE como no caso da AC, a população deve estar dividida
em grupos. Na AE seleciona-se uma AAS dentro de cada grupo (estrato),
enquanto que na AC selecionam-se AAS de grupos, e todos os itens dentro dos
grupos (conglomerados) selecionados farão parte da amostra.

Exemplo:

Estimar o rendimento médio (em salários mínimos) dos indivíduos que


moram no bairro Novo Horizonte. O bairro possui oito quarteirões (A, B, ..., H),
conforme a Tabela abaixo. Realizar uma amostragem por conglomerado:

Quarteirão Casa Rendimento Quarteirão Casa Rendimento


1 8 1 9
2 5 4 D 2 8 2
3 10 9 3 Sem moradores
A 4 5 5 1 5
5 8 3 2 8 3
6 5 3 E 3 5 3
7 7 6 4 7 6
1 15
1 15 2 9
2 Sem moradores F 3 6 3 2
B 3 8 4 7 8
4 5 5 5 5 4
5 9 3 1 9 3
1 5 5 G 2 7 1
2 15 15 3 14
C 3 Sem moradores 1 Sem moradores
4 9 9 H 2 9
5 6 6 3 11
6 20 2 4 16
65

6.2.6 Amostragem Sistemática (AS)

Quando os elementos da população se encontram ordenados e a retirada


dos elementos da amostra é feita seguindo um critério pré-definido. O processo
consiste em sortear o primeiro elemento e extrair os demais sistematicamente.
Mais especificamente:
i) Calcula-se o intervalo de seleção, dado por I = N , desprezando as decimais;
n
ii) Sorteia-se o primeiro elemento do conjunto {1, 2, ..., I} e
iii) Completa-se a amostra, extraindo um elemento a cada I elementos.

Exemplos:

a) Com o objetivo de estudar algumas características dos hóspedes de um hotel,


durante o mês de Janeiro, vamos extrair uma amostra sistemática de tamanho
15. Para definirmos o processo de amostragem verificamos o número médio de
hóspedes, nos últimos 3 anos, que foi de 300. Então, 300÷15=20, a cada 20
hóspedes vamos entrevistar um. Devemos sortear um elemento entre os 20
primeiros. Digamos que foi o número 7, ou seja, o sétimo hóspede a chegar no
hotel será entrevistado. Os demais são obtidos pelo intervalo de seleção 20, a
partir do sétimo, resultando na seguinte amostra:
Hóspede 7, Hóspede 27, Hóspede 47, Hóspede 67, . . .

b) Em uma população com 100 elementos, vamos escolher uma amostra de


tamanho 6 usando AS.

c) O esquema abaixo representa um pomar do qual deseja-se obter uma amostra


com 5% das plantas. Indicar as plantas selecionadas utilizando-se uma
amostragem sistemática.

x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x
66

6.2.7 Amostragens não Aleatórias

Amostras não probabilísticas são muitas vezes utilizadas em trabalhos


estatísticos, por simplicidade ou por impossibilidade de se obterem amostras
probabilísticas, como seria desejável. Veremos algumas situações em que uma
amostragem não aleatória pode ser mais adequada do que uma amostragem
aleatória.

a) Amostragem por tipicidade: Consiste em selecionar um subgrupo da


população que, com base nas informações disponíveis, passa a ser considerado
representativo de toda população. Por exemplo, escolher uma cidade típica, com
vistas em um estudo sobre o país.

b) Amostragem por cotas: Assemelha-se muito com a amostragem estratificada


proporcional, porém a seleção dos elementos não precisa ser aleatória. A
população é vista de forma segregada, dividida em diversos subgrupos. Seleciona-
se, para fazer parte da amostra, uma cota de cada subgrupo, proporcional ao seu
tamanho. Este procedimento é usualmente aplicado em levantamento de mercado
e em prévias eleitorais. Tem como principais vantagens o baixo custo e o fato de
conferir alguma estratificação à amostra. Contudo, possibilita a introdução de
vieses devido à classificação que o pesquisador faz dos elementos e à seleção não
aleatória em cada classe.

c) Amostragem por julgamento ou intencionais: Enquadram-se aqui os diversos


casos em que o amostrador escolhe os elementos que julga como típicos da
população que se deseja estudar.

d) Amostragem a esmo ou sem norma: É a amostragem em que o amostrador,


para simplificar o processo, procura ser aleatório sem, no entanto, realizar
propriamente o sorteio usando algum dispositivo aleatório. Por exemplo, se
desejarmos retirar uma amostra de 100 pratos de um depósito com 10.000.

e) Amostragem de população contínua: Nesse caso é impossível realizar


amostragem probabilística, devido à impossibilidade de realizar sorteio. Se a
população for líquida ou gasosa, o que se costuma fazer, com resultado
satisfatório, é homogeneizá-la e retirar uma amostra. Tal procedimento pode
também ser usado no caso de material sólido.
67

EXERCÍCIOS

1) Numa empresa com 1000 funcionários, deseja-se estimar a percentagem de


funcionários favoráveis a um certo programa de treinamento. Qual deve ser o tamanho
de uma amostra aleatória simples que garanta, com alto nível de confiança, um erro
amostral não superior a 5%?

2) Considere a seguinte população de 40 crianças do sexo masculino (H) e 20 crianças do


sexo feminino (M):

H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
H11 H12 H13 H14 H15 H16 H17 H18 H19 H20
H21 H22 H23 H24 H25 H26 H27 H28 H29 H30
H31 H32 H33 H34 H35 H36 H37 H38 H39 H40
M1 M2 M3 M4 M5 M6 M7 M8 M9 M10
M11 M12 M13 M14 M15 M16 M17 M18 M19 M20

a) Retire desta população de 60 crianças uma amostra aleatória simples de tamanho


n=10. Use a primeira coluna da tabela de números aleatórios.

b) Retire desta população uma amostra aleatória estratificada proporcional de tamanho


n=12, usando sexo como variável estratificadora. Use a segunda coluna da tabela de
números aleatórios para o estrato de homens e a terceira coluna para o estrato das
mulheres.

c) Se o estudo tem por objetivo avaliar o tipo de brincadeira preferida por cada criança,
qual o tipo de amostra você acredita ser a mais adequada? E se for para avaliar o
quociente de inteligência? Justifique suas respostas.

3) Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos:


Administração (914), Transporte (348), Produção (1.401) e Outros (751). Deseja-se
extrair uma amostra entre os empregados para verificar o grau de satisfação em
relação à qualidade da comida do refeitório. Apresente um plano de amostragem para o
problema.

4) Os elementos de uma população estão dispostos numa lista, cuja numeração vai de
1650 a 8840. Descreva como você usaria uma tabela de números aleatórios para obter
uma amostra de 100 elementos. Seria necessário efetuar nova numeração?

5) Deseja-se conhecer a incidência das principais doenças em pomares de laranja da


região. Dispõe-se de um cadastro com o código do produtor (ANEXO III), o município, o
número de plantas e a cultivar utilizada. Utilizando este cadastro, elabore um plano de
amostragem para verificar a incidência de rubelose, gomose, leprose e verrugose.
68

7 CORRELAÇÃO E REGRESSÃO

Nesse texto vamos estudar a associação entre duas variáveis


quantitativas.

7.1 VARIÁVEIS CORRELACIONADAS

O termo correlação significa relação em dois sentidos e é usada em


estatística para designar a “força” que mantêm “unidos” dois conjuntos de
valores. Duas variáveis X e Y estão positivamente correlacionadas quando elas
caminham num mesmo sentido, ou seja, elementos com valores pequenos de X
tendem a ter valores pequenos de Y e elementos com valores grandes de X
tendem a ter valores grandes de Y. Estão negativamente correlacionadas quando
elas caminham em sentidos opostos, ou seja, elementos com valores pequenos de
X tendem a ter valores grandes de Y e elementos com valores grandes de X
tendem a ter valores pequenos de Y.
As variáveis peso e altura, por exemplo, apresentam-se, em geral
correlacionadas positivamente, pois a maioria dos indivíduos altos também é
pesada, enquanto que a maioria dos indivíduos baixos são leves. Por outro lado, no
Brasil, as variáveis renda familiar e número de elementos da família costumam se
apresentar correlacionadas negativamente, pois as famílias de baixa renda, em
geral, tendem a ter mais filhos do que as de alta renda.

7.2 DIAGRAMAS DE DISPERSÃO

Uma maneira de visualizarmos se duas variáveis apresentam-se


correlacionadas é através do diagrama de dispersão, no qual os valores das
variáveis são representados por pontos, num sistema cartesiano. Esta
representação é feita sob a forma de pares ordenados (X, Y), onde X é um valor
observado de uma variável e Y é o correspondente valor da outra variável.

Exemplos:

1) Construa o diagrama de dispersão dos dados das Tabelas 1 e 2:

Tabela 1: Dados fictícios.


X Y
2 8
3 6
4 4
5 5
6 2
69

Tabela 2: Dados fictícios.


X Y
101 3,2
193 4,6
42 2,8
72 3,0
205 4,9

2) Sejam X = nota de matemática na prova do vestibular e Y = nota final na


disciplina de cálculo. Estas variáveis foram observadas em 20 alunos, ao final do
primeiro semestre de um curso de engenharia. Os dados são apresentados a
seguir:

X Y X Y X Y X Y X Y
39 65 43 78 21 52 64 82 65 88
57 92 47 89 28 73 75 98 47 71
34 56 52 75 35 50 30 50 28 52
41 70 70 50 80 90 32 58 67 88

a) Construa o diagrama de dispersão e verifique se existe correlação entre os


dados observados destas duas variáveis.

b) Existe algum aluno que foge ao comportamento geral dos demais (ponto
discrepante)?

Os diagramas de dispersão, além de permitirem visualizar uma possível


correlação nos dados observados, podem também indicar alguns outros aspectos
relevantes na análise exploratória de dados, como por exemplo, pontos
discrepantes.
É importante ressaltar que o conceito de correlação refere-se a uma
associação numérica entre duas variáveis, não implicando, necessariamente, uma
relação de causa e efeito, ou mesmo numa estrutura de interesse prático. Se
observarmos, por exemplo, as variáveis “população brasileira” e “venda de carros
japoneses” ao longo dos últimos anos, eles devem se apresentar correlacionadas
positivamente, pois ambas estão aumentando com o tempo. Contudo, em termos
práticos, esta correlação não tem qualquer interpretação relevante.
A análise de dados para verificar correlações é usualmente feita em
termos exploratórios, onde a verificação de uma correlação serve como um
elemento auxiliar na análise do problema em estudo. Ou seja, o estudo da
70

correlação numérica entre as observações de duas variáveis é geralmente um


passo intermediário na análise de um problema.

7.3 COEFICIENTE DE CORRELAÇÃO DE PEARSON (rXY)

Freqüentemente estamos interessados em estudar a maneira como duas


variáveis estão associadas e quantificar esse grau de associação. Uma medida do
grau de associação linear entre as duas variáveis, que independe das unidades de
medidas de x e y, é o coeficiente de correlação de Pearson (rXY) dado por:

n n

∑ xi yi − n.x .y ∑x y i i
rXY = i =1
ou rXY = i =1

n 2  n 2  n.S X .s y
∑ j −  .∑ y j − n. y 
2 2
x n .x
 j =1   j =1 

Para qualquer conjunto de dados, o valor do coeficiente de correlação de


Pearson, r, estará no intervalo de -1 a 1. Será positivo quando os dados
apresentarem correlação linear positiva; será negativo quando os dados
apresentarem correlação linear negativa.
O valor de r será tão mais próximo de 1 (ou de -1) quanto mais forte for a
correlação nos dados observados. Teremos r = +1 se os pontos estiverem
exatamente sobre uma reta ascendente (correlação linear positiva perfeita). Por
outro lado, teremos r =-1 se os pontos estiverem exatamente sobre uma reta
descendente (correlação linear negativa perfeita). Quando não houver correlação
nos dados, r acusará um valor próximo de 0 (zero).

<----------------------------------- valor de r ------------------------------------->


-1 0 +1

Exemplos de diagramas de dispersão e correspondentes coeficientes de


correlação de Pearson:

r = -1 -1 < r < 0 r=0 0<r<1 r=1

O coeficiente de correlação linear determina o nível de relação linear


entre duas variáveis. Assim:
71

r = +1: Perfeita correlação linear positiva - Todos os pares de valores das


observações estão contidos numa mesma reta com declividade positiva.

r próximo de +1: Forte correlação linear positiva - A maioria dos pares de


valores das observações estão próximos de uma reta com declividade positiva.

r próximo de +0: Fraca correlação linear positiva - A maioria dos pares de


valores das observações estão afastados de uma reta com declividade positiva.
Os pares de valores formam uma nuvem sugerindo tendência de declividade
positiva.

r=0: Não existe nenhuma relação linear - Todas as observações estão


afastadas da reta formando uma nuvem sem nenhuma tendência nem declividade.

r próximo de -0: Fraca correlação linear negativa - A maioria dos pares de


valores das observações estão afastados de uma reta com declividade negativa.
Os pares de valores formam uma nuvem sugerindo tendência de declividade
negativa.

r próximo de -1: Forte correlação linear negativa - A maioria dos pares de


valores das observações estão próximas de uma reta com declividade negativa.

r = -1: Forte correlação linear negativa - A maioria dos pares de valores das
observações estão próximos de uma reta com declividade negativa.
72

EXERCÍCIOS

Elabore um diagrama de dispersão e calcule rXY para os exercícios 1 e 2.

1) Massa seca (g) das raízes (x) e da parte aérea (y) de 15 plantas de mandioca:

Planta x y
1 116,1 362,7
2 231,9 463,5
3 462,2 632,9
4 615,7 685,5
5 764,8 698,3
6 63,1 311,9
7 192,9 372,2
8 338,8 477,9
9 504,5 460,5
10 589,8 530,6
11 168,1 324,4
12 312,2 364,5
13 479,6 428,5
14 600,6 541,2
15 786,5 517,8

2) Condutividades elétricas (x) e porcentagens de germinação no campo (y), de


sementes de milho provenientes de 19 diferentes lotes de mesma idade.
Lote X Y
1 23,95 56,5
2 27,19 60,0
3 27,19 58,5
4 22,70 67,0
5 22,87 71,0
6 23,35 57,0
7 27,33 58,0
8 25,12 68,5
9 27,18 49,5
10 26,39 59,0
11 27,16 57,0
12 26,50 59,5
13 25,82 54,0
14 23,36 59,0
15 24,10 36,0
16 23,87 60,0
17 22,79 59,0
18 23,42 58,0
19 26,51 45,5
73

3) Um motorista submeteu-se a um teste onde deveria percorrer um trajeto a


uma velocidade constante, durante determinado tempo. Ele não conseguiu manter
exatamente uma velocidade constante, algumas vezes precisou aumentar a
velocidade e outros diminuir. As distâncias percorridas de acordo com o tempo,
em minutos, estão na tabela abaixo.

x = tempo (min) 0 1 2 3 4 5
y = distância percorrida (Km) 0 1,3 3,8 4,3 6,7 7,3
Vimos até aqui como quantificar o grau de associação entre duas variáveis
quaisquer x e y por meio do coeficiente de correlação. Estudaremos agora, como
obter uma função linear que relacione essas duas variáveis.

7.4 REGRESSÃO LINEAR SIMPLES

A diferença básica entre o estudo das correlações e uma análise de


regressão é que esta supõe uma relação de casualidade entre X e Y, descrita em
termos de uma relação matemática. A aplicação da análise de regressão
geralmente feita sob um referencial teórico, que justifique uma relação
matemática de casualidade.
O modelo estatístico-matemático de regressão, em sua formulação mais
simples, relaciona uma variável Y, chamada variável resposta ou dependente, com
uma variável explicativa ou independente.
Assim, num estudo de correlações, a análise de regressão também parte de
um conjunto de observações pareadas (x, y) relativas às variáveis X e Y. Diremos
que um dado valor de y depende, em parte, do correspondente valor de x. Por
exemplo, a altura de um indivíduo (y) depende, em parte, da altura média de seus
pais (x). Simplifica-se esta dependência por uma relação linear entre x e y, tal
como:

y = a + bx

Fixando valores para a e b, a equação y = a + bx é a equação de uma reta.


Por exemplo, se a = 1 e b = 2, a equação y = 1 + 2x representa uma reta, num
par de eixos cartesianos.

x y
0
1
2
3
4
74

O coeficiente b fornece uma estimativa da variação esperada de Y a partir


da variação de uma unidade em X. O sinal do coeficiente indica o sentido da
variação. E um conjunto de observações (x, y), em geral, os pontos não estão
exatamente sobre uma reta, mas flutuam em torno de alguma reta imaginária.
Então, um modelo mais adequado para um par de observações é:

y = a + bx + e

em que e representa o efeito aleatório, isto é, o efeito de fatores que estão


afetando a observação y de forma aleatória.

7.4.1 Estimativas dos Parâmetros a e b

A idéia básica da construção da parte estrutural do modelo, supostamente


linear, é encontrar a reta que passe mais próximo possível dos pontos
observados. Representaremos esta reta por y = a + bx e chamaremos de reta
de regressão ou equação de regressão.

De todas as retas que podem ser traçadas entre os pontos experimentais,


a reta que usa as estimativas de mínimos quadrados para a e b é a que dá a menor
soma de quadrados dos erros. O chamado método de mínimos quadrados fornece
as seguintes expressões para a equação de regressão:

n.∑ ( X .Y ) − ∑ X .∑ Y
b= e a = y − bx
n.∑ ( X 2 ) − ( ∑ X )2

n: número de pares (x, y) observados (tamanho da amostra); ∑ ( X .Y ) : somatório


dos produtos x.y.
75

EXERCÍCIOS

1) Com o objetivo de se estudar a marcha de absorção de Mg pelo milho (parte


aérea) foi conduzido um ensaio, cujos dados estão na tabela a seguir:

Tabela 1: Número de dias após o plantio do milho (x) e o teor de Mg (y), em


mg/planta na parte aérea.
x y
40 150
60 200
80 450
100 500
120 800

a) Construir o diagrama de dispersão.


b) Traçar sobre o diagrama de dispersão uma reta que aparentemente se ajuste
bem aos dados.
c) Obter a equação da reta traçada.
d) Estimar o teor de Mg (y) para 50, 70 e 110 dias após o plantio.
e) Para qual intervalo de x você acha que a função deve ser utilizada?

2) Paro os dados da tabela a seguir, estime e interprete os parâmetros da


equação de regressão.

Tabela 2: Massa seca (g) das raízes (x) e da parte aérea (y) de 15 plantas de
mandioca.
MS Parte
Planta MS Raiz
Aérea
1 116,1 362,7
2 231,9 463,5
3 462,2 632,9
4 615,7 685,5
5 764,8 698,3
6 63,1 311,9
7 192,9 372,2
8 338,8 477,9
9 504,5 460,5
10 589,8 530,6
11 168,1 324,4
12 312,2 364,5
13 479,6 428,5
14 600,6 541,2
15 786,5 517,8
76

3) A tabela a seguir relaciona os pesos (em centenas de Kg) e as taxas de


consumo de combustível em rodovia (Km/L) numa amostra de 10 carros de
passeios novos.

Peso 12 13 14 14 16 18 19 22 24 26
Consumo 16 14 14 13 11 12 09 09 08 06

a) Calcule o coeficiente de correlação de Pearson.


b) Considerando o resultado do item (a), como você avalia o relacionamento entre
peso e consumo, na amostra observada?
c) Para estabelecer uma equação de regressão, qual deve ser a variável
dependente e qual deve ser a variável independente? Justifique a sua resposta.
d) Estabeleça a equação de regressão, considerando a resposta do item (c).
e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d).
f) Qual o consumo esperado para um carro de 200Kg? Você considera seu estudo
capaz de predizer o consumo esperado de um veículo com o peso de 7000 Kg?
Justifique sua resposta.

4) Para os conjuntos de dados a seguir, calcule o coeficiente de correlação linear


de Pearson, ajuste uma equação de regressão linear e interprete os coeficientes
a e b:

a) Uma indústria submete seus novos operários a um teste de aptidão (x) e três
meses depois mede a produtividade destes operários:
Operário Aptidão (x) Produtividade (y)
A 22 45
B 25 48
C 15 25
D 19 33
E 22 40
F 18 30

b) Os dados abaixo se referem ao resíduo de cloro em uma piscina em vários


momentos, após ter sido tratada com produtos químicos:

Número de Horas Resíduo de cloro (ppm)


0 2,2
2 1,8
4 1,5
6 1,4
8 1,1
10 1,1
12 0,9
77

5) Uma reação química foi realizada sob diferentes condições de pressão e


temperatura. Em cada caso foi medido o tempo necessário para que a reação se
completasse:

Condição Temperatura (ºC) Pressão (atm) Tempo (s)


1 20 1,5 9,4
2 30 1,5 8,2
3 30 1,2 9,7
4 40 1,0 9,5
5 60 1,0 6,9
6 80 0,8 6,5

Obter o coeficiente de correlação e a equação de regressão linear do tempo (y)


em relação à temperatura (x1) e à pressão (x2).

6) Determine o coeficiente de correlação linear de Person e a reta de regressão


linear para os dados abaixo:

x 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 25,5 24,7 23,1
x: concentração de uma substância (mg/L); y: ganho de peso (Kg).

7) Os dados a seguir referem-se a um experimento cujo objetivo foi investigar o


efeito de doses crescentes de nitrogênio (kg/ha) no teor de PB (%) em folhas de
aveia.

Dose de N (kg/ha) 0 60 120 180


PB (%) 13,42 15,76 18,22 20,52

a) Calcule o coeficiente de correlação linear de Pearson;


b) Ajuste a equação de regressão linear simples;
c)Interprete os resultados;
d) Qual deve ser a dose de N para que se tenha aveia com 17% de PB? E se forem
aplicados 150 kg/ha de N, qual o teor de PB?
78

8) Realizou-se uma pesquisa para verificar o efeito de doses crescentes de N


(kg/ha) sobre a produtividade de milho (kg/ha). Para tanto, o pesquisador
realizou um experimento com três repetições e os resultados são dados a seguir:

Dose de N REPETIÇÕES
(kg/ha) 1 2 3
0 2786 2443 3786
60 5066 5289 3880
120 6491 6586 6994
180 7982 7826 8028

a) Construa um diagrama de dispersão considerando todas as repetições.


Comente sobre a variabilidade dos dados.
b) Com as médias, ajuste uma equação de regressão linear simples e interprete
os resultados.
c) Estime o rendimento médio da lavoura para aplicações de 100 e 140 kg de
N/ha.

9) Um pesquisador desejava estimar o efeito de 0, 11, 13 e 15 t/ha de matéria


seca de quatro leguminosas tropicais sobre o rendimento de grãos de trigo
(g/vaso). Obteve as seguintes equações:

Leguminosa Parâmetro
a b R2
Guandu 5,655 0,1697 0,81
Mucuna 4,966 0,2328 0,94
Crotalária 5,427 0,0892 0,77
Lab-lab 5,927 0,2769 0,98

a) Qual a leguminosa proporciona a maior taxa de incremento no rendimento de


grãos de trigo?
b) Qual rendimento de grãos é esperado quando se aplica 10 t/ha de MS?E
quando não se aplica nada?
79

10) Um estudo foi realizado para verificar o efeito de doses crescentes de N


aplicados via esterco de suínos n os teores de N encontrados na matéria seca de
aveia (kg/ha).

Dose de N REPETIÇÕES
(kg/ha) 1 2 3
0 6,9 6,7 6,4
60 18,7 16,4 16,3
120 28,7 29,4 26,3
180 50,5 49,2 52,3

a) Ajuste equações para os teores de N na MS utilizando todas as observações e


utilizando as médias. Interprete os resultados.
b) Verifique se há diferença entre as variâncias dentro de cada dose.

11) Um pesquisador deseja estimar o efeito de doses crescentes de nitrogênio,


associadas a diferentes plantas de cobertura, sobre o rendimento de grãos de
milho. Obteve as seguintes equações:

Planta de Parâmetros
Cobertura a b c
Aveia-Preta 5441 43,68 -0,16
Centeio 4596 41,78 -0,16
Ervilhaca 6154 25,15 -0,10
Nabo 4402 2542 -0,08

a) Qual planta de cobertura do solo confere o melhor rendimento de grãos de


milho?
b) Para cada planta de cobertura, calcule a dose de Nitrogênio que confere a
máxima eficiência técnica (MET) e a máxima eficiência econômica (MEE).

Obs.: A MET é obtida igualando-se a zero a derivada de primeira ordem das


equações de regressão quadráticas; A MEE é obtida igualando-se a derivada de
primeira ordem das equações de regressão quadráticas à relação de custo
unitário do fertilizante nitrogenado pelo preço do produto (milho) – considere a
relação 5,4:1 e acrescente 20% devido aos riscos de perdas de N em anos com
déficit hídrico.
80

ANEXOS
81

ANEXO I - REVISÃO DE MATEMÁTICA

1 PRINCÍPIO FUNDAMENTAL DA CONTAGEM – “MULTIPLICAÇÃO DAS ESCOLHAS”

i) Em um estudo médico, os pacientes são classificados pelo tipo de sangue


(A, B, AB ou O) e de acordo com a pressão (Baixa, Normal e Alta). De quantas
maneiras um paciente pode ser classificado?

ii) Lançando-se simultaneamente um dado e uma moeda, quantos são os


possíveis resultados?

MOEDA
DADO Cara (c) Coroa (k)
1
2
3
4
5
6

A tabela apresenta todos os resultados de um experimento. O número de


elementos dessa matriz é igual ao número de resultados possíveis do
experimento. Como a matriz possui 6 linhas e 2 colunas, o número de elementos
que a compõe é:

x =
nº de resultados nº de resultados nº de resultados
possíveis no dado possíveis na moeda possíveis do
experimento
PRINCÍPIO:
Se um experimento A apresenta n resultados distintos e um experimento B
apresenta k resultados distintos, então o experimento composto de A e B, nessa
ordem apresenta nk resultados distintos.

Exemplo:

Uma montadora de automóveis apresenta um carro em quatro modelos


diferentes e cinco cores diferentes. Um consumidor que quiser adquirir esse
veículo terá quantas opções de escolha?

Esse princípio pode ser generalizado para mais de dois experimentos!


82

Exemplos:

a) Lançando um dado e uma moeda e retirando-se uma bola de uma urna que
contém quatro bolas: Azul (A), Vermelha (V), Preta (P) e Branca (B), quantos são
os possíveis resultados?
BOLA

DADO e MOEDA A V P B

b) Quantos números naturais de três algarismos podem ser formados com os


algarismos 1, 2, 6, 8 e 9?

2 PRINCÍPIO ADITIVO DA CONTAGEM:

Teorema: Sendo A e B conjuntos finitos, o número de elementos da união


de A e B é dado por:
n(A ∪ B) = n(A) + n(B) – n(A ∩ B),
em que o símbolo n( ) representa o número de elementos do conjunto indicado
entre parênteses.

Vamos interpretar esse teorema através do seguinte diagrama:

A B

Para contar os elementos de A ∪ B , vamos inicialmente contar os


elementos de A:
83

A B

Agora, vamos contar os elementos de B:

A B

Note que os elementos da intersecção foram contados duas vezes. Para


corrigir esse “erro” devemos subtrair dessa contagem o número de elementos da
intersecção A ∩ B , isto é: n(A ∪ B) = n(A) + n(B) – n(A ∩ B).

Nota: Se os conjuntos A e B forem disjuntos, isto é, A ∩ B = Ø então:


n(A ∪ B) = n(A) + n(B)

EXERCÍCIOS

1) Foram medidas as estaturas dos alunos de uma classe. Observou-se que 19 alunos têm estatura
até 1,70m e 10 alunos têm estatura maior que 1,70m. Quantos alunos havia na classe?

2) Quantos números naturais de quatro ou cinco algarismos distintos podem ser formados com os
algarismos 1, 2, 3, 4, 5 e 6?

3) Quantos números naturais de três algarismos distintos podem ser formados com os algarismos
0, 1, 2, 6 e 8?

4) Uma pessoa arrumou bolinhas de 1cm de diâmetro em camadas superpostas iguais em uma caixa
cúbica de 10cm de aresta. Quantas bolinhas utilizou?

5) Duas linhas de ônibus vão de uma cidade A para uma cidade B e três vão da cidade B para outra
cidade C. De quantos modos diferentes um usuário dessas linhas pode ir de A para C, passando
por B?

6) Durante um campeonato de futebol, disputado por 24 países, as tampinhas de Coca-Cola


traziam palpites sobre os países que se classificariam nos três primeiros lugares. Se, em cada
tampinha, os três países são distintos, quantas tampinhas diferentes poderiam existir?

7) Um shopping possui 4 portas de entrada para o andar térreo, 5 escadas rolantes ligando o
térreo ao primeiro pavimento e 3 elevadores que conduzem do primeiro para o segundo pavimento.
84

De quantas maneiras diferentes uma pessoa, partindo de fora do shopping pode atingir o segundo
pavimento usando os acessos mencionados?

8) Uma linha ferroviária tem 16 estações. Quantos tipos de bilhetes devem ser impressos, se
cada bilhete deve registrar a estação de origem e a de destino?

9) Quantos números naturais de quatro algarismos distintos podem ser formados com os
algarismos 3, 4, 5, 6, 7, 8 e 9?

10) Quantos números naturais de cinco algarismos distintos podem ser formados com os
algarismos 0, 3, 4, 5, 6, 7, 8 e 9?

11) Com os dígitos 1, 2, 3, 4, 6 e 8, podem-se formar x números ímpares, com três algarismos
distintos cada um. Determine x.

12) Os conjuntos M e N são finitos. Sabe-se que n(M ∪ N) = 38, n(M ∩ N) = 12 e n(M) = 35;
então quanto vale n(N)?

13) Quantos números naturais de 4 algarismos distintos podem ser formados com os algarismos
2, 3, 4, 5, 6 e 7 de modo que o algarismo das unidades seja menor que 4 ou maior que 5?

14) Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números naturais de três algarismos podem ser
formados de modo que o algarismo das centenas seja ímpar ou múltiplo de 3?

15) Uma pessoa vai retirar dinheiro num caixa eletrônico de um banco. Na hora de digitar a senha,
esquece-se do número, mas lembra-se que tem 5 algarismos, começa com 6, não tem algarismos
repetidos e tem o algarismo 7 em alguma posição. Qual é o número máximo de tentativas para
acertar a senha?

3 DEFINIÇÃO DE FATORIAL

Seja n um número natural, n ≥ 2 . Define-se fatorial de n (n!), como o


produto dos números naturais consecutivos: n, (n-1), (n-2), ... , 1 isto é
n! = n.(n-1).(n-2). ... . 1

Exemplos:

5! = 8! = 9!
=
6!

4 ARRANJOS SIMPLES

A regra da multiplicação de escolhas e sua generalização aplicam-se


freqüentemente quando fazemos várias escolhas de um único conjunto e temos
interesse na ordem em que são feitas.
85

Com os elementos do conjunto I={a, b, c, d}, formemos todas as seqüências


possíveis de dois elementos distintos:

Um arranjo simples de dois elementos de I é qualquer seqüência formada


por dois elementos distintos de I.

Seja I = {a1 , a 2 , a 3 , K , a n } um conjunto formado por n elementos e seja p um


número natural tal que p ≤ n . Chama-se arranjo simples de p elementos de I toda
seqüência formada por p elementos distintos de I.

Dois arranjos simples quaisquer se diferenciam pela ordem ou pela


natureza dos elementos que os compõem.

(a, b) ≠ (b, a) --» diferem pela ordem;


(a, b) ≠ (c, d) --» diferem pela natureza;

Exemplos:

a) Determine todas as seqüências possíveis, ou seja, os AS de I={5, 6, 7, 8}


tomados dois a dois;

b) Se 20 quadros são apresentados em uma mostra de arte, de quantas maneiras


os juízes podem conferir um primeiro e um segundo prêmio?

É conveniente dispormos de uma fórmula para o número total de Arranjos


de p objetos selecionados de um conjunto de n objetos distintos:

n!
An , p = ( An , p = Anp = n Ap )
(n − p )!

Exemplos:

a) A6,4

b)A5,2 + A3,3

c) Num teatro, uma fila possui exatamente 20 cadeiras numeradas. Determine o


número de maneiras distintas de 10 pessoas se sentarem nessa fila.

d) Dez atletas participam de uma corrida de atletismo. Serão premiados apenas


os três primeiros colocados, não podendo haver empate. Qual é o número de
maneiras de serem distribuídos os prêmios?
86

5 PERMUTAÇÃO SIMPLES

Considere o conjunto I={a, b, c}. Os arranjos simples dos três elementos


de I tomados três a três são:

Cada um desses arranjos simples é chamado de Permutação Simples dos


elementos de I. Uma permutação simples dos elementos de I é qualquer
seqüência de elementos distintos formada por todos os elementos de I.

Seja I = {a1 , a 2 , a 3 , K , a n } um conjunto formado por n elementos. Chama-se


permutação simples de n elementos de I todo arranjo simples desses n
elementos tomados n a n.

Duas dessas permutações se diferenciam apenas pela ordem dos


elementos.

(a, b, c) ≠ (b, c, a) --» diferem pela ordem;

Exemplos:

a) Quantas são as permutações simples de I = {1, 2, 3}?

b) Quantas permutações simples podemos formar com os elementos de I = {a, b,


c, d}?
Dispomos de uma fórmula para o número total de Permutações de n
objetos tomados n de cada vez:

Pn = An, n =

Exemplos:

a) De quantas maneiras distintas cinco pessoas podem formar uma fila indiana?

b) De quantas maneiras diferentes podemos dispor, numa mesma prateleira de


uma estante, quatro livros de matemática e três livros de física de modo que
livros da mesma matéria permaneçam juntos?

5.1 Permutação com elementos repetidos

Se de n objetos, n1 são idênticos, n2 são idênticos, e os restantes (se


houver) são todos distintos, o número de permutações desses n objetos tomados
todos de uma vez é:
87

n!
Pn( n1 , n2 ) =
n1!.n2!
Generalizando:

n!
Pn( n1 , n2 ,..., nk ) =
n1!.n2 !.L.nk !

Exemplos:

a) Quantas são as permutações das letras da palavra ESTATÍSTICA?

b) Qual o número de anagramas da palavra GARRAFA?

6 COMBINAÇÃO SIMPLES

Há muitos problemas em que precisamos saber o número de maneiras de


escolher p objetos de um conjunto de n objetos, sem que nos interesse a ordem
em que se faz a escolha.
Dado o conjunto I={a, b, c, d}, formemos todos os subconjuntos de I com
três elementos:

Tais subconjuntos são chamados de combinações simples dos quatro


elementos de I tomados três a três. Ou seja, uma combinação simples de três
elementos de I é qualquer subconjunto de I formado por três elementos.

Seja I = {a1 , a 2 , a 3 , K , a n } um conjunto formado por n elementos e seja p,


p ∈Ν e p ≤ n . Chama-se combinação simples de p elementos de I todo
subconjunto de I formado por p elementos.

Duas combinações simples quaisquer se diferenciam apenas pela natureza


dos elementos e não pela ordem de apresentação desses elementos.

(a, b, c) ≠ (a, b, d) --» diferem pela natureza;


(b, c, d) = (c, b, d) --» a ordem dos elementos não altera o conjunto;

Designando uma tal escolha como combinação de n objetos tomados p de


cada vez, denotamos o número dessas combinações como:

n!
Cn , p = ( Cn, p = n C p = Cnp )
p!(n − p)!

Exemplo:
88

Os pontos A, B, C, D, E estão dispostos em uma circunferência. Quantos


triângulos ficam determinados por estes pontos?

Como diferenciar ARRANJO de COMBINAÇÃO?

Constrói-se um dos agrupamentos sugeridos pelo problema e, a seguir,


mudamos a ordem de apresentação dos elementos desse agrupamento:

i) Se obtivermos um agrupamento diferente do original --> ARRANJO;


ii) Se obtivermos um agrupamento igual ao original --> COMBINAÇÃO.

Exemplos:

a) Uma papelaria tem 15 cartões postais cênicos. De quantas maneiras podemos


escolher quatro desses cartões?

b) De quantas maneiras distintas os 52 membros de um sindicato podem escolher


um presidente, um vice-presidente, um secretário e um tesoureiro?
RESUMO:

n!
A ordem altera = ARRANJO: Anp =
(n − p )!

n!
A ordem não altera = COMBINAÇÃO: C np =
p! (n − p )!
EXERCÍCIOS

1) Determine a quantidade de números naturais de cinco algarismos distintos formados pelos


algarismos do conjunto I = {1, 2, 3, 4, 5, 6, 7, 8, 9}.

2) De quantos modos podemos dispor cinco meninas e quatro meninos em fila indiana de modo que
as crianças de mesmo sexo fiquem juntas?

3) Quantos números podemos obter permutando apenas os algarismos pares do número 32546 e
mantendo os algarismos ímpares em suas respectivas posições?

4) Uma comissão de três membros deve ser escolhida dentre sete pessoas. De quantos modos
diferentes se pode escolher a comissão, sabendo que as pessoas que formarem a comissão terão
funções idênticas?

5) Uma comissão de quatro homens e três mulheres deve ser escolhida dentre seis homens e
cinco mulheres. De quantos modos diferentes se pode escolher a comissão, sabendo que as
pessoas que formarem a comissão terão funções idênticas?

6) Quantos triângulos ficam determinados por nove pontos distintos, sendo que cinco deles
pertencem a uma reta r e os outros quatro pertencem a uma reta s paralela a r?
89

7) Considere nove diferentes pontos de uma circunferência. Quantas retas ficam determinadas
por esses nove pontos? E quantos triângulos?

8) Formam-se comissões de três professores escolhidos entre sete de uma escola. Qual o número
de comissões distintas que podem ser formadas?

9) Dispondo-se de abacaxi, acerola, goiaba, laranja, maçã, mamão e melão, calcule de quantos
sabores diferentes pode-se preparar um suco, usando-se três frutas distintas.

10) Numa primeira fase de um campeonato de xadrez, cada jogador joga uma vez contra todos os
demais. Nessa fase foram realizados 78 jogos. Quantos eram os jogadores?

11) Dentre seis senadores e cinco deputados será escolhida uma comissão de três senadores e
dois deputados. De quantas maneiras diferentes essa comissão pode ser formada?

12) O auditório de um teatro é composto por n cadeiras. De quantas maneiras diferentes as três
primeiras pessoas que chegarem para assistir a um espetáculo podem escolher seus lugares?

An ,3
13) Sendo n um número natural e n ≥ 3, determine a razão .
An −1, 2

14) Sendo uma placa de automóvel formada por três letras seguidas de quatro algarismos,
quantas placas podem ser formadas por duas letras distintas seguidas por quatro algarismos
distintos? (Considere 26 letras e 10 algarismos).

15) De quantas maneiras diferentes o diretor de um laboratório pode escolher dois químicos
entre sete candidatos e três médicos entre nove candidatos?
90

ANEXO II - TABELA DE NÚMEROS ALEATÓRIOS

1 8 9 6 4 8 6 2 0 8 7 3 8 4 6 5 3 1 1 3 2 6 9 0 1 7 0 5 3 9 8 5 9 2
2 3 3 6 0 4 2 4 8 0 4 3 0 0 7 5 3 4 9 0 9 5 5 0 6 5 5 2 8 3 8 3 1 2
5 5 3 1 6 7 1 2 0 7 7 0 4 9 9 7 2 8 6 5 1 0 7 4 4 5 6 2 9 9 7 9 7 4
8 6 7 2 3 7 8 1 2 7 8 0 9 7 2 3 9 1 0 6 6 4 5 7 0 6 4 9 1 0 9 8 7 8
7 7 1 0 9 2 8 5 4 1 7 2 8 5 1 7 0 7 5 6 8 0 5 9 9 4 8 3 1 9 1 7 3 0
0 1 1 2 5 1 9 0 2 6 0 2 8 6 5 8 3 2 1 9 2 5 0 3 6 8 5 1 1 7 2 3 1 1
9 9 4 5 9 8 4 2 2 9 9 5 4 1 6 9 5 2 1 5 3 0 7 4 3 8 4 3 1 4 8 3 4 3
6 6 7 6 3 0 9 4 8 3 7 3 5 3 3 2 7 1 3 2 0 7 7 6 3 8 2 3 6 7 2 5 5 1
3 8 4 4 2 5 1 7 2 2 7 1 8 6 1 5 9 1 2 2 1 4 1 5 6 3 8 0 3 1 2 8 7 4
6 5 9 8 3 1 5 5 1 1 5 6 8 9 2 0 7 6 8 9 4 0 6 5 4 6 4 6 7 7 3 1 4 1
7 0 4 4 6 4 4 3 2 0 1 1 8 2 9 9 5 7 4 7 6 5 9 7 5 5 3 1 7 2 2 9 3 9
1 7 6 3 3 5 8 6 6 8 4 0 9 4 5 2 8 9 9 7 3 8 3 6 8 0 5 2 2 5 7 4 0 2
4 8 6 4 0 2 3 5 3 2 4 1 1 1 2 7 7 0 2 4 6 3 3 1 0 3 7 7 8 4 5 7 7 3
8 8 0 4 1 0 8 6 4 5 4 9 4 2 1 0 2 1 0 2 7 1 0 9 2 8 5 9 6 5 8 9 3 4
6 6 2 0 2 1 7 3 6 6 8 0 3 7 2 2 8 5 9 5 9 0 2 7 3 2 9 6 1 4 4 3 9 2
5 7 6 4 6 2 5 5 1 8 3 2 4 6 8 8 3 8 2 9 3 0 0 4 6 5 6 6 1 6 5 0 0 6
6 4 9 4 2 4 7 4 9 6 2 8 7 2 4 2 9 8 6 4 8 2 9 6 2 5 4 0 4 8 8 7 2 1
4 4 0 6 7 8 7 8 3 1 4 6 0 6 5 7 9 3 2 9 8 9 2 1 8 8 0 0 2 9 6 3 9 9
1 5 6 6 5 0 8 0 5 6 1 1 8 7 6 1 9 7 5 3 5 3 3 4 6 1 7 9 4 0 7 7 6 6
2 6 9 1 1 1 0 6 4 9 0 7 7 6 0 1 1 2 5 6 5 6 2 2 2 3 2 2 0 7 3 3 0 6
4 0 3 4 3 2 9 5 1 0 1 5 2 6 1 7 9 6 0 6 0 1 9 5 2 3 0 3 6 6 9 6 7 4
4 3 3 8 2 0 4 1 2 1 4 7 5 1 1 1 4 6 8 9 3 1 0 4 1 9 4 4 4 8 7 0 1 7
2 4 7 7 3 5 9 2 5 2 7 4 4 7 3 7 6 6 2 2 8 4 3 9 4 0 1 2 9 4 4 7 7 5
5 6 7 5 8 1 9 4 3 4 2 5 6 5 9 3 6 9 0 7 1 8 7 4 0 3 7 7 5 9 8 9 9 2
9 7 1 6 7 4 1 2 7 2 4 2 4 6 9 5 8 5 0 7 7 0 4 5 0 3 1 6 8 0 5 5 1 5
0 3 6 4 1 0 0 8 2 3 6 2 4 1 4 2 6 5 7 2 7 1 3 4 5 4 4 3 0 4 7 0 2 1
3 0 8 9 4 5 6 3 5 3 0 9 0 7 6 8 2 0 8 4 5 2 3 8 2 3 8 6 0 9 5 0 0 3
0 5 9 8 4 2 3 7 0 2 0 5 6 3 5 4 3 8 7 5 4 3 6 4 8 1 1 4 7 2 9 5 5 9
3 7 2 6 5 2 4 4 1 8 4 3 8 1 7 0 7 4 1 1 4 0 5 3 4 1 7 2 5 5 8 2 6 3
9 6 5 6 8 8 7 0 1 4 8 2 6 1 4 2 5 5 5 4 9 4 1 8 9 1 1 2 7 2 2 2 5 3
8 7 3 0 2 6 4 1 1 7 9 4 1 6 0 1 6 2 8 1 3 8 5 6 7 2 8 0 6 0 5 9 8 2
7 1 1 5 7 9 4 2 5 5 1 3 3 0 4 3 4 8 2 6 3 2 8 5 4 2 4 1 9 9 3 6 8 6
3 2 2 0 5 6 0 0 7 0 9 9 2 4 1 1 1 6 0 7 0 9 2 7 1 7 2 5 3 5 4 8 5 4
8 6 2 0 9 3 7 2 8 9 7 8 4 8 0 8 1 2 1 1 5 8 9 3 8 3 1 3 5 0 8 2 8 2
3 0 8 7 1 1 0 6 0 4 9 2 0 5 7 3 5 7 8 7 6 8 8 7 7 7 7 3 0 4 1 1 5 9
3 7 3 5 6 6 4 0 0 0 3 9 2 7 4 5 8 2 9 9 4 5 4 6 8 8 6 1 5 0 5 4 3 8
5 9 4 5 3 8 8 5 2 0 8 1 9 5 5 3 5 3 2 7 9 8 3 5 0 3 9 6 8 2 3 9 5 4
8 8 9 5 1 4 5 2 6 5 4 4 6 4 2 2 5 6 4 2 3 9 6 3 1 0 5 7 8 3 1 5 2 3
7 4 1 5 6 7 3 3 2 5 6 5 1 6 7 4 0 8 5 6 1 0 7 3 5 6 1 9 5 9 7 8 1 0
4 7 9 4 0 1 2 2 5 4 3 3 1 3 8 5 3 7 7 1 7 5 8 8 8 1 1 9 9 6 1 9 0 4
6 3 4 8 8 3 8 8 8 2 0 7 7 8 8 3 9 2 4 6 2 3 1 2 0 8 9 0 2 5 0 7 2 6
4 8 7 0 4 5 7 8 2 5 0 3 3 6 4 4 5 4 4 4 9 2 6 1 4 7 7 8 1 2 4 8 3 0
1 1 5 5 4 4 9 1 0 8 0 8 1 5 7 3 2 8 9 8 0 3 8 4 9 5 8 7 7 6 6 0 4 9
0 7 9 0 1 2 6 1 2 8 2 3 1 2 0 7 0 3 3 4 6 8 5 9 8 1 6 8 4 1 8 4 0 4
6 3 7 0 6 8 3 8 3 9 8 0 3 0 3 9 5 9 7 4 4 3 2 1 7 0 8 0 7 5 7 8 9 8
6 0 1 0 7 9 1 3 9 2 3 6 6 4 2 6 6 0 6 5 2 9 5 4 1 6 4 3 4 5 1 6 0 1
6 6 1 3 6 4 6 8 9 3 5 5 9 1 5 2 1 7 3 7 6 3 8 7 8 2 1 1 7 5 6 8 1 8
6 8 4 3 7 4 2 8 6 7 1 9 4 9 2 2 6 6 2 2 0 1 3 0 3 4 7 5 0 6 8 9 8 3
6 7 0 5 2 7 7 5 1 7 1 6 0 4 3 3 8 1 4 0 6 2 9 1 0 9 7 5 9 5 3 5 0 0
7 7 7 7 3 5 0 5 2 7 9 5 5 5 6 4 1 7 1 1 4 5 4 4 2 4 8 0 2 1 6 7 1 9
91

ANEXO III - CADASTRO DE PRODUTORES DE LARANJA DOCE

PRODUTOR MUNICÍPIO Nº PLANTAS VARIEDADE


1 FORMOSA DO SUL 122 VALÊNCIA
2 FORMOSA DO SUL 230 VALÊNCIA
3 FORMOSA DO SUL 190 VALÊNCIA
4 FORMOSA DO SUL 150 RUBI
5 FORMOSA DO SUL 100 HAMILIN
6 FORMOSA DO SUL 200 VALÊNCIA
7 FORMOSA DO SUL 250 VALÊNCIA
8 FORMOSA DO SUL 200 RUBI
9 FORMOSA DO SUL 220 VALÊNCIA
10 FORMOSA DO SUL 250 VALÊNCIA
11 FORMOSA DO SUL 115 RUBI
12 FORMOSA DO SUL 215 VALÊNCIA
13 FORMOSA DO SUL 150 RUBI
14 FORMOSA DO SUL 490 VALÊNCIA
15 FORMOSA DO SUL 195 VALÊNCIA
16 IRATI 200 VALÊNCIA
17 IRATI 200 RUBI
18 IRATI 408 VALÊNCIA
19 IRATI 277 RUBI
20 IRATI 200 VALÊNCIA
21 IRATI 100 VALÊNCIA
22 IRATI 130 RUBI
23 IRATI 120 VALÊNCIA
24 IRATI 190 VALÊNCIA
25 IRATI 200 RUBI
26 IRATI 100 RUBI
27 IRATI 100 VALÊNCIA
28 IRATI 350 RUBI
29 IRATI 300 VALÊNCIA
30 IRATI 291 VALÊNCIA
31 IRATI 150 VALÊNCIA
32 IRATI 400 VALÊNCIA
33 IRATI 400 VALÊNCIA
34 IRATI 140 VALÊNCIA
35 IRATI 150 VALÊNCIA
36 IRATI 260 VALÊNCIA
37 IRATI 400 VALÊNCIA
38 IRATI 50 RUBI
39 IRATI 150 VALÊNCIA
40 IRATI 200 VALÊNCIA
41 IRATI 120 VALÊNCIA
42 IRATI 95 RUBI
43 IRATI 113 VALÊNCIA
92

PRODUTOR MUNICÍPIO Nº PLANTAS VARIEDADE


44 IRATI 220 RUBI
45 IRATI 150 VALÊNCIA
46 IRATI 150 VALÊNCIA
47 IRATI 198 VALÊNCIA
48 IRATI 70 RUBI
49 IRATI 50 F. MURCHA
50 IRATI 190 VALÊNCIA
51 IRATI 250 VALÊNCIA
52 IRATI 533 VALÊNCIA
53 IRATI 341 RUBI
54 IRATI 112 VALÊNCIA
55 IRATI 289 VALÊNCIA
56 IRATI 240 VALÊNCIA
57 IRATI 110 RUBI
58 IRATI 660 VALÊNCIA
59 IRATI 550 VALÊNCIA
60 IRATI 75 RUBI
61 IRATI 185 VALÊNCIA
62 MARAVILHA 200 RUBI
63 MARAVILHA 500 VALÊNCIA
64 MARAVILHA 200 RUBI
65 MARAVILHA 400 VALÊNCIA
66 MARAVILHA 100 RUBI
67 MARAVILHA 300 VALÊNCIA
68 MARAVILHA 270 VALÊNCIA
69 MARAVILHA 170 VALÊNCIA
70 MARAVILHA 500 VALÊNCIA
71 MARAVILHA 400 VALÊNCIA
72 MARAVILHA 400 RUBI
73 MARAVILHA 550 VALÊNCIA
74 QUILOMBO 100 TOBIAS
75 QUILOMBO 300 RUBI
76 QUILOMBO 250 VALÊNCIA
77 QUILOMBO 200 VALÊNCIA
78 QUILOMBO 150 VALÊNCIA
79 QUILOMBO 250 RUBI
80 QUILOMBO 185 VALÊNCIA
81 QUILOMBO 100 F. MURCHA
82 QUILOMBO 150 VALÊNCIA
83 QUILOMBO 98 VALÊNCIA
84 QUILOMBO 250 VALÊNCIA
85 QUILOMBO 150 VALÊNCIA
86 QUILOMBO 100 VALÊNCIA
93

PRODUTOR MUNICÍPIO Nº PLANTAS VARIEDADE


87 QUILOMBO 100 VALÊNCIA
88 QUILOMBO 100 RUBI
89 QUILOMBO 250 VALÊNCIA
90 QUILOMBO 150 RUBI
91 QUILOMBO 210 RUBI
92 QUILOMBO 148 VALÊNCIA
93 QUILOMBO 197 VALÊNCIA
94 QUILOMBO 250 VALÊNCIA
95 QUILOMBO 140 VALÊNCIA
96 QUILOMBO 250 VALÊNCIA
97 QUILOMBO 250 VALÊNCIA
98 QUILOMBO 180 VALÊNCIA
99 QUILOMBO 280 VALÊNCIA
100 QUILOMBO 100 VALÊNCIA
101 QUILOMBO 250 RUBI
102 QUILOMBO 200 VALÊNCIA
103 QUILOMBO 100 HAMILIN
104 QUILOMBO 100 RUBI
105 QUILOMBO 240 VALÊNCIA
106 QUILOMBO 85 RUBI
107 QUILOMBO 340 VALÊNCIA
108 QUILOMBO 126 RUBI
109 QUILOMBO 80 VALÊNCIA
110 QUILOMBO 150 RUBI
111 QUILOMBO 400 VALÊNCIA
112 QUILOMBO 270 VALÊNCIA
113 QUILOMBO 150 VALÊNCIA
114 SALTINHO 200 TOBIAS
115 SALTINHO 98 VALÊNCIA
116 SALTINHO 500 RUBI
117 SALTINHO 240 F. MURCHA
118 SALTINHO 500 VALÊNCIA
119 SALTINHO 190 TOBIAS
120 SALTINHO 270 VALÊNCIA
121 SALTINHO 300 VALENCIA
122 SALTINHO 530 VALÊNCIA
123 SALTINHO 100 RUBI
124 SALTINHO 200 VALÊNCIA
125 SALTINHO 520 V ALÊNCIA
126 SÃO BERNARDINO 190 VALÊNCIA
127 SÃO BERNARDINO 300 VALÊNCIA
128 SÃO BERNARDINO 198 VALÊNCIA
129 SÃO BERNARDINO 200 VALÊNCIA

Você também pode gostar