P. 1
livro Bioestatistica

livro Bioestatistica

|Views: 183|Likes:
Publicado porTonnyLeite

More info:

Published by: TonnyLeite on May 02, 2013
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/24/2013

pdf

text

original

LICENCIATURA EM BIO

-
LOGIA























Instituto Federal de Educação, Ciências e Tecnologia de Alagoas
Departamento de Educação a Distância
Universidade Aberta do Brasil
Unidades

Unidade 1 - Conceitos prévios em Estatística
- Introdução Histórica: O que é a estatística
- População e Amostra
- Censo x Amostragem
- Dado e Variável
- Atividades

Unidade 2 - Ferramentas necessárias ao Estudo de Estatística

- Números Aproximados e Arredondamento de dados
- Fração
- Porcentagem
- Somatórios
- Atividades

Unidade 3 - Obtenção de Dados
- Etapas do Método Estatístico
- Apresentação Tabular
- Análise e avaliação dos resultados obtidos
- Tomada de Decisão
- Aplicação do método estatístico através de um projeto de pesquisa
- Elaboração de um questionário
- Um aplicação de questionário
- Codificação dos dados

Unidade 4 - Técnicas de Amostragem
- Técnicas estatísticas de abordagem
- Amostragem Casual ou Aleatória Simples
- Amostragem Proporcional Estratificada
- Amostragem de Conglomerados
- Amostragem Sistemática
- Atividades

Unidade 5 - Séries Estatísticas
- Série Temporal ou Cronológica
- Série Geográfica ou Territorial
- Série Específica ou Qualitativa
- Série Mista, Conjugada ou Composta
- Série de Distribuição de Freqüências
- Atividades

Unidade 6 - Distribuição de Frequências
- Definições Básicas
- Tipos de Freqüências
- Distribuição de Freqüência para dados agrupados em intervalos de classe
- Atividades

Unidade 7 - Gráficos Estatísticos
- Gráficos de Linha
- Gráficos de colunas ou em barras
- Gráficos de colunas ou em barras múltiplas
- Gráfico de colunas comparativas
- Gráficos de setores
- Gráfico Pictorial - Pictograma
- Gráfico polar
- Cartograma
- Atividades

Unidade 8 - Medidas de Posição
- Média Aritmética Simples (dados não agrupados)
- Média Aritmética Ponderada (dados agrupados)
- Mediana
- Moda
- Emprego das medidas de posição
- Atividades




Unidade 9 - Medidas de Variabilidade

- Amplitude total
- Desvio
- Desvio Médio
- Variância e Desvio Padrão
- Interpretação do Desvio Padrão
- Coeficiente de variação
- Atividades

Unidade 10 - Introdução a Probabilidade

- Métodos de Contagem
- Conceitos Básicos
- Regras básicas de probabilidade
- Regras Básicas do Calculo das Probabilidades
- Distribuição de Probabilidades
- Atividades

Unidade 11 - Correlação e Regressão

 Correlação Linear
 Coeficiente de correlação de Pearson
 Regressão – Reta de Regressão
 Atividades










Introdução















1.1 Introdução Histórica

As idéias fundamentais de estudos estatísticos como: contagem, enumeração, re-
gistros de dados, número de nascimentos e de óbitos, estimativas de estoques e recen-
seamentos, já se encontravam presentes nas civilizações antigas. Além da finalidade so-
cial e econômica, existia também a bélica. Por meio da estatística , o Estado sabia quan-
tos bens possuía, como estavam distribuídos e conhecia também sua população. Essas
informações auxiliavam a cobrança de impostos e também o recrutamento militar, pois,
com guerras constantes, era de suma importância avaliar o armamento , saber de quan-
tos jovens o Estado podia contar para treinamento.
A partir do século XVI, foi que surgiram as primeiras informações registradas e or-
ganizadas de fatos sociais em tabuas, isto é, batizados, casamentos, nascimentos, etc..
O termo estatística surge da expressão em latim statisticum collegium palestra
sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que
significa "homem de estado", ou político, e a palavra alemã Statistik, designando a
análise de dados sobre o Estado. A palavra foi proposta pela primeira vez no século XVII,
em latim, por Schmeitzel na Universidade de Lena e adotada pelo acadêmico alemão
Godofredo Achenwall. Aparece como vocabulário na Enciclopédia Britânica em 1797, e
adquiriu um significado de coleta e classificação de dados, no início do século 19.
De acordo com a Revista do Instituto Internacional de Estatística, "Cinco homens,
Hermann Conring,Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William
Petty já receberam a honra de serem chamados de fundadores da estatística, por
diferentes autores.
Alguns autores dizem que é comum encontrar como marco inicial da estatística a
publicação do "Observations on the Bills of Mortality" (1662) de John Graunt.
As primeiras aplicações do pensamento estatístico estavam voltadas para as
necessidades de Estado, na formulação de políticas públicas, fornecendo dados
demográficos e econômicos. A abrangência da estatística aumentou no começo do
século XIX para incluir a acumulação e análise de dados de maneira geral. Hoje, a
estatística é largamente aplicada nas ciências naturais, e sociais, inclusive na
administração pública e privada.
O primeiro levantamento estatístico de que se tem conhecimento se deve a Heró-
doto e se refere a um estudo da riqueza da população do Egito, cuja finalidade era averi-
guar quais eram os recursos humanos e econômicos disponíveis para a construção das
pirâmides, isso no ano de 3050 a. C. No ano de 2238 a. C., o Imperador Chinês Yao orde-
nou a realização de uma Estatística com fins industriais e comerciais. No ano de 1400 a.
C., o famoso faraó egípcio Ramsés II ordenou um levantamento das terras do Egito. Exis-
tem ainda, outros casos de Estatísticas no período antigo da civilização.
Estatística é a ciência que trata do delineamento, coleta, organização, sumarização,
apresentação e análise de dados, bem como, na obtenção de conclusões válidas e toma-
das de decisões em diversos campos, a saber, engenharias, campo da saúde, biologia,
farmácia, biofísica etc. Algumas dessas ciências usam a estatística aplicada tão
extensivamente que elas têm uma terminologia especializada:
- Bioestatística;
- Contabilometria;
- Controle de qualidade;
- Estatística comercial;
- Estatística econômica;
- Estatística engenharia;
- Estatística física;
- Estatística populacional;
- Estatística psicológica;
- Estatística social (para todas as ciências sociais);
- Física quântica;
- Pesquisa operacional;
- Análise de processo e quimiometria (para análise de dados da química analítica e
da engenharia química).
Estatística forma uma ferramenta chave nos negócios e na industrialização como
um todo. É utilizada a fim de entender sistemas variáveis, controle de processos
(chamado de "controle estatístico de processo" ou CEP), custos financeiros (contábil) e
de qualidade e para sumarização de dados e também tomada de decisão baseada em
dados. Em nessas funções ela é uma ferramenta chave, e é a única ferramenta segura.
O crescimento rápido e sustentados no poder de processamento dos computadores
a partir da segunda metade do século XX teve um forte impacto na prática da estatística.
Os modelos estatísticos mais antigos eram quase sempre lineares, mas os computadores
modernos junto com algoritmos numéricos apropriados, causaram um aumento do
interesse nos modelos não-lineares (especialmente redes neurais e árvores de decisão)
assim como na criação de novos tipos, como o modelo linear generalizado e o modelo
multi-nível.
O aumento na capacidade de computação também tem levado à popularização de
métodos que demandam muitos cálculos baseados em resampling, como testes de
permutação e bootstrap, enquanto técnicas como o sampling de Gibbs tem feito com
que os métodos de Bayes fiquem mais fáceis. A revolução informática também tem
levado a um aumento na ênfase na estatística "experimental" e "empírica". Um grande
número de softwares estatísticos, de uso tanto geral como específico estão disponíveis
no mercado. Na medida em que nossa sociedade se tornou muito mais diversificada, o
que comprova a grande importancia dessa ciencia antiga.
Há um século, H. G. Wells dizia: “Raciocinar estatisticamente será um dia tão neces-
sário quanto à habilidade de ler e escrever”. Hoje, problema não é de escassez de infor-
mação, mas como utilizar essas informações abundantes disponíveis para tomar as me-
lhores decisões.
Segundo Fisher (R. A. Fisher) Estatística é o estudo das populações, das variações e
dos métodos de redução de dados
A Estatística desempenha duas grandes funções: Descritiva e Indutiva ou Inferenci-
al.
a) Descritiva – descreve um conjunto de dados variáveis, reduzindo-os a um peque-
no número de medidas que contém toda a informação relevante. Utiliza número
para descrever fatos. Somente descreve e avalia certo grupo (amostra), sem tirar
quaisquer conclusões ou inferências sobre um grupo maior (população).
b) Indutiva ou Inferencial – diz respeito à análise e interpretação de dados amos-
trais. Consiste me obter e generalizar conclusões sobre a população a partir de
uma amostra. Utiliza-se da estimação de parâmetros e verificação de hipóteses,
esta por meio, da aplicação dos testes de significância. Auxilia no delineamento
de experimentos e levantamento para, dentro de uma precisão estipulada, obter-
se a informação desejada livre da influência de fatores perturbadores.
A Estatística fornece os preceitos da casualização, repetição, controle local, os deline-
amentos experimentais e os métodos de amostragem, ou seja, normas lógicas que garan-
tam a validez das comparações entre tratamentos e aumentem a precisão dessas compa-
rações.

1.2 População x Amostra

 População (N): Conjunto de todos os elementos relativos a um determinado fenô-
meno que possuem pelo menos uma característica em comum, a população é o
conjunto Universo, podendo ser finita ou infinita. População (universo) é a totalida-
de dos itens considerados no estudo
1. Finita - apresenta um número limitado de observações, que é passível de conta-
gem.
2. Infinita - apresenta um número ilimitado de observações que é impossível de
contar e geralmente esta associada a processos..
Uma população pode, mediante processos operacionais, ser considerada infinita,
pois a mesma irá depender do tamanho da amostra. Se a freqüência relativa en-
tre amostra e população for menor do que 5% ela é considerada infinita, se a fre-
qüência relativa for maior do que 5% ela é considerada finita.
 Amostra (n): É um subconjunto da população e deverá ser considerada finita, a
amostra deve ser selecionada seguindo certas regras e deve ser representativa, de
modo que ela represente todas as características da população como se fosse uma
fotografia desta. Amostra é a parte da população selecionada para análise








Parâmetros: são medidas populacionais quando se investiga a população em sua totali-
dade, neste caso é impossível fazer inferências, pois toda a população já foi investigada.
Estatísticas ou Estimadores são medidas calculada para descrever uma característica de
apenas uma amostra da população, torna-se possível neste caso utilizarmos as teorias de
inferências para que possamos fazer conclusões sobre a população

Amostra

População

^
2 2
p Proporção
Padrão Desvio
Variância
Média
estimados) valores (
Estimador
) reai valores (
Parâmetros
÷ ÷
÷ ÷
÷ ÷
÷ ÷
t
o
o
µ
S
S
X
s


Exemplos:
1. Níveis de glicose no sangue de um grupo de 20 pacientes (amostra) selecionados
aleatoriamente de uma lista de pacientes diabéticos de um hospital Público (po-
pulação).
2. Tempos de resposta a um estímulo de um grupo de 30 ratos tipo rato-de-telhado
(Rattus rattus) (amostra) que, por suposição, representam todos os ratos tipo ra-
to-de-telhado (Rattus rattus) existentes (população).
3. Números de horas semanais dedicadas ao estudo de um grupo de 32 estudantes
de graduação do IFAL (amostra) escolhidos aleatoriamente do conjunto total de
estudantes de graduação do IFAL (população).


População Amostra
Parâmetros para estimar
atitudes
Estatísticas ou Estimado-
res para estimar atitudes
Conclusões sobre a População a partir da Amostra
1.3 Censo x Amostragem

- Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra,
podendo ser através de Censo ou Amostragem.
- Censo: É a coleta exaustiva de informações das "N" unidades populacionais.
- Amostragem: São o processo de retirada de informações dos "n" elementos amos-
trais, no qual deve seguir um método criterioso e adequado (tipos de amostragem).

1.4 Dados e Variáveis

Dados estatísticos: é qualquer característica que possa ser observada ou medida de al-
guma maneira. As matérias-primas da estatística são os dados observáveis.
Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geral-
mente as variáveis para estudo são selecionadas por processos de amostragem. Os sím-
bolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais
como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. As variáveis
podem ser classificadas dos seguintes modos: Deste modo, é fundamental estabelecer-
mos o tipo de Variável, pois a sua identificação determinará o tipo de estatística utilizada
Tipos de Variáveis
- Qualitativas (ou atributos): São características de uma população que não pode
ser medida.
Nominal: são utilizados símbolos, ou números, para representar determinado tipo de
dados, mostrando, assim, a qual grupo ou categoria eles pertencem.
Ordinal ou por postos: quando uma classificação for dividida em categorias ordena-
das em graus convencionados, havendo uma relação entre as categorias do tipo
“maior do que”, “menor do que”, “igual a”, os dados por postos consistem de valores
relativos atribuídos para denotar a ordem de primeiro, segundo, terceiro e, assim, su-
cessivamente.
Exemplos:
a) A cor dos olhos de estudantes de um curso de biologia – variável qualitativa
nominal.
b) Coleção de livros de biologia – variável qualitativa nominal.
c) Sexo dos estudantes de uma instituição, isto é, masculino ou feminino - variá-
vel qualitativa nominal.
d) Grau de instrução de pessoas que trabalham em um hospital – variável quali-
tativa ordinal.
e) Relação de classificados em um concurso público – variável qualitativa ordinal.
- Quantitativas: São características populacionais que podem ser quantificadas,
sendo classificadas em discretas e contínuas.
Discretas: são aquelas variáveis que pode assumir somente valores inteiros num con-
junto de valores. É gerada pelo processo de contagem, como o número de veículos
que passa em um posto de gasolina, o número de estudantes nesta sala de aula.
Exemplo:
a) Número de filhos por casal – variável quantitativa discreta.
b) Número de pontos feitos em um paciente de um hospital – variável quantita-
tiva discreta.
c) Número de equipamentos em um laboratório - variável quantitativa discreta.
d) Número de estudantes que cursam Licenciatura em Biologia - variável quanti-
tativa discreta.
Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo
de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o vo-
lume de água em um reservatório ou o peso de um pacote de cereal.
Exemplo:
a) Número de alimentos, em quilogramas, ingerida por estudantes num restau-
rante do IFAL, Campus Maceió - variável quantitativa continua.
b) Quantidade de dinheiro gasto por turistas em Maragogi – variável quantitativa
continua.
c) Volume de refrigerante, em ml, contido em um copo - variável quantitativa
contínua.










Atividade

1. Uma Empresa tem 3.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada
a preferência em relação ao tempo de duração da viagem, ao preço dos pacotes, ao
número de acompanhantes, ao número de passeios e à qualidade dos serviços pres-
tados em uma viagem. Foram consultadas, de modo imparcial, 600 pessoas.

a) Qual a população pesquisada?
b) Quantas pessoas tem a população estatística envolvida nessa pesquisa?
c) A amostra pesquisada foi de quantas pessoas?
d) Quais foram às variáveis qualitativas pesquisadas?
e) Quais foram às variáveis quantitativas pesquisadas? Classifique-as como discreta
ou contínua.

2. Classifique a variável como qualitativa, quantitativa discreta ou quantitativa contínua.

a) População: estudantes do IFAL.
Variável: cor dos cabelos
b) População: funcionários do IFAL.
Variável: idade
c) População: computadores produzidos por uma indústria de informática.
Variável: número de peças usadas na fabricação
d) População: pacientes de um hospital de Alagoas
Variável: número de leitos ocupados
e) População: jogadores de basquete de um clube brasileiro
Variável: massa dos jogadores
f) População: usuários de internet no Brasil
Variável: provedor usado



3. Para pesquisar o refrigerante preferido dos estudantes de um dos Campi do IFAL com
2.100 alunos, foram selecionados, de modo imparcial, 650 estudantes. Com base nes-
sas informações, responda:

a) Qual a população dessa pesquisa?
b) Quantas pessoas têm a população dessa pesquisa?
c) A amostra dessa pesquisa é formada de quantas pessoas?
d) Qual variável foi estudada nessa pesquisa?

4. Bernadete é dona de uma loja de brinquedos. Para ampliar a qualidade da loja, Ber-
nadete resolveu pesquisar o perfil dos clientes em relação à renda mensal, ao modelo
de brinquedo preferido, ao número de brinquedos que cada cliente compra e à quali-
dade dos serviços prestados pela loja. Dos 2.000 clientes cadastrados nessa loja,
1.200 foram entrevistados:

a) Qual a população dessa pesquisa?
b) Quantas pessoas tem a população dessa pesquisa?
c) A amostra pesquisada foi de quantas pessoas?
d) Determine as variáveis pesquisadas e classifique-as como qualitativa, quantitativa
contínua ou quantitativa discreta.










Ferramentas necessárias ao
Estudo de Estatística














Apresentaremos alguns cálculos básicos que serão de extrema importância no es-
tudo da Estatística.

2.1 Números Aproximados e Arredondamento de dados
A norma NBR 5891 da Associação Brasileira de Normas Técnicas (ABNT) estabelece as
regras fixas de arredondamento na numeração decimal, em uso na atualidade. Essas re-
gras estão de acordo com a Resolução 886/1966 do IBGE.
 Sinais convencionais utilizados:
- 0,00 Dado numérico igual a zero resultante de arredondamento de dado numéri-
co originalmente positivo.
- - 0,00 Dado numérico igual a zero resultante de arredondamento de dado numé-
rico originalmente negativo.
 O arredondamento dos dados numéricos deve respeitar as diferenças significativas
(absolutas e relativas) existentes entre eles.
 No arredondamento do dado numérico, quando o primeiro algarismo a ser abando-
nado for 0, 1, 2, 3 ou 4, deve ficar inalterado o último algarismo a permanecer.
Exemplos:
9,2377 (arredondado para número inteiro resulta 9);
9,2377 (arredondado para número com uma casa decimal resulta 9,2);
21,0509 (arredondado para número com duas casas decimais resulta 21,05).
 No arredondamento do dado numérico, quando o primeiro algarismo a ser abando-
nado for 6, 7, 8 ou 9, deve-se aumentar de uma unidade o último algarismo a per-
manecer.
Exemplos:
399,85 (arredondado para número inteiro resulta 400);
399,86 (arredondado para número com uma casa decimal resulta 399,9);
9,2377 (arredondado para número com duas casas decimais resulta 9,24).
 Quando o primeiro algarismo a ser abandonado no arredondamento é 5, há dois pro-
cedimentos:
- Se após o algarismo 5 seguir em qualquer casa um número diferente de zero (0),
aumenta-se em uma unidade o algarismo que antecede o 5;
Exemplos:
237,85001 (arredondado para número com uma casa decimal resulta 237,9);
5,5256 (arredondado para número com duas casas decimais resulta 5,53)
- Se após o algarismo 5 não seguir, em qualquer casa um número diferente de zero
(0), ao algarismo que antecede o 5 será acrescentada uma unidade, se for impar, e
permanecerá como está, se for par.
Exemplos:
246,35 (arredondado para número com uma casa decimal resulta 246,4, pois o
número que antecede o 5 é impar);
246,85 (arredondado para número com uma casa decimal resulta 246,8, pois o
número que antecede o 5 é par, desta forma, ele fica inalterado);
12,1250 (arredondado para número com duas casas decimais resulta 12,12, pois o
número que antecede o 5 é par);
Observação: Nos softwares de computadores (como a planilha Excel) e calculado-
ras cientificas, porém, não é aplicado o critério indicado neste item. Nesse caso,
se o primeiro algarismo a ser abandonado for 5, o arredondamento será feito
com o aumento de uma unidade ao algarismo que antecede o 5.
Exemplos:
246,35 (arredondado para número com uma casa decimal resulta 246,4);
246,85 (arredondado para número com uma casa decimal resulta 246,9);
12,1250 (arredondado para número com duas casas decimais resulta 12,13);

2.2 Fração
É uma parte do todo ou seja um par ordenado onde o segundo número é diferen-
te de zero.
b
a
, com a Є IN e b Є IN*. (a pertence ao conjunto dos números naturais e b
pertence ao conjunto dos números naturais não nulos (com exclusão do zero).
- Fração Própria – é aquela onde o numerador é menor que o denominador como por
exemplo:
17
13
,
7
2
,
5
3
, etc.
- Fração imprópria é aquela onde o numerador é igual ou maior que o denominador.
Exemplo:
4
12
,
4
4
,
2
7
, etc.
- Fração aparente é a fração onde o numerado é múltiplo do denominador.
Exemplo:
4
12
representa o número 3 pois 12:4 = 3; se o numerador é zero , a fração
apresenta o número zero. Assim 0
4
0
= . Todo número natural pode ser apresentado
por uma fração com denominador 1. Assim 7 pode ser apresentado por
1
7
.
- Frações Equivalentes – duas frações são equivalentes quando os produtos do nume-
rador de um pelo denominador da outra são iguais.
Exemplo: para
2
1
e
4
2
onde temos: 1 x 4 = 2 x 2
- Simplificação de frações - Basta dividir ambos os termos por um divisor comum.
Exemplo:
2
1
3 6
3 3
6
3
=
÷
÷
=
Fração irredutível é aquela que os números são primos entre si (isto é , não possui
outro divisor comum a não ser o número 1).
Exemplo:
17
7
é uma fração irredutível, pois 7 e 17 são números primos entre si.
- Comparação de frações - Para compararmos duas ou mais frações deverão reduzi-la
ao mesmo denominador e lembrar que, de duas frações com o mesmo denomina-
dor, a maior é aquela que contém o maior numerador.
- Operações com frações
 Adição e subtração
a) Frações homogêneas – conserva-se o denominador e adicionam-se ou
subtraem os numeradores.
Exemplo:
5
9
5
7
5
2
= + ou
3
5
3
2
3
7
= ÷
b) Frações heterogêneas – reduzem-se as frações ao mesmo denominador,
obtendo-se dessa forma frações homogêneas.
Exemplo:
15
22
15
10
15
12
15
5 2
15
3 4
3
2
5
4
= + =
×
+
×
= + 4/
Reduzindo ao mesmo denominador – para isso, vamos calcular o mínimo múlti-
plo comum dos denominadores como no exemplo acima:
mmc de 3 e 5, isto é, mmc(3,5)=15
3 5 3
1 5 5
1 1 3x5
Logo m.m.c de 3 e 5 é 3x5 =15
Observe que reduzimos ao mesmo denominador 3 e 5 para 15.
 Multiplicação de frações - Produto de numeradores por numeradores e denomi-
nadores por denominadores.
Exemplo:
21
12
3 7
4 3
3
4
7
3
=
×
×
= × , isto é, 3 x 4 = 12 e 7 x 3 = 21 o que resulta em
21
12
.
O processo da multiplicação pode ser facilitado usando a simplificação pelo cancela-
mento dos fatores comuns dos numeradores e dos denominadores.
Exemplo:
5
3
3
2
× , nesse caso é possível simplificar 3 por 3 ou seja 3:3 =1 ficando dessa forma 2
X 1 = 2 e 1 X 5 = 5 o que resulta em
5
2
.
 Divisão de frações - Produto da primeira pelo inverso da segunda.
Exemplo:
6
7
3 2
7 1
3
7
2
1
7
3
2
1
=
×
×
= × = ÷
 Potenciação de Frações - Devemos elevar o numerador e o denominador a esse
expoente.
Exemplo:
25
4
5
2
5
2
2
2
2
= =
|
.
|

\
|
.
Nota: Sempre que possível simplificar o resultados como vimos no tópico de simplifica-
ção de frações.



2.3 Porcentagem ou Percentagem

O calculo da porcentagem é uma operação das mais antigas, em termos de cálculos
comerciais e financeiros. A expressão por cento é indicada geralmente por meio do sinal
%, quando efetuamos um cálculo de porcentagem, na verdade estamos efetuando um
simples calculo de proporção. Podemos dizer também que são razões que consistem em
considerar um total qualquer igual a 100% e, através de uma regra de três simples, esta-
belecemos qualquer relação com as parcelas que compõem o total.
Uma forma de cálculo é a seguinte:
100
Percentual x Valor
m Porcentage =
Denominamos razões percentuais as razões cujos conseqüentes (ou denominador)
sejam iguais a 100.
Representação:
Em fração;
100
30
(trinta por cem ou vinte sobre cem);
100
20
(vinte por cem ou vinte sobre
cem),
Em forma unitária: 0,30 ( zero virgula trinta ou zero virgula três); 0,20 (zero vírgula vinte
ou zero virgula dois).
Em forma percentual:
100
30
corresponde a 30% (trinta por cento);
100
20
corresponde a
20% (vinte por cento).
Exemplos:
1) Em uma classe de 30 estudantes, 15 foram aprovados. Qual a taxa percentual de
aprovação?
Valor Percentual
30 ------- 100%
15 ------ X (%)
onde: 30X = 100 x 15
30X = 1500 X = 1500/30 = 50%
Logo, foram aprovados 50% dos estudantes.


2) Ao comprar um livro , obtive um desconto de R$3,00. Qual o preço do livro saben-
do que a taxa de desconto foi de 5%?
Valor Percentual
3 ------- 5%
X ------ 100(%)
5X = 300
X = 300/5 = 60, isto é, o preço do livro foi R$60,00.

2.4 Somatórios

Muitas vezes necessitamos escrever expressões que envolvam somas com muitos
termos ou elementos, ou cujos termos ou elementos obedecem a certa lei de formação.
Por exemplo:
1 + 2 + 3 + 4 +....+ 50
Simbolizaremos por
1
x o primeiro termo,
2
x
o segundo termo,
3
x
o terceiro
termo,
50
x
o qüinquagésimo termo. Assim, poderemos representar
i
x
como sendo o i-
ésimo termo da soma. Chamaremos de n o número de termos da soma. Desta forma, na
ilustração, n=50.
A soma de n termos pode ser simbolicamente representada por
¿
=
n
i
i
x
1

No caso do exemplo anterior termos 50 termos, então n=50 e a soma desses cin-
qüenta termos ou números será representada por
¿
=
50
1 i
i
x

Vejamos as partes do símbolo do somatório
O símbolo
¿
é a letra grega sigma maiúscula.




A instrução para
somar
O primeiro elemento
dos termos a serem
somados
O n é o último termo ou ele-
mento a ser somado
x é o nome dos termos ou
elementos a serem somados
i é uma observação individual
ou índice para cada termo
¿
=
n
i
i
x
1




Lê-se: “Somatório de
i
x
, para i variado de 1 até n” ou “soma de
i
x
, para i va-
riado de 1 a n”
Exemplo: Sendo 1 ; 2 ; 8 ; 3 ; 7
5 4 3 2 1
= = = = = x x x x x , calcule ¿
=
5
1 i
i
x
.
Solução:
¿
¿
=
= + + + + = + + + + =
=
21
, é isto , 21 1 2 8 3 7
5 4 3 2 1
5
1
i
i
i
x
x x x x x x


Propriedades:
I Se cada elemento da soma for multiplicado por um número (ou uma constante),
os elementos da soma podem ser somados, e depois a soma será multiplicada pe-
lo número (ou constante).
¿ ¿
=
i
i
x c cx
¿ ¿
=
i
i
x x 2 2
II A soma de um número (ou constante) sobre n termos é igual a n vezes o número
(ou constante).
nc c =
¿

20 2 10 2
10
1
= =
¿
=
x
i

III O somatório da soma (ou diferença) é igual à soma (ou diferença) de somatórios.
¿ ¿ ¿
± = ±
i i i i
y x y x ) (
IV O somatório de
2
i
x
2 2
3
2
2
2
1
2
n
i
x x x x x + + + + =
¿

Observação:
¿ ¿
=
2 2
) (
i
i
x x
Quando não houver possibilidades de dúvida, podemos eliminar os índices. As-
sim:
¿ ¿ ¿ ¿
= =
n
i
i
n
i
i
x x x x
1
2
1
2
, de inves ao usados, serão ,


Atividade

1. Qual o resultado de 3/4 + 4/5:
a. 31/20
b. 30/20
c. 22/20
d. 1/4

2. Quanto é 6/12 X 2/9:
a) 1/9
b) 2/3
c) 3/5
d) 1/25

3. Eu uma classe de 50 estudantes faltaram 15. Qual a quantidade de estudantes
presentes em porcentagem?
a) 30%
b) 70%
c) 25%
d) 35%

4. Por quanto devo vender um objeto que me custou R$ 150, para ter um lucro de
20% sobre o custo?
a) R$ 170,00
b) R$ 180,00
c) R$ 185,00
d) R$ 190,00

5. Calcule:
a) 2% de 458,94
b) 33% de 280
c) 100,4% de 110
d) 0,5% de 238






10 Sendo
1 ; 2 ; 8 ; 3 ; 7 :
5 4 3 2 1
= = = = = x x x x x X
2 ; 6 ; 1 ; 1 ; 3 :
5 4 3 2 1
= = = = = y y y y y Y

Calcular:
a)
¿ i
x
b)
¿ i
y
c)
¿
+ ) (
i i
y x
d)
¿ i i
y x
e)
¿
÷ ) 1 (
i
x
f)
2
i
x
¿

g)
¿
2
i
y









Obtenção de Dados


A polêmica em torno de dados estatísticos é comum. Basta que seja divulgado os
resultados de uma pesquisa de intenção de votos, por exemplo, para que alguns candida-
tos envolvidos saiam contestando sua validade.
A Estatística é um instrumento eficiente para a compreensão e interpretação das
realidades e não deve ser subestimada.
Realmente, existem pesquisas feitas de forma incorreta e que, por isso, não são
confiáveis. Mas, em geral, quando um estudo estatístico é feito com bastante critério,
seus resultados permitem obter conclusões e prever tendências sobre fatos e fenômenos
estudados.
Entretanto, um estudo bem feito não elimina o erro, mas limita-o a uma margem
de erro, procurando torná-lo o menor possível.

3.1 Etapas do Método Estatístico

Vamos discutir nesta unidade a importância de cada etapa do método estatístico e
como falhas na sua execução poderá levar a resultados enganosos
Quando buscamos tomar decisões do nosso dia a dia estamos direta ou
indiretamente fazendo um levantamento de dados observados. A informação obtida de
cada elemento da população (ou da amostra) é gravada ou arquivada e apresentada na
ordem em que as entrevistas ou medidas são realizadas. Ao decidir, por exemplo, pela
compra de um determinado bem, procuramos veirificar se esse bem satisfaz as nossas
espectativas, se o seu preço é compativel com o nosso orçamento, além de outras
situações ou caracteristicas.
Para um estudo estatístico confiável depende do planejamento e da correta execu-
ção das etapas da pesquisa.
Desde a mais simples até a mais complexa pesquisa de mercado deve ser planejada
para evitar falhas de todos os tipos, desde a escolha incorreta do método a ser usado até
a importância das informações obtidas para o processo decisório.

3.1.1 O que devemos pesquisar – primeiramente, é preciso definir com clareza quais os
objetivos da pesquisa que queremos realizar, ou seja, o que se pretende apurar, que tipo
de problema está se buscando detectar.


Objetivo – quais perguntas a pesquisa vai responder.
EXEMPLO: Objetivo Geral: conhecer o perfil de trabalho dos funcionários de um de-
terminado hotel, para orientar políticas de gestão de pessoas.
Para podermos dar seqüência a esta pesquisa, precisamos especificar melhor o que
queremos conhecer da população de funcionários desse hotel, ou seja, os objetivos
específicos. Alguns destes objetivos específicos poderiam ser:
- Conhecer o tempo médio de serviço dos funcionários neste hotel.
- Conhecer a distribuição do grau de instrução dos funcionários.
- Verificar o interesse dos funcionários em participar de programas de treinamento.
- Avaliar o grau de satisfação dos funcionários com o trabalho que exercem no ho-
tel.
- Verificar se existe associação entre o grau de satisfação do funcionário com a sua
produtividade.
A elaboração dos objetivos específicos deve ser feita, de tal maneira, que forneça
uma primeira indicação das características que precisamos observar. Por exemplo, para
atingir aos objetivos do problema em questão, precisamos levantar as seguintes caracte-
rísticas de cada funcionário: tempo de serviço, grau de instrução, interesse em participar
de treinamento, grau de satisfação com o trabalho e produtividade, etc.
3.1.2 Qual o Público-alvo?
Chamamos de publico alvo ou população alvo ao conjunto de elementos que quere-
mos abranger em nossa pesquisa. São os elementos para os quais desejamos que as con-
clusões vindas da pesquisa sejam válidas.
No exemplo anterior, a população alvo que será definida são todos os funcionários do
hotel. Entretanto, se a coleta de dados for feita no próprio local de trabalho e no período
de uma semana, os funcionários que neste período estão de férias ou de licença ficam de
fora do levantamento. Desta forma, as conclusões baseadas nesses dados não valem,
necessariamente, para todos os funcionários do hotel.
Assim, definimos como população acessível, ou simplesmente como população, o
conjunto de elementos que queremos abranger em nossa pesquisa e que são passiveis
de serem observados, com respeito às características que pretendemos levantar. Reali-
zando adequadamente a pesquisa, podemos garantir que os resultados serão validos
para este conjunto de elementos.

3.1.3 Como desenvolveremos o plano de pesquisa
Vejamos algumas questões importantes
a. Qual método de pesquisa será usado
b. Qual o Universo da Pesquisa
c. Qual a Amostra
d. Já existem pesquisas anteriores sobre o tema? Elas servem de referencia para as
pesquisas futuras? Que aspectos devem ser aprimorados ou modificados na nova
pesquisa?
e. De quanto tempo se dispõe para fazer a pesquisa? Que grau de precisão ele exi-
ge?
f. Quais os fatores relacionados ao objeto de estudo, ou que variáveis estão envol-
vidas no problema em questão?
3.1.4 Como a pesquisa será feita – è necessário elaborar uma estratégia para fazer o
levantamento de dados.
3.1.4.1 Quais os dados significativos para a pesquisa?
3.1.4.2 Existem dados disponíveis em algum órgão especializado, como por exemplo
IBGE ou outros?
3.1.4.3 Se não, como os dados serão obtidos? Diretamente, por exemplo, por meio de
questionários ou de entrevistas?
3.1.4.4 A coleta abrangerá toda a população pesquisada ou será parcial, isto é, será
feita a partir de uma amostra da população?
3.1.4.5 Deve-se considera que a escolha da amostra é fator muito importante para o
sucesso da pesquisa. Ela precisa retratar da melhor forma possível a popula-
ção pesquisada.
3.1.4.6 Em muitas pesquisas, os dados são obtidos por meio de entrevistas e questio-
nários. Alguns cuidados devem ser tomados na elaboração das perguntas.
Neste contexto, deve-se evitar questões abertas do tipo:
“Qual sua opinião sobre a situação econômica brasileira?”
È mais conveniente limitar as respostas. Por exemplo:
Na sua opinião a situação econômica brasileira:
( ) vai melhorar ( ) vai piorar ( ) não sabe/não respondeu
As vezes é interessante apresentar uma questão filtro, para que não se pergun-
tem coisas que o individuo não tenha condição de responder. Por exemplo:
Você lê jornal?
( ) sim ( ) não
Veja que a resposta dessa questão determina o rumo da entrevista, pois se for
sim, pode-se perguntar: Quais jornais? Com que freqüência você lê? Etc. Se for
não, pode-se perguntar: Por quê? Etc.
- As perguntas devem ser claras e simples, a fim de não criar constrangimentos ao
entrevistado. A entrevista precisa ser curta, para não deixar o entrevistado ente-
diado.
Evita questões do tipo:
o Você toma banho todos os dias?
o Qual a sua renda mensal?
Informações pessoais podem ser obtidas de forma indireta, com questões do tipo:
o Tem casa própria? Automóvel? Eletrodomésticos?
o Quanto gasta com energia? E com água?

3.1.5 Organização e apresentação dos dados – Os dados coletados devem ser organi-
zados em tabelas que facilitem a visualização e o cálculo de medidas estatísticas
(médias, desvios e amplitude da amostra, etc.).
As tabelas podem ser representadas por meio de gráficos que permitem um exame
ainda mais rápido e fácil dos resultados da pesquisa

3.2 Apresentação tabular
Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado.
A elaboração de tabelas obedece à Resolução nº 886, de 26 de outubro de 1966, do Con-
selho Nacional de Estatística. As normas de apresentação são editadas pela Fundação
Brasileira de Geografia e Estatística (IBGE). IBGE. Centro de Documentação e Dissemina-
ção de Informações. Normas de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993.
Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico
se destaca como informação central.

3.2.1 Representação esquemática



Recomendações gerais – Recomenda-se que:
- uma tabela seja elaborada de forma a ser apresentada em uma única página
- o número de células com dado numérico seja superior ao número de células com
sinal convencional
- a classificação outros ou outras quando existir, indique um dado numérico pro-
porcionalmente inferior aos dados numéricos indicados pelas demais classifica-
ções existentes
- as tabelas de uma publicação apresentam uniformidade gráfica como, por exem-
plo, nos corpos e tipos de letras e números, no uso de maiúsculas e minúsculas e
nos sinais gráficos utilizados.

3.2.2 Elaboração geral

3.2.2.1 Topo ou Título– identificação da tabela. O título deve responder as se-
guintes questões:
- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).

3.2.2.2 Número – toda a tabela deve ter número, inscrito no topo, sempre que
um documento apresentar duas ou mais tabelas, facilitando a identifica-
ção e localização. A numeração deve ser arábica e seqüencial.
Tabela 1 –
Tabela 2 –



3.2.2.3 Moldura – elemento fundamental para estruturar a tabela. É composta
apenas de traços horizontais; o primeiro separa o topo, o segundo para
separar o espaço do cabeçalho e o terceiro para separar o rodapé. A
moldura não deve conter traços verticais que a delimitem à esquerda e à
direita.

3.2.2.4 Cabeçalho – elemento obrigatório para identificação do conteúdo das
colunas. Recomenda-se que a identificação com palavras seja feita por
extenso, sem abreviações. O cabeçalho, que é a apresentação do que ta
tabela está procurando representar, deve conter o suficiente para que
sejam respondidas as seguintes questões: O quê? (referente ao fato,
Onde? (referente ao lugar), Quando? (referente ao tempo).

3.2.2.5 Indicador de linha – a identificação do conteúdo das linhas deve ser fei-
ta de forma concisa e clara. Recomenda-se que a identificação com pala-
vras seja feita por extenso, sem abreviações.

3.2.2.6 Corpo: parte da tabela composta por linhas e colunas.
Linhas: parte do corpo que contém uma seqüência horizontal de infor-
mações.
Colunas: parte do corpo que contém uma seqüência vertical de informa-
ções.
Coluna Indicadora: coluna que contém as discriminações corresponden-
tes aos valores distribuídos pelas colunas numéricas.

3.2.2.7 Casa ou célula: parte da tabela formada pelo cruzamento de uma linha
com uma coluna.



3.2.2.8 Unidade de medida – deve aparecer inscrita no espaço do cabeçalho ou
nas colunas indicadoras. A indicação da expressão quantitativa ou me-
trológica dos dados numéricos deve ser feita com símbolos ou palavras
entre parênteses.
(m) ou (metro)
(t) ou (tonelada)
(R$) ou (real)

Quando uma tabela contiver dados numéricos divididos por uma constante, esta
deve ser indicada por algarismos arábicos, símbolos ou palavras, entre parênteses,
precedendo a unidade de medida quando for o caso.
- (1 000 t) ou (1000t) = indica dados numéricos em toneladas que foram divididos
por mil
- (R$1.000) ou (R$ 1.000) = dados em real que foram divididos por mil
- (%) ou (percentual) = dados numéricos proporcionais a cem
- (%o) ou (por mil) = dados numéricos proporcionais a mil
- (1 / 1000) = dados numéricos que foram multiplicados por mil

3.2.2.9 Sinal convencional – a substituição de um dado numérico deve ser feita,
sempre que necessário por um dos sinais abaixo:

- Dado numérico igual a zero não resultante de arredondamento
.. Não se aplica dado numérico
... Dado numérico não disponível
x Dado numérico omitido a fim de evitar a individualização da informação

0
0,0 Dado numérico igual a zero resultante de arredondamento de um dado
numérico originalmente positivo
0,00

etc.

-0
-0,0 Dado numérico igual a zero resultante de arredondamento de um dado
numérico originalmente negativo
-0,00

etc.

3.2.2.10 Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde
são colocadas as notas de natureza informativa (fonte, notas e chama-
das).

3.2.2.11 Chamada – uma tabela deve ter chamada, inscrita em qualquer um de
seus espaços, sempre que houver necessidade de se remeter algum de
seus elementos a uma nota específica.

Notas: Sinais convencionais utilizados:
... Dado numérico não disponível.
.. Não se aplica dado numérico.

A remissiva atribuída a algum dos elementos de uma tabela deve ser feita com al-
garismos arábicos em destaque: entre parênteses, entre colchetes, exponencial.
(1) Percentual de pessoas de 15 anos ou mais de idade procurando trabalho, em
relação às pessoas de 15 anos ou mais de idade economicamente ativas, na semana de
referência.

3.2.2.12 Fonte – toda a tabela deve ter fonte, inscrita na primeira linha do seu
rodapé, para identificar o responsável (pessoas física ou jurídica) ou res-
ponsáveis pelos dados numéricos (Fonte ou Fontes).
A identificação deve ser feita por extenso.
Quando todas as tabelas forem retiradas de uma única fonte, já identificada na
própria publicação, é dispensável aparecer em cada uma das tabelas.
Recomenda-se que, em tabelas com dados numéricos extraídos de um documento,
a identificação da fonte indique a referência bibliográfica do documento
Exemplo
Fonte: Pesquisa Industrial – 1982-1984. Dados gerais, Brasil. Rio de Janeiro: IBGE,
v.9, 410p.

3.2.2.13 Nota geral – uma tabela deve ter nota geral, inscrita no seu rodapé, logo
após a fonte, sempre que houver necessidade de se esclarecer o seu
conteúdo geral (Nota ou Notas).
Notas: Sinal convencional utilizado:
- Dado numérico igual a zero não resultante de arredondamento.

3.2.2.14 Nota específica – a nota específica (quando esta existir) deve aparecer
logo após a nota geral. Quando houver mais de uma, estas devem ser
distribuídas obedecendo à ordem de numeração da chamada.

3.2.3 Apresentação de tempo – toda a série temporal consecutiva deve ser apre-
sentada, em uma tabela, por seus pontos, inicial e final, ligados por hífen ( - ).
Quando uma tabela contiver dados numéricos de um período temporal dife-
rente do ano civil, isto deve ser indicado no título, em nota geral ou nota específica.
- 1981-1985 = indica dados numéricos para os anos de 1981, 1982, 1983 ,1984 e
1985.
- OUT 1991-MAR 1992 = indica dados numéricos para os meses de outubro, no-
vembro e dezembro de 1991 e janeiro, fevereiro e março de 1992.
- 30.05.1991-06.06.1991 = indica dados numéricos para os dias 30 e 31 de maio de
1991 e 1, 2, 3, 4, 5 e 6 de junho de 1991.
- 1981/1985 = apresenta dados numéricos para os anos de 1981 e 1985, não sendo
apresentados dados numéricos de pelo menos um dos anos desta série temporal.
- 1988, 1990, 1991 = apresentam dados numéricos para os anos de 1998, 1990 e
1991.
- Safra 91/92 = apresenta dados numéricos de uma safra iniciada em 1991 e termi-
nada em 1992.

3.2.4 Apresentação de classe de freqüência – deve ser apresentada em uma tabela
sem ambigüidade, por extenso ou com notação.
W a menos de Z
 w|---- z. = 15 a menos de 30 bovinos por km².
Mais de W a Z
 w----| z. = Mais de ¼ a ½.
 W|----| z. = 40 a 49 anos.
Arredondamento numérico – os dados numéricos devem ser arredondados, em uma
tabela, sempre que houver necessidade de apresentá-los com um menor número de
algarismos. Isto deve ser indicado em nota geral ou nota específica.

Notas – Dados numéricos arredondados.
Sinais convencionais utilizados:
0,00 Dado numérico igual a zero resultante de arredondamento de dado nu-
mérico originalmente positivo.

O arredondamento dos dados numéricos deve respeitar as diferenças signi-
ficativas (absolutas e relativas) existentes entre eles.
 9,2377 = arredondado para número inteiro resulta 9
 9,2377 = arredondado para número com uma casa decimal resulta 9,2
 9,2377 = arredondado para número com duas casas decimais resulta 9,24
 399,85 = arredondado para número inteiro resulta 400
 399,85 = arredondado para número com uma casa decimal resulta 399,9

Quando houver divergência entre a soma das parcelas arredondadas e o total
arredondado, pode-se incluir uma nota geral esclarecendo a divergência.

3.2.5 Arredondamento de dado numérico – os dados numéricos devem ser arre-
dondados, em uma tabela, sempre que houver necessidade de apresentá-los
com um menor número de algarismos. Isto deve ser indicado em nota geral
ou nota específica.
Exemplo
Nota: Dados numéricos arredondados.
 O arredondamento dos dados numéricos deve respeitar as diferenças significati-
vas (absolutas e relativas) existentes entre eles.
 No arredondamento do dado numérico, quando o primeiro algarismo a ser arre-
dondado for 0, 1, 2, 3 ou 4, deve ficar inalterado o último algarismo a permane-
cer.
Exemplo
9,2377 – arredondado para o número inteiro = 9
9,2377 - arredondado para número com casa decimal = 9,2
21,0509 - arredondamento para número com duas casas decimais = 21,05
 No arredondamento do dado numérico, quando o primeiro algarismo a ser aban-
donado for 5, 6, 7, 8 ou 9, deve-se aumentar de uma unidade o último algarismo a
permanecer
Exemplo
399,85 – arredondado para o número inteiro = 400
399,85 - arredondado para número com casa decimal = 399,9
9,2377 - arredondamento para número com duas casas decimais = 9,24
 Quando em uma tabela, depois de feito o arredondamento dos dados numéricos,
houver divergência entre a soma das parcelas arredondadas e o total arredonda-
do, deve ser adotado um dos seguintes procedimentos
· Inclusão de uma nota geral esclarecendo a divergência
Exemplo
Nota: As diferenças entre a soma das parcelas e respectivos totais são proveni-
entes do critério de arredondamento.
· Correção na parcela (ou parcelas) em que for menor o valor absoluto da razão
entre a diferença de arredondamento (dado numérico original menos dado nu-
mérico corrigido) e o dado numérico original.
Exemplo:
Dado numérico original Dado numérico arredondado
7,6 7,6
11,6 11,6
20,2 20,2
--------- ----------
39,4 39
· Porém: 8 + 12 + 20 = 40

3.2.6 Diagramação da tabela – toda a tabela que ultrapassar as dimensões da pági-
na deve obedecer a:
 cada página deve ter o conteúdo do topo e o cabeçalho da tabela ou o cabeçalho
da parte
 cada página deve ter uma das seguintes indicações: continua para a primeira;
conclusão para a última e continuação para as demais
 cada página deve ter colunas indicadoras e seus respectivos cabeçalhos
 o traço horizontal da moldura que separa o rodapé deve ser apresentado somen-
te em cada página que contenha a última linha da tabela
 o conteúdo do rodapé só deve ser apresentado na página de conclusão.

Quando a tabela ultrapassar a dimensão da página em número de linhas e tiver pou-
cas colunas, pode-se ter o centro apresentado em duas ou mais partes, lado a lado, na
mesma página, separando-se as partes por um traço vertical duplo e repetindo-se o ca-
beçalho.
Quando for grande o número de colunas e poucas linhas pode-se ter o centro apre-
sentado em duas ou mais partes, uma em baixo da outra, na mesma página, repetindo-se
o cabeçalho das colunas indicadoras e os indicadores de linha.

3.3 Análise e avaliação dos resultados obtidos

Depois de feitas a coleta e a apresentação dos dados, parte-se agora para a análise
dos resultados.
Esta é a fase mais importante do projeto de pesquisa: obter conclusões a partir da
pesquisa, para:
1. Encaminhar soluções para os problemas detectados. Por exemplo:
- o número de acidentes de trabalho num hotel é maior em determinados setores.
2. Verificar a validade de hipóteses. Por exemplo:
- um produto será bem aceito pelos hospedes?
3. Estabelecer parâmetros para a população como concentração de renda, nível de
emprego, condições de moradia, saúde, educação, etc.
3.4 Tomar as decisões
Uma das etapas mais difíceis de um trabalho de pesquisa, por isso requer que to-
dos os passos anteriores sejam bem aplicados e analisados.

3.5 Aplicação do método estatístico através de um projeto de pesquisa

Nesta seção apresentaremos um exemplo de um projeto de pesquisa relativa-
mente bem simples, desenvolvido co a participação de launos da disciplina de Estatística
do Curso de Gestão Ambiental do IFAL, semestre 2009-2, com finalidade puramente a-
cadêmicas:
O problema de pesquisa: a relação de um estudante do IFAL e o curso que está fazendo.
Objetivo geral: Num curso do IFAL, conhecer melhor a relação entre o estudante e o cur-
so que esta fazendo. Em particular, no Curso de Gestão Ambiental do IFAL.
Objetivos específicos:
I. Avaliar o grau de satisfação do estudante com o curso que está realizando.
II. Verificar se existe associação entre o grau de satisfação do estudante com
o seu desempenho no curso.
III. Levantar os aspectos positivos e negativosdo curso, na visão do estudante.
População: Estudantes que estavam cursando as três últimas fases do Curso de Gestão
Ambiental do IFAL, semestre 2009-2.
Amostra: Optamos por um processo rápido e fácil para a seleção da amostra. Tomamos
três disciplinas obrigatórias das três últimas fases e aplicamos o questionário em sala de
aula. A amostra foi, então, formada pelos estudantes presentes nos dia de aplicação dos
questionários.

Forma de mensuração das variáveis
1

Satisfação com o curso: uma avaliação numérica numa escala de 1 (um) a 5 (cin-
co), de acordo com o grau que o estudante julgar que melhor se adapte à sua satisfação
com o curso em questão, complementando com avaliações de aspectos específicos do
curso, como seu corpo docente, recursos materiais disponíveis e sue conteúdo curricular.
Desempenho do estudante: Índice de aproveitamento acumulado, calculado pela
instituição, em função dos conceitos (ou notas) obtidos pelo estudante nas disciplinas

1
Estatiistica Aplicada as Ciências Sociais. Pedro Alberto Barbetta, pagina 29
cursadas. Então, os dados relativos a esta variável são dados secundários, isto é, devem
ser solicitados da instituição.
Aspectos positivos e negativos do Curso: serão observados de duas maneiras:
I. Avaliações numéricas, numa escala de um (1) a cinco (5, de acordo com o grau
que o estudante julgar que lhe melhor se adapte a sua concordância com alguns
aspectos do curso.
II. Deixar o estudante descrever livremente o principal aspecto positivo e negativo
do curso. Nesta segunda situação, as categorias destas duas variáveis serão cria-
das após a realização de uma analise das repostas dos questionários, isto é, as
respostas similares serão agrupadas numa única categoria.









Técnicas de Amostragem










Neste capitulo apresentaremos as técnicas de amostragem mais utilizadas no
cotidiano de estatistica. A amostragem é bastante usada em nossa vida diaria, por
exemplo, para verificar o temprero de um alimento em preparação, podemos provar
(observar) uma pequena porção deste alimento. Estamos fazendo uma amostragem, ou
seja, extraindo do todo (população) uma parte (amostra), com o proposito de avaliarmos
(inferirmos) sobre a qualidade de tempero de todo o alimento.
Num aeroporto internaciona, a escolha dos passageiros, para a revista da bagagem, é
feita por amostragem.
Nas pesquisas cientificas, em que se quer conhecer algumas caracteristicas de
uma população, também é muito comum se observar apenas uma maostra de seus
elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou
estimativas, para as caracteristicas populacionais de interesse. Este tipo de pesquisa é
usualmente cahmado de levantamento por amostragem.
Existem técnicas adequadas para recolher amostras, de forma a garantir (tanto
quanto possivel) o sucesso da pesquisa que ser quer realizar e dos resultados esperados.
Num levantamento por amostragem, a seleção dos elementos que serão
efetivamente observados, deve ser feita sob uma metodologia bem adequada, de tral
forma que os resultados da amostra sejam informativos para avaliar caracteristicas de
toda a população pesquisada.
Exemplos:
1. Numa pesquisa sobre lincenciados em biologia no Estado de Alagoas, a população
pode ser definida como todas as pessoas que se formaram em biologia no estado,
no momento da pesquisa. O principal pârametro a ser avaliado deve ser a
percentagem de pessoas que atuam no Estado.
2. Numa pesquisa eleitoral, a três dias de uma eleição municipal, a população pode
ser definida como todos eleitores com domicilio eleitoral no municipio. Os
principais parâmetros devem ser as percentagens de votos de cada candidato à
prefeitura, no momento da pesquisa.
3. Para planejar politicas de recursos humanos em empresas, com milhares de
funcionarios, podemos realizar uma pesquisa para avaliar alguns parâmetros da
população de funcionarios destas empresas, tais como: tempo médio de serviço
dos funcionários na empresa, percentagem de funcionários com nível de
instruçãosuperior, percentagem de funcionários com interesse num certo
programa de treinamento, etc..

Nos exemplos acima podemos perceber a dificuldade em pesquisar toda a população.
São situações típicas em que se recomenda utilizar amostragem. Observe a figura abaixo.

FIG – Ilustração de um levantamento por amostragem – exemplo 3
O termo inferencia estatistica refe-se ao uso apropriado dos dados da amostra para
se ter algum conhecimento sobre os parâmetros da população. Os valores calculados a
partir dos dados da amostra, com o objetivo de avaliar parâmetros desconhecidos, são
chamados de estimativas desses parâmetros.
Por que devemos estudar técnicas de amostragem?
- Economia – O levantamento de dados sobre uma parte da população é mais
econômico que o levantamento de dados sobre toda a população.
- Tempo – O levantamento de dados sobre uma parte da população é mais rápido
que o levantamento de dados sobre toda a população.
- Confiabilidade dos dados – Quando se pesquisa um número reduzido de
elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas
rspostas
- Operacionalidade – É muito mais fácil realizar operações de pequena escala. Um
dos problemas típicos nos grandes censos é o controle dos entrevistadores.
Um problema fundamental da amostragem é garantir que as unidades escolhidas
representem a população. Por exemplo, se a população em foco são os turistas que
viajam ao exterior, um critério de seleção que exclua pessoas com mais de 50 anos pode
produzir informações não representativas, principalmente se a caracteristica em foco for
algo como a renda ou o consumo potencial do entrevistado ou de sua familia.

Estimativa de parâmetros populacionais
- Tempo de serviço no hotel
- Percentagem de funcionários com nivel de instrução superior, etc.
A inferência estatística
O processo de amostragem
POPULAÇÃO:
Todos os funcionários dos
hotéis
AMOSTRA:
Alguns funcionários do
hotel
Evidentemente, há várias maneiras se se extrair uma maotra de n unidades de um
apopulação de N elementos ou objetos. No entanto, os vários modos de seleção das
possíveis unidades de analise são agrupadas em dois processos básicos: o aleatório e o
não-aleatório (também denominados respectivamente de probabilistico e não-
probabilistico). Obviamente cada um deles tem suas vantagens e usos especificos.
Deve-se haver critério para a seleção desses elementos; cada elemento da
população deve ter a amesma chance de ser escolhido para garantir à amostra o caráter
de represenatividade.
As técnicas para a determinação da amostragem são:
- Amostragem casula ou aleatória simples;
- Amostragem proporcional estratificada;
- Amostragem sistemática.

4.1 Amostragem Casual ou Aleatória Simples
Para a seleção de uma amostra casual ou aleatória simples precisamos ter uma
lista completa dos elementos da população (ou de unidades de amostragem
apropriadas). Este tipo de amostragem consiste em selecionar a amostra através de um
sorteio, sem restrição. É sempre recomendavel que a amostra contenha no mínimo 10%
da população pesquisada.
Inicialmente, devemos listar ou numerar de 1 a N a população a ser analisada, e
posteriormente selecionar uma amostra de n elementos da população mediante um
sorteio. Para evitar o desconforto de se escrever os números em pedaços de papel (todos
iguais), dobrá-los (todos iguais), colocá-los em uma urna e retirá-los um a um, podemos
utilizar tabelas para esse fim; são as chamadas tabelas de números aleatórios.
A amostargem aleatória simples tem a seguintes propriedade: qualquer
subconjunto da população, com o mesmo número de elemntos, tem a mesma
probabilidade de fazer parte da amostra. Em aprticular, temos que cada elemento da
população tem a mesma probabilidade de pesrtencer à amostra.
2


2
Estas propriedades podem ser verificadas através do cálculo de probabilidade. A probabilidade de um
elemento particular da população pertencer à amostra e é dada por n/N.

As tabelas de números aleatórios facilitam o processo de seleção de uma amostra
aleatória.Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto
{0, 1, 2, 3, 4, ..., 9}. A leitura da tabela pode ser da direita para esquerda ou vice-versa, de
cima para baixo ou vice-versa, na diogonal, ou formando um caminho qualquer. O
caminho sempre dever ser definido com antecedência.
Exemplo: Com o objetivo de estudar algumas caracteristicas dos funcionários de uma
escola, vamos extratir uma amostra aleatória simples de tamanho cinco. A listagem dos
funcionários da escola é apresentado a seguir.
3

Aristoteles Anastacia Arnaldo Bartolomeu
Bernardo Cardoso Carlito Claudia
Emilio Ercilio Ernesto Endevaldo
Francisco Felicio Fabricio Geraldo
Gabriel Getulio Heraldo João da Silva
Joana Joaquim Joaquina José da Silva
José de Souza Josefa Josefina Maria José
Maria Cristina Mauro Paula Paulo Cezar
Para utilizar uma tabela de números aleatória, precisamos associar cada elemnto da
população a um número. Vejamos
(1) Aristoteles (2) Anastacia (3) Arnaldo (4) Bartolomeu
(5) Bernardo (6) Cardoso (7) Carlito (8) Claudia
(9) Emilio (10) Ercilio (11) Ernesto (12) Endevaldo
(13) Francisco (14) Felicio (15) Fabricio (16) Geraldo
(17) Gabriel (18) Getulio (19) Heraldo (20) João da Silva
(21) Joana (22) Joaquim (23) Joaquina (24) José da Silva
(25) José de Souza (26) Josefa (27) Josefina (28) Maria José
(29) Maria Cristina (30) Mauro (31) Paula (32) Paulo Cezar
Para extrairmos uma amostra alaeatória simples de tamanho n=5, basta tomar cinco
números aleatórios do conjunto {1, 2, ..., 32}.
Números aleatórios extraídos da tabela 8, 30, 16, 2, 9
Amostra da população de funcionários (Claudia, Mauro, Geraldo,
Anastacia,Emilio).

3
Para facilitar a exemplificação das técnicas de amostragem, usaremos populações pequenas. Contudo,
não se costuma usar amostragem aleatória em população muito pequena
Na realidade, estamos interessados na observação de certas variáveis associadas
aos elemntos da amostra. No exmplo, poderiamos estar interessados na variável tempo
de serviço no hotel, em anos completos. Denominaremos esta variável de X. Para cada
funcionário da amostra, temos um valor para a variável X. O conjunto desse valores,
observado na amostra de funcionários, é chamada de amostra aleatória simples da
variável X.
Amostra aleatória simples de funcionários: {Claudia, Mauro,
Geraldo, Anastacia,
Emilio}
Amostra aleatória simples da variável X
} , , , , {
5 4 3 2 1
X X X X X
etc. Mauro, do serviço de tempo o é X Claudia, da serviço de tempo o é
2 1
X
4.2 Amostragem Proporcional Estratificada
A amostragem prporcional estratificada considera a população dividida em
subconjuntos, em que cada subconjunto recebe o nome de estrato. Cada subconjunto
(chamado estrato) tem uma caracteristica comum entre seus elementos. Estes estratos
devem ser internamente mais homogêneos do que a população toda, com respeito às
variáveis em estudo. Por exemplo, para estudar o interesse dos funcionários, de uma
grande empresa, em realizar um programa de treinamento, podemos estratificar esta
população por nivel de instrução ou pelo nivel hierárquico, ou ainda, por setor de
trabalho.


Exemplo: Suponha uma escola com 84 funcionário, em que 25 pessoas são do
sexo feminino e as 59 restantes são do sexo masculino. A população é constituida de pelo
menos 84 funcionários: N=84 (100%). Um dos estratos é constituído pelos funcionários
do sexo masculino: %) 70 ( 59
1
= N , o outro estrato é constituido pelos funcionários de
sexo feminino: %) 30 ( 25
1
= N .
A composição dos elementos da amostra deve manter a mesma proporcionalidade
dos estratos, do estrato
1
N serão retirados 70% dos elementos da amostra e o estrato
2
N serão retirados 30% dos elementos da amostra. Desta forma, tomaremos n=9. Assim,
Estrato Proporção da população Sugrupo da amostra
Homens 59/84=0,70 (ou 70%) 6 9 70 , 0
1
= = x n
Mulheres 25/84=0,30 (ou 30%) 3 9 30 , 0
1
= = x n
Sendo dos nove elementos da amostra : 6 homens e 3 mulheres.

4.3 Amostragem de Conglomerados
Conglomerados são divisões populacionais tendo em conta a proximidade física dos
elementos. Por exemplo, a população brasileira pode ser conglomerada em Estados
(Alagoas, Bahia, Ceará, etc.); a alagoana pode ser conglomerada em cidades de Alagaos
(Maceió, Arapiraca, Maragogi e outras); a cidade de Maceio, em bairros (Tabuleiro,
Pajuçara, Ponta Verde, etc.); os bairros são conglomeráveis em quarteirões etc.
A vantagem dos conglomerados é a proximidade fisica dos individuos, fato que
facilita a coleta de dados (não se precisa ter uma listagem completa da população).

Observe-se que estratificar e conglomerar são etapas facilitadoras da amostragem.
Definidos os estratos ou conglomerados, os elementos a inspecionar serão mais
representativos se escolhidos mediante os critérios estabelecidos para a amostragem
aleatória.
Exemplo: Considere o problema de selecionar uma amostra de domicilios de uma cidade.
Podemos tomar as ruas como conglomerados, como indicado no quadro abaixo, onde A1
representa o primeiro domicilio da rua A, A2 o segundo, e assim por diante.


4 Grupos
foram
escolhidos.
Ruas Domicilios
A A1, A2, A3, A4, A5, A6
B B1, B2, B3, B4, B5, B6, B7, B8, B9, B10, B11, B12, B13, B14
C C1, C2, C3, C4, C5, C6, C7, C8, C9, C10
D D1, D2, D3, D4
E E1, E2, E3, E4, E5, E6, E7, E8
Selecionar uma amostragem de conglomerados, selecionando três ruas (primeiro
estagio) e, nas ruas selecionadas, uma fração de amostragem de 50% de domicilios
(segundo estagio).

4.4 Amostragem Sistemática
A amostragem sistemática toma por base de seleção algum critério de escolha dos
elemntos. Exemplos que podem ser citados desta amostragem: os prédios de uma rua, os
funcionários de um hotel, as linhas de produção, etc..
A amostragem sistematica é adequada a situações em que os individuos tendem a
se suceder no tempo, como clientes em filas de banco, espectadores em bilheterias de
teatros e eleitores aguardando sua vez de votar.





Exemplo: Uma empresa matém um arquivo contendo os registros de antigos parceiros.
Entre um total de 10.000 fichas, podemos tirar de forma sistemática uma ficha a cada 10,
totalizando uma amostragem de 1.000 fichas. Para garantir a mesma probabilidade para
cada ficha da amostra, deverá ser feito um sorteio da primeira ficha entre as 10
primeiras.




Intervalo de seleção: N/n
Nesse exemplo, o intervalo de seleção é 10, de acordo com o cálculo 10.000/1.000
= 10.
Supondo que a primeira ficha sorteada foi a de número 4, as fichas que compõem a
amostra são:
{4, 14, 24, 34, 54, 64, ...., 9.984, 9.994}




















Atividade

1. Uma escola de ensino fundamental tem 1.000 alunos matriculados, sendo 200 na 1ª
série, 150 na 2ª série, 150 na 3ª série, 120 na 4ª série, 110 na 5ª série, 100 na 6ª sé-
rie, 90 na 7ª série e 80 na 8ªsérie. Obtenha uma amostra proporcional estratificada
de 60%.

2. Em uma academia há 450 pessoas matriculadas, sendo 220 no período da manhã,
180 à tarde e 50 à noite. Obtenha uma amostra proporcional estratificada de 65%.










Séries Estatísticas
Uma série estatística é um conjunto de dados ordenados segundo uma característica
comum, as quais servirão posteriormente para se fazer análises e inferências.

6.1 Série Temporal ou Cronológica: É a série cujos dados estão dispostos em correspon-
dência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local.

Produção de Petróleo Bruto no Brasil de 1976 a 1980

Anos Produção
(1000 m³)
1976 9 702
1977 9 332
1978 9 304
1979 9 608
1980 10 562

Fonte: Conjuntura Econômica (fev. 1983)


6.2 Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspon-
dência com o local, ou seja, varia o local e permanece constante a época e o fato.
População Urbana do Brasil em 1980

Região População(x
1000)
Norte 3 037
Nordeste 17 568
Sudeste 42 810
Sul 11 878
Centro-Oeste 5 115
Total 80 408

Fonte: Anuário Estatístico (1984

6.3 Série Específica ou Qualitativa: É a série cujos dados estão dispostos em correspon-
dência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a é-
poca e o local.


População Urbana e Rural do Brasil em 1980 (x 1000)

Localização População
Urbana 80 408
Rural 38 566
Total 118 974

Fonte: Anuário Estatístico (1984)

Número de passageiros de cruzeiros que partiram do Cabo Canaveral – Flórida, 1998

Cruzeiro Total de Passageiros
Canaveral 152.240
Carnival 480.924
Disney 73.504
Premier 270.361
Royal Caribbean 106.161
Sun Cruz Cassinos 453.806
Sterling Cruises 15.782
Topaz Internacional Ship-
ping
28.280

Fonte: McClave, 2001, p.61.

6.4 Série Mista ou Composta: A combinação de duas ou mais séries estatísticas constitu-
em novas séries denominadas compostas e apresentadas em tabelas de dupla entra-
da. O nome da série mista surge de acordo com a combinação de pelo menos dois e-
lementos

Local + Época = Série Geográfica Temporal
Local + Especifica = Série Geográfica Especifica










População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

Anos R E G I Õ E S
N NE SE S CO
1940 406 3 381 7 232 1 591 271
1950 581 4 745 10 721 2 313 424
1960 958 7 517 17 461 4 361 1 007
1970 1 624 11 753 28 965 7 303 2 437
1980 3 037 17 567 42 810 11 878 5 115

Fonte: Anuário Estatístico (1984)

Número de Quartos e de Hotéis em Cidades dos EUA-1995

Cidade Quartos Hotéis
Las Vegas 93.719 231
Orlando 84.982 311
Los Angeles 78.597 617
Chicago 68.793 378
Washington D.C. 66.505 351
Nova York 61.512 230
Atlanta 58.445 370
São Diego 44.655 352
Anahein –Santa
Ana
44.374 351
São Francisco 42.531 294

Fonte: McClave, 2001, p.64.


6.5 Série de Distribuição de Freqüências: A Quarta e última espécie de série estatística
é, de longe, a mais importante e a mais utilizada em estatística. Na distribuição de
freqüência, os dados são ordenados segundo um critério de magnitude, em classes
ou intervalos, permanecendo fixos o fato, o local e a época. Isto é, embora o fenô-
meno estudado seja único, este poderá sofrer uma subdivisão em classes






Exemplo: Altura dos estudantes do Curso de Gestão Ambiental – 2009

Altura (m) N° de alunos
1,50 |--- 1,60 14
1,60 |--- 1,70 29
1,70 |--- 1,80 37
1,80 |--- 1,90 18
1,90 |--- 2,00 2

A quantidade de vezes que um determinado dado ou valor é repetido na amostra
é chamada de freqüência absoluta ou freqüência simples e será indicada por f
i
.


















Atividade

Pesquise na internet ou em revistas séries estatísticas e classifique cada uma.








Distribuição de Frequências
















Distribuição de Freqüências

Para que uma variável estudada seja observada mais adequadamente, podemos
dispor ordenadamente seus valores em uma tabela. Essa tabela é chamada de distribui-
ção de freqüências ou tabela de freqüências.

6.1 Definições básicas

Freqüência absoluta ou freqüência (

): é a quantidade de vezes que um determinado
dado ou valor é repetido na amostra.

Dados brutos: são valores ou os dados originais ainda não numericamente organi-
zados após a coleta ou digitação.

Rol: é a ordenação dos valores ou dados obtidos (dados brutos) em ordem cres-
cente ou decrescente de grandeza numérica ou qualitativa.
Distribuição de Freqüência é uma série estatística onde os dados se encontram
dispostos em categorias ou classes juntamente com as respectivas freqüências. Dessa
forma, podemos dividir as distribuições de freqüências em dois tipos: distribuição de fre-
qüência de dados agrupados sem intervalo de classes e distribuição de freqüências de
dados agrupados em intervalos de classe.
Exemplo 6.1:
Construir a distribuição de freqüências para as idades, em anos, de um grupo de amigos
do IFAL.
Tabela 6.1 – Idades de 20 amigos do IFAL- dados brutos
14 15 16 16 16 14 14 15 17 14
15 16 17 17 16 15 14 15 15 15

Colocando em ordem crescente (rol) as idades, temos
Tabela 6.2 – Idades de 20 amigos do IFAL - rol
14 14 14 14 14 15 15 15 15 15
15 15 16 16 16 16 16 17 17 17

Tabela 6.3 - Distribuição de idade de 20 amigos do IFAL
Idade (em anos) Freqüência (fi)
14 5
15 7
16 5
17 3

Observação: De acordo com os dados organizados podemos ver facilmente que:
 O grupo de amigos pesquisados é formado de 20 pessoas;
 A pessoa mais velha tem 17 anos e a mais nova tem 14 anos;
 A maioria tem 15 anos (7 pessoas);
 A minoria tem 17 anos (3 pessoas).

6.2 Tipos de freqüências

6.2.1 Freqüência relativa
O quociente obtido entre a freqüência absoluta (

) e o número de elementos (n) da
amostra é chamado de freqüência relativa: =

Para que a interpretação dos dados se torne mais clara, a frequência relativa,
geralmente, é apresentada na forma de percentagem e é indicada por (

) (%).
Exemplo 2: Os dados abaixo referem-se ao número de horas trabalhados por uma equipe
de enfermeiros em um hospital durante 2 fins de semana. Construir a tabela de
distribuição de freqüências com freqüências relativas em percentagem correspondente
aos dados fornecidos.
Tabela 6.4 – Número de horas trabalhadas por uma equipe de 30 enfermeiros
6 8 2 7 10 5 6 7 2 10
6 8 7 7 6 5 2 7 8 10
8 7 7 7 6 10 5 5 5 5

Colocando os dados em ordem crescente, temos:
Tabela 6.5 – Número de horas trabalhadas por uma equipe de 30 enfermeiros - Rol
2 2 2 5 5 5 5 5 5 6
6 6 6 6 7 7 7 7 7 7
7 7 8 8 8 8 10 10 10 10

Tabela 6.6 – Distribuição de frequencias em horas trabalhadas (de 30 enfermeiros de um
hospital)
Tempo (em horas) Freqüência (

) Freqüência Relativa (

) (%)
2 3
=
3
30
= 0,10 → 10%
5 6
=
6
30
= 0,20 → 20%
6 5
=
5
30
= 0,1667 → 16,67%
7 8
=
8
30
= 0,2667 → 26,67%
8 4
=
4
30
= 0,1333 → 13,33%
10 4
=
4
30
= 0,1333 → 13,33%
Total (n) 30
O que diferencia a freqüência absoluta (

) da freqüência relativa (

) é o fato de
que, na absoluta, trabalhamos com o número de elementos, enquanto que, na relativa,
trabalhamos com percentual de elementos.
6.2.2 Freqüências Acumuladas
A soma da freqüência absoluta do elemento considerado com todos os anteriores
é chamada de freqüência absoluta acumulada e pode ser indicada por

ou

.
A soma da freqüência relativa do elemento considerado com todos os anteriores
é chamada de freqüência relativa acumulada e pode ser indicada por

ou

.
As freqüências acumuladas tanto absolutas quanto relativas contribuem para a
interpretação dos dados organizados em uma tabela de distribuição de freqüências.
É a soma da freqüência simples deste elemento com as freqüências simples ante-
riores da série.
i 2 1 i
f f f F + + + = 
È a divisão da freqüência acumulada deste elemento, pelo número total de ele-
mentos da série.
n
i
F
F
i
R
=

Observe que a soma das freqüências é: =
1
+
2
+
3
+
4
+
5
+
6

= 3 +6 +5 +8 +4 +4 = 30 = 30
Vejamos com o exemplo anterior.
A tabela abaixo referem-se ao número de horas trabalhados por uma equipe de
enfermeiros em um hotel durante 2 fins de semana. Construir a tabela de distribuição de
freqüências acumuladas, tanto absoluta quanto relativa.
Tabela 6.7 – Distribuição de frequencia acumulada (de horas trabalhadas por uma equipe
de 30 enfermeiros)
Tempo (em horas) Freqüência (

)

(Freqüência acumulada)
2 3 3
5 6 9 (=3+6)
6 5 14 (=3+6+5 ou =9+5)
7 8 22 (=3+6+5+8 ou =14+8)
8 4 26 (=3+6+5+8+4 ou =22+4)
10 4 30 (=3+6+5+8+4+4 ou =26+4)
Total n=30
Tabela 6.8 – Distribuição de frequencias relativas (de horas trabalhadas por uma equipe
de 30 enfermeiros)
Tempo (em
horas)
Freqüência
Relativa (

)
(%)

(%) (Freqüência Relativa acumulada)
2 10 10 (=à primeira

)
5 20 30 (=10+20)
6 16,67 46,67 (=10+20+16,67) ou (=30+16,67)
7 26,67 73,34 (=10+20+16,67+26,67) ou (=46,67+26,67)
8 13,33 86,67 (=10+20+16,67+26,67+13,33) ou
(=73,34+13,33)
10 13,33 100 (=10+20+16,67+26,67+13,33+13,33) ou
(=86,67+13,33)
Total 100%

Observando os dados das tabelas, podemos concluir que:
- A freqüência acumulada 14 poderá ser encontrada fazendo a soma da freqüência
acumulada anterior (9) com a freqüência correspondente à linha que queremos
encontrar (5).
- A maior freqüência relativa apresentada é 26,67%, que corresponde a 8 enfermei-
ros que trabalharam 7 horas.
- A menor freqüência relativa apresentada é 10%, que corresponde a 3 enfermeiros
que trabalharam 2 horas.
- 30% dos enfermeiros trabalharam menos do que 6 horas.
- 73,34% dos enfermeiros correspondem a 22 enfermeiros que trabalharam 7 ou
menos que 7 horas.


Exemplo 6.2: Considere a distribuição agrupada sem intervalo de classe:

Tabela 6.9 – distribuição de frequencias sem intervalos
i
x
i
f
2 3
3 7
4 8
6 6
7 1
Total 25



Freqüência relativa do primeiro elemento
% 12 12 , 0
25
3
n
f
f
1
r
1
ou = = =
Freqüência relativa do segundo elemento
% 28 28 , 0
25
7
n
f
f
2
r
2
ou = = =

Da mesma forma determinamos a freqüência relativa dos outros elementos









6.3 Distribuição de Freqüência para dados agrupados em intervalos de
classe
Utiliza-se este tipo de distribuição quando o número de observações é grande e o
numero de valores distintos que assume a variável também é grande; os resultados obti-
dos deverão ser dispostos em classes ou categorias que assumam amplitudes dentro das
quais se incluirão os dados. Devemos escolher apropriadamente o tamanho dos interva-
los
6.3.1 Elementos de uma Distribuição de Freqüência

6.3.1.1 Classes
São intervalos ou subdivisões dos elementos do conjunto. As classes são sempre
definidas por dois limites – inferior e superior.
Na tabela 6.1 as alturas de estudantes de um acampamento esta representada
por uma distribuição de cinco classes, isto é,
Tabela 6.10: Distribuição de freqüência das alturas de 50 estudantes
Altura dos estudantes (m) Freqüência (fi)
1,50 |--- 1,60 6 Primeira classe
1,60 |--- 1,70 11 Segunda classe
1,70 |--- 1,80 19 Terceira classe
1,80 |--- 1,90 10 Quarta classe
1,90 |--- 2,00 4 Quinta classe
Total 50
Vemos que a primeira classe é a que vai de 1,50m a 1,60m; a segunda classe vai
de 1,60m a 1,70m e assim por diante. A quinta classe vai de 1,90m a 2,00m.
% 32 32 , 0
25
8
n
f
f
3
r
3
ou = = =
% 24 24 , 0
25
6
n
f
f
4
r
4
ou = = =
% 4 04 , 0
25
1
n
f
f
5
r
5
ou = = =
6.3.1.2 Intervalo de Classe
Existe uma diferença sutil entre o que entendemos por classe e por intervalo de
classe! Um exemplo simples elucidará o fato: se tomarmos, a quarta classe do nosso e-
xemplo (a altura dos estudantes) de distribuição de freqüências, vemos que esta classe
vai de 1,80m a 1,90m.
Tabela 6.11: Distribuição de freqüência das alturas de 50 estudantes

Altura dos estudantes (m) Freqüência (fi)
1,50 |--- 1,60 6 Primeira classe
1,60 |--- 1,70 11 Segunda classe
1,70 |--- 1,80 19 Terceira classe
1,80 |--- 1,90 10 Quarta classe
1,90 |--- 2,00 4 Quinta classe
Total 50
Eis a questão: um estudante que está medindo exatamente 1,90m integrará esta
quarta classe? Ora, se olharmos atentamente, vemos que este valor 1,90m também faz
parte da quinta classe (como limite inferior!). E então? O estudante com 1,90m será
computado na terceira ou na quarta classe? Aí é que entra o conceito de intervalo de
classe! Dependendo da nomenclatura utilizada pela questão para construir as classes,
teremos definidos os intervalos de classe, e saberemos responder à questão colocada.
São as seguintes
Limite inferior (Linf): o número menor é o limite inferior da classe (1,50 |--- 1,60, em que

1
=1,50 é o limite inferior da primeira classe).
Limite superior (Lsup): o número menor é o limite inferior da classe (1,50 |--- 1,60, em
que
1
=1,60 é o limite superior da primeira classe).
Este símbolo utilizado “|--- “ estabelece a inclusão do limite inferior e a exclusão
do limite superior do intervalo de classe.
O intervalo 1,50 |--- 1,60 indicam inclusão do limite inferior 1,50 (ou seja, a partir
da altura 1,50m exatos o estudante está incluído nessa classe) e indica exclusão do limite
superior (significa que a partir da altura 1,60m exatos a criança está excluída dessa clas-
se).
Segundo a resolução 886/1966 do IBGE, os intervalos de classe devem empregar o
símbolo de inclusão e exclusão (|---) entre os valores extremos de um intervalo.
6.3.1.3 Amplitude de um intervalo de classe (

)
A amplitude de um intervalo de classe (ℎ

) é a diferença entre o limite superior
(

) e o limite inferior (

) de uma classe.

=

Na tabela 6.1: ℎ
1
= 1,60 −1,50 = 0,10

2
= 1,70 −1,60 = 0,10

3
= 1,80 −1,70 = 0,10

4
= 1,90 −1,80 = 0,10

5
= 2,00 −1,90 = 0,10
Neste caso, as amplitudes de cada intervalo são iguais, porém, não é obrigatório
que elas sejam; podemos ter eventualmente amplitudes diferentes ℎ
1
≠ ℎ
2
≠ ℎ
3
≠ ⋯
Embora as amplitudes possam ser diferentes, é mais conveniente que as classes
mantenham amplitudes iguais, pois facilita a visualização do fato pesquisado e agiliza os
cálculos realizados.

6.3.1.4 Amplitude total da distribuição (

)
Amplitude total da distribuição (

) é a diferença entre o Limite Superior da últi-
ma classe (

) e o Limite Inferior da primeira classe (

):

=

Na tabela 6.1 temos que:

= 2,00 −1,50 = 0,50
6.3.1.5 Amplitude Amostral ()
Amplitude amostral () é a diferença entre o Valor Máximo (

) e o Valor
Mínimo (

) dos dados colhidos na amostra:
=

No exemplo 2, observamos que o valor da amplitude amostral é:
= − =
6.3.1.6 Ponto Médio de uma classe (

)
Ponto médio de uma classe (

) é o ponto que, por situar-se numa posição média
da distribuição de valores do intervalo de classe, divide o intervalo em duas partes iguais:

=

+

2

Na tabela 1 temos que:
O ponto médio da primeira classe é:
1
=
1,60+1,50
2
= 1,55
O ponto médio da segunda classe é:
2
=
1,70+1,60
2
= 1,65
O ponto médio da quinta classe é:
5
=
2,00+1,90
2
= 1,95

6.3.2 Construindo uma distribuição de freqüências com intervalos de classe
Quantas classes serão necessárias para representar o fato? Existem vários crité-
rios que podem ser utilizados a fim de possuirmos uma idéia do melhor número de clas-
ses, porém tais critérios servirão apenas como indicação e nunca como regra definitiva,
pois caberá sempre ao pesquisador estabelecer o melhor número, levando-se em conta o
intervalo de classe apropriado e a facilidade para os posteriores cálculos numéricos.
É importante a escolha do número de classes e da amplitude. Se o número de ob-
servações é pequeno, devemos restringir a amplitude; por outro lado, se o número de
observações é grande, as amplitudes também serão maiores.
Passaremos, por meio dos passos descritos abaixo, a conhecer a maneira conven-
cional utilizada na elaboração de uma distribuição de freqüências com intervalos de clas-
ses.
1°Passo: Definir o número de classes.
Para se determinar o número de classe (k) a partir do número de elementos ob-
servados (), podemos citar duas maneiras distintas:
a) Regra de Sturges: = 1 + 3,3 × log⁡()
b) Regra da raiz quadrada: =
Empiricamente os agrupamentos devem definir a ordem de grandeza do número
de intervalos; o valor efetivo é o número inteiro mais conveniente, em torno do valor
calculado.
2°Passo: Definir a amplitude amostral.
A amplitude amostral, conforme visto anteriormente, nada mais é senão o pró-
prio tamanho do conjunto. É a diferença entre seu maior elemento (ou valor) e seu me-
nor elemento (ou valor).
Teremos que
=

3°Passo: Definir a amplitude do intervalo de classe.
Teremos que: ℎ

=

Ou seja, a amplitude do intervalo de classe será o quociente entre a amplitude
amostral (segundo passo) e o número de classes das distribuição (primeiro passo).
Como se verifica nestes passos, a forma usual de trabalharmos com distribuições
de freqüências agrupados em intervalos de classes são orientadas no sentido de termos
todas as suas classes com a mesma amplitude.

4°Passo: Escolher os limites de classe
Os intervalos de classe são determinados da seguinte forma:
1°: ⊢ +ℎ

2°: +ℎ

⊢ +2ℎ

3°: +2ℎ

⊢ +3ℎ

E assim por diante

5°Passo: Construir a tabela de distribuição de freqüências.
Exemplo 6.3: O quadro a seguir apresenta os dados de concentração de progesterona em
exames de pacientes de um laboratório, é medida em ng/ml. Construir a distribuição de
freqüências em intervalos de classes e os pontos médios de cada intervalo.
Tabela 6.12: concentração de progesterona de pacientes de um laboratório
7,62 25,14 9,07 6,33 11,57 11,31 52,22 36,25 15,12 8,38
11,44 7,80 17,85 7,57 7,74 6,73 29,53 8,96 60,50 12,49
8,88 10,99 12,01 12,61 19,80 7,90 19,01 57,05 39,00 17,48
5,94 15,65 8,22 71 6,93 8,70 8,56 19,80 15,38 7,54
7,60 9,00 12,00 70
Fazendo o rol, temos:
Tabela 6.13: concentração de progesterona de pacientes de um laboratório em ordem
crescente
5,94 7,57 7,9 8,88 11,31 12,49 17,48 25,14 57,05
6,33 7,6 8,22 8,96 11,44 12,61 17,85 29,53 60,5
6,73 7,62 8,38 9 11,57 15,12 19,01 36,25 70,00
6,93 7,74 8,56 9,07 12 15,38 19,8 39,00 71,00
7,54 7,8 8,7 10,99 12,01 15,65 19,8 52,22

1°Passo: Iremos determinar o numero de classes utilizando a Regra de Sturges
= 1 +3,3 × log44 = 1 +3,3 × 1,644439
= 1 +5,426647 = 6,426647
Como o número de classe é sempre um número inteiro e utilizando os critérios de
arredondamento, então = 6
2°Passo: Iremos determinar a amplitude amostral da distribuição:
=

= −, = ,

3°Passo: Determinar a amplitude do intervalo de classe (ℎ

).

=

=
65,06
6
= 10,84
Convencionar como amplitude das classes o valor imediatamente superior ao en-
contrado, considerando o número de decimais dos dados. Desta forma,

= 10,90
4°Passo: Escolher os limites de classe. Como são seis classes, temos então:
1°: ⊢ +ℎ

5,94 ⊢ 5,94 + 10,90
5,94 ⊢ 16,84
2°: +ℎ

⊢ +2ℎ

5,94 +10,90 ⊢ 5,94 +2 × 10,90
16,84 ⊢ 27,74
3°: +2ℎ

⊢ +3ℎ

5,94 +2 × 10,90 ⊢ 5,94 +3 × 10,90
27,74 ⊢ 38,64
4°: +3ℎ

⊢ +4ℎ

38,64 ⊢ 49,54
5°: + 4 ⊢ +5ℎ

49,54 ⊢ 60,44
6°: +5ℎ

⊢ +6ℎ

60,44 ⊢ 71,34





5°Passo: Construir a distribuição de freqüências.
Tabela 6.14 – Distribuição de frequencias com intervalos de classes e ponto médio
Intervalos de Classes Freqüência (

) Ponto Médio (

)
5,94 ⊢ 16,84 30

1
=
5,94 +16,84
2
= 11,39
16,84 ⊢ 27,74 6
2
= 22,29
27,74 ⊢ 38,64 3
3
= 33,19
38,64 ⊢ 49,54 1
4
= 44,09
49,54 ⊢ 60,44 2
5
= 54,99
60,44 ⊢ 71,34 2
6
= 65,89
Total 44


Atividade

1. Os dados abaixo representam o número de filhos por família de 32 famílias entrevis-
tadas em um determinado hospital de Maceió:

Tabela 6.15 – Número de filhos de 32 familias

0 1 2 0 3 3 0 1 4 2
1 2 1 3 2 4 1 3 1 2
1 3 2 3 1 3 0 2 2 1
2 2
Organize os dados e construa a tabela de distribuição de freqüências com dados agru-
padas sem intervalos de classes.
2. O quadro a seguir apresenta as notas obtidas por 132 pessoas, em um exame de se-
leção para candidatos a professor de Biologia de uma determinada cidade. Agrupe-
as em ordem crescente e depois construa uma distribuição de freqüências com in-
tervalos de classe.

Tabela 6.16 – Notas de 132 candidatos de um exame de seleção
78 83 77 74 79 77 76 82 75 77
74 80 76 80 75 84 77 76 81 79
83 76 81 82 79 75 78 82 79 81
79 81 85 78 78 75 85 79 80 79
76 75 85 80 82 84 75 79 78 87
77 80 78 75 72 79 78 71 81 70
85 79 80 73 76 75 85 80 82 84
75 79 76 78 80 82 76 80 76 71
77 79 78 74 84 76 74 79 73 73
74 76 88 74 77 84 77 83 78 79
77 74 82 80 74 73 80 75 79 78
77 84 76 77 74 77 77 72 79 80
86 76 79 76 70 73 76 71 79 89
86 85


Determine também;
a) A porcentagem de candidatos com nota abaixo de 79.
b) A porcentagem de candidatos com notas no intervalo 74 ⊢ 80.
c) O ponto médio de cada intervalo de classe.
d) A freqüência relativa da quinta classe.


3. As notas obtidas por 50 alunos de uma classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 4 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9

a. Complete a distribuição de freqüência abaixo:
NOTAS x
i
f
i

0 ׀— 2
2 ׀— 4
4 ׀— 6
6 ׀— 8
8 ׀— 10
1
....
....
....
....
1
....
....
....
....
∑f
i
= 50

b. Agora responda:
I. Qual a amplitude amostral?
II. Qual a amplitude da distribuição?
III. Qual o número de classes da distribuição?
IV. Qual o limite inferior da quarta classe?
V. Qual o limite superior da classe de ordem 2?
VI. Qual a amplitude do segundo intervalo da classe?

c. Complete:
I. h
3
= .... II. n = .... III. l
1
= .... IV. L
3
= .... V. x
2
= .... VI. f
5
= ....

4. Complete a distribuição abaixo, determinando as freqüências simples:

x
i
f
i
F
i



2
3
4
5
6
....
....
....
....
....
2
9
21
29
34

∑ f
i
= 34











Gráficos Estatísticos




Gráfico é uma forma de apresentação de dados estatísticos, com o objetivo de
produzir no investigador ou no público em questão uma impressão mais rápida e com-
preensível do problema pesquisado, através dos gráficos podemos interpretar melhor as
séries estatísticas.
O gráfico deve ser composto de simplicidade, clareza e veracidade, ou seja deve
expressar a verdade e possibilitar um claro entendimento da pesquisa ao público inte-
ressado.
Diagramas: são gráficos de no máximo duas dimensões; para sua construção, em
geral, fazemos uso do sistema cartesiano.
Vamos apresentar os gráficos mais utilizados na hotelaria.

7.1 Gráfico em linha

Constitui uma aplicação do processo de representação de funções num sistema de
coordenadas cartesianas.
Fazemos uso de duas retas perpendiculares; as retas são o eixo x (eixo das abscissas)
e o eixo y (eixo das ordenadas).
Exemplo 7.1: Para o melhor entendimento vamos considerar a seguinte série estatística:

Tabela 7.1 Entrada de turistas argentinos no Brasil.
ANOS QUANTIDADE (x1.000)
1994 787,117
1998 1.467,922
1999 1.548,571
Fonte: OMT


787,117
1.467,92
1.548,57
0
200
400
600
800
1000
1200
1400
1600
1800
1994 1998 1999

Grafico 7.1

Vamos considerar os anos como eixo x (abscissas) e as quantidades como orde-
nadas (eixo y). Assim um ano dado e sua respectiva quantidade formam um par ordena-
do.

7.2 Gráfico em colunas ou em barras
É a representação de uma série por meio de retângulas, dispostos verticalmente
(gráfico em colunas) ou na forma horizontal (gráfico em barras).
Exemplo 7.2:
Tabela 4.2 Visita de Turistas Estrangeiros ao Brasil
ANOS Número de Turistas (em milhões)
1994 1,8
1998 4,8
1999 5,1
2000 5,2
Fonte: Embratur







Veja abaixo as representações gráficas em colunas e barras em duas e três di-
mensões:
1,8
4,8
5,1
5,2
0
1
2
3
4
5
6
1994 1998 1999 2000
Número de Turistas (em milhões)

Gráfico 2
0
1
2
3
4
5
6
1994 1998 1999 2000
Número de Turistas (em milhões)
1994
1998
1999
2000

Gráfico 3
1,8
4,8
5,1
5,2
0 1 2 3 4 5 6
1994
1998
1999
2000
Número de Turistas (em milhões)
1994
1998
1999
2000

Gráfico 4

0 1 2 3 4 5 6
1994
1998
1999
2000
Número de Turistas (em milhões)
1994
1998
1999
2000

Gráfico 5

7.3 Gráficos em colunas ou em barras múltiplas

Este tipo de gráfico é geralmente empregado quando queremos representar dois
ou mais fenômenos estudados num mesmo gráfico com a finalidade de comparação.
Exemplo 7.3:
Tabela 7.3 Clientes de um restaurante de um hotel
Idade (anos) Hóspedes?
Sim Não
Até 25 20 31
De 31 até 45 49 70
Mais de 45 41 49

0
10
20
30
40
50
60
70
Até 25 De 26 até 35 Mais de 35
Hóspedes? Sim
Hóspedes? Não

Grafico 6
A construção do gráfico em colunas (ou barras) associa a variação ocorrida em re-
lação a hóspedes a uma cor de retângulos (azul), e a variação ocorrida a não hóspedes a
outra cor (vermelha); dessa forma, é possível a visualização e comparação das variações
ocorridas nesses dois casos. Este gráfico também poderia ter sido construído em barras
múltiplas.

7.4 Gráfico de colunas comparativas

a. Colunas Justapostas (gráfico comparativo)
Exemplo 7.4: População Urbana do Brasil por Região de 1940 a 1980 (x 1000)


Gráfico 7















b. Colunas Sobrepostas (gráfico comparativo)

Exemplo 7.5: População Urbana do Brasil por Região de 1940 a 1980 (x 1000)


Gráfico 8

7.5 Gráficos em Setores

Gráfico construído com base em um círculo, e é empregado sempre que deseja-
mos ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas
são as partes.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando
que o total da série corresponde a 360º.
O gráfico em setores só deve ser empregado , quando há, no máximo sete dados;
Se a série já é apresentada de forma percentual, obteremos os seguintes valores em
graus multiplicando por 3,6.







Exemplo 7.6: Criação de gado nos Estados da Região Sudeste.
Tabela 7.4 – Quantidade de cabeças de gado dos estados da região Sudeste
ESTADOS QUANTIDADE (1.000 cabeças)
Minas Gerais 3.363,7
Espírito Santo 430,4
Rio de Janeiro 308,5
São Paulo 2.035,9
Total 6.138,5

Utilizando a regra de três:
6.138 -------- 360º
3.363,7-------- X

X 1 = 197º
X 2 = 25º
X3 = 18º
X4 = 120º

Com esses dados (valores em graus), marcamos num círculo de raio arbitrário,
com um transferidor , os arcos correspondentes , obtendo o gráfico abaixo:

QUANTIDADE (1.000 cabeças)
Minas Gerais
Espírito Santo
Rio de Janeiro
São Paulo

Grafico 9
7.6 Gráfico Pictorial – Pictograma

Tem por objetivo despertar a atenção do público em geral, muito desses gráficos
apresentam grande dose de originalidade e de habilidade na arte de apresentação dos
dados. Podem ser representados por diferentes formas de figuras, tais como pessoas,
objetos, etc.
Exemplo 7.7:
a) Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)

Grafico 10

b) Evolução da frota nacional de carros à álcool de 1979 à 1987


Gráfico 11








c) Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entre-
vistados no Canadá


Gáfico 12

d) Devastação de Matas: extração de madeiras no Brasil


Grafico 13


7.7 Gráfico Polar

É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a
série que apresenta uma determinada periodicidade.
Como construir um gráfico polar
a. Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio de
comprimento proporcional a média dos valores da série);
b. Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e
com uma escala (eixo polar);
c. Divide-se a circunferência em tantos arcos forem as unidades temporais;
d. Traça - se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;
e. Marcam-se os valores correspondentes da variável, iniciando pela semi-reta hori-
zontal (eixo polar);
f. Ligam-se os pontos encontrados com segmentos de reta;
g. Para fechar o polígono obtido, emprega-se uma linha interrompida.


Grafico 14

7.8 Cartograma

É a representação de uma carta geográfica. Este tipo de gráfico é empregado
quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as
áreas geográficas ou políticas
Dados absolutos (população) – usam-se pontos proporcionais aos dados.
Dados relativos (densidade) – usa-se hachaduras.


Tabela 7.5 – População dos estados da Região Sul
Estado População (hab.) Área (m²) Densidade
Paraná 9.137.700 199.324 45,8
Santa Catarina 4.461.400 95.318 46,8
Rio Grande do Sul 9.163.200 280.674 32,6
Fonte: IBGE


Grafico 15






















Atividade

1) Utilizar um gráfico de setores e o gráfico de colunas para representar a série abaixo:
Tabela 7.6 – Meios de transportes utilizados por estudantes do IFAL

Meio de transporte Número de estudan-
tes (%)
Automóveis 20
Ônibus 58
Bicicletas 18
Moto 4
TOTAL 100

2. Represente a série abaixo usando o gráfico em linhas
Tabela 7.7 - Comércio exterior Brasil 1984-1993

ANOS Exportação
1984 141.737
1985 146.351
1986 133.832
1987 142.378
1988 169.666
1989 177.033
1990 168.095
1991 165.974
1992 167.295
1993 182.561


3) Usando o gráfico em barras, represente a tabela:
Tabela 7.8 - Produção de ovos de galinha Brasil – 1992
Regiões Quantidade (1.000 dúzias)
Norte 57.297
Nordeste 414.804
Sudeste 984.659
Sul 615.978
Centro-Oeste 126.345

4) A tabela abaixo representa o desmatamento detectado pela Secretaria de Meio Am-
biente do Mato Grosso (SEMA), no período de 2003 a 2005, faça os gráficos de seto-
res e de coluna:
Tabela 7.9

REGIÕES
ÀREA DESMATADA
(
2
km )
Centro-Norte 13520
Noroeste 5792
Extremo Norte 5212
Nordeste 3575
Sudoeste 1791
Sudeste 1444
Sul 695
TOTAL




5) Os dados a seguir referem-se aos casos e incidência (por 100.000 habitantes) de tu-
berculose pulmonar por faixa etária no município X em 2002. Desenhe o grafico de
colunas para essa distribuição.

Tabela 7.10
Faixa etária (anos) fi
0 – 4 8
5 – 14 7
15 – 24 7
25 – 44 19
45 – 64 22
65 + 9
Total 72























Medidas de Posição




Medidas de Posição
Vimos anteriormente a sintetização de dados sob a forma de tabelas e gráficos.
Agora vamos aprender o cálculo de medidas que possibilitam representar um conjunto
de dados de forma reduzida, ressaltando as tendências de cada conjunto isoladamente
ou em confronto com outros. Tais medidas são chamadas de Medidas de Posição.
As medidas de posições mais importantes são as medidas de tendência central
que recebem tal dominação pelo fato de que os dados observados tenderem, em geral, a
se agrupar em torno de valores centrais. Dentre as medidas de tendência central vere-
mos:
- Média Aritmética
- Mediana
- Moda

8.1 Média Aritmética Simples (dados não agrupados)

A média aritmética simples de um conjunto de valores é igual ao quociente entre
a soma desses valores e o número total deles.
Sendo
n
x x x x , , , ,
3 2 1

os n valores da variável x, a média aritmética simples
desses valores e representada por X é definida por
n
x
X
i ¿
=
Exemplo 8.1 – Determine a média aritmética simples dos conjuntos de valores 3, 4, 5, 6,
7.
5
5
25
5
7 6 5 4 3
= =
+ + + +
= X

8.2 Média Aritmética Ponderada (dados agrupados)

Quando os dados estiverem agrupados numa distribuição de freqüência, usare-
mos a média dos valores
n
x x x x , , , ,
3 2 1

ponderados pelas respectivas freqüências
absolutas:
n
f f f f , , , ,
3 2 1




Assim:

¿
¿
=
i
i i
f
x f
X , onde n f
i
=
¿


Exemplo 8.2 - Dados agrupados sem intervalos de classe
Os dados da distribuição de freqüências representam o número de filhos por família
de 32 famílias entrevistadas em um determinado ambulatório médico. Determine a mé-
dia aritmética dos dados da distribuição.
Tabela 8.1 – Número de filhos por familia
Nº de filhos por
família (
i
x )
Famílias (
i
f )
i i
f x

0 4 0
1 8 8
2 10 20
3 7 21
4 3 12
Total N=32 61

9 , 1
32
61
= = =
¿
¿
i
i i
f
x f
X

Exemplo 8.3 - Dados agrupados com intervalo de classe
Foi feito um estudo sobre a concentração de nitratos na água de 100 bueiros que
deságuam em uma lagoa. Os resultados são apresentados na Tabela 8.2. Determine a
média aritmética dessa distribuição (nesse caso, o x
i
é o ponto médio da classe):
Tabela 8.2 – Concentração de nitrato na água de 100 bueiros
Concentração de Ni-
trato (mg/l)
Número de bueiros
(
i
f )
i
x
i i
f x

140 |--- 160 7 150 1050
160 |--- 180 20 170 3400
180 |--- 200 33 190 6270
200 |--- 220 25 210 5250
220 |--- 240 11 230 2530
240 |--- 260 4 250 1000
100 19500

195
100
19500
= = =
¿
¿
i
i i
f
x f
X
Logo, a média de concentração de nitrato na água é de 195mg/l

8.3 Mediana

É o elemento que ocupa a posição central de um conjunto de dados, cujos valores
estão colocados na ordem crescente. A mediana é representada por Md.

8.3.1 Determinação da Mediana para dados não agrupados
Quando o número de elementos for ímpar, a mediana será o elemento de ordem
2
1 + n
, iso é,
2
1 +
=
n
posição na está que Elemento Md
Quando o número de elementos for par, a mediana será a média aritméti-
ca dos elementos de ordem
2
n
e 1
2
+
n
.
2
1
2 2
|
.
|

\
|
+ +
=
n
posição na está que Elemento
n
posição na está que Elemento
Md

Exemplo 8.3 - Determine a mediana dos conjuntos de valores abaixo:
X (2, 3, 5, 6, 7, 8, 9)
Y (1, 2, 4, 5, 6, 7, 8, 9)
Como o número de elementos do conjunto X é ímpar (n = 7), a mediana é o elemento de
ordem
4
2
8
2
1 7
2
1
= =
+
=
+ n
, isto é, a mediana é o 4º elemento do conjunto, logo Md=6
Observamos que 50% dos elementos estão abaixo da mediana e 50% estão acima.
No conjunto Y, o número de elementos é par (n = 8), a mediana é a média dos elemen-
tos de ordem
5 1 4 1
2
8
2
1
e 4
2
8
2
= + = + =
+
= =
n n

Tomando então a média dos elementos que estão nas posições 4º e 5º, respectivamente,
temos que a mediana é
5 , 5
2
6 5
2
1
2 2
=
+
=
|
.
|

\
|
+ +
=
n
posição na está que Elemento
n
posição na está que Elemento
Md

8.3.2 Determinação da Mediana para dados agrupados sem intervalo de classe
Se os dados se agrupam em uma distribuição de freqüência, o cálculo de mediana se
processa de modo semelhante a aquele dos dados não agrupados, implicando, porém, a
determinação prévia das freqüências acumuladas, pois é ela que indica onde está a posi-
ção da mediana.
Exemplo 8.4 - Determine a mediana da distribuição abaixo:
Tabela 8.3 - Distribuição de frequencia do número de filhos por familia

Nº de Filhos f
i
F
ac

0 3 3
1 2 5
2 4 9
3 6 15
4 3 18
5 2 20
Σ 20 -
Como n = 30, n é par, logo a mediana será a média aritmética entre os elementos de or-
dem
10
2
20
2
= =
n
e 11 1
2
20
1
2
= + = +
n
.
Assim, o 10º elemento corresponde a 3 e o 11º elemento corresponde a 3, logo:
3
2
3 3
2
1
2 2
=
+
=
|
.
|

\
|
+ +
=
n
posição na está que Elemento
n
posição na está que Elemento
Md

8.3.3 Cálculo da mediana para dados agrupados com intervalo de classe
Nesse caso a mediana é determinada pela seguinte fórmula:
i
i
ant ac
h
f
F
n
l Md ×
|
|
|
|
.
|

\
|
÷
+ =
2
inf

Onde:
2
n
é a posição da mediana
inf
l
– Limite inferior da classe mediana
ant ac
F
– Freqüência acumulada anterior a classe mediana
i
f
– Freqüência absoluta da classe mediana
i
h
– amplitude do Intervalo da classe mediana





Exemplo 8.5 - Determine a mediana da distribuição abaixo:
Tabela 8.4
Tempo de
Serviço
f
i
F
ac

2 |― 6 4 4
6 |― 10 7 11
10 |― 14 13 24
14 |― 18 9 33
18 |― 22 5 38
Σ 38

1º passo: calcular a posição da mediana, isto é, 19
2
38
2
= =
n
, logo a mediana está na dé-
cima nona posição.
2º passo: pela
ac
F
identifica-se a classe que contém a mediana (
ac
F
= 24, cuja clas-
se é 10 |― 14).
3º passo: Determinar a freqüência acumulada anterior a freqüência da classe da media-
na, isto é,
11 =
ant ac
F

4º passo: Limite inferior da classe mediana, isto é,
10
inf
= l

5º passo: Determinar a freqüência absoluta da classe mediana, isto é,
13 =
i
f

6º passo: Determinar a amplitude do intervalo da classe mediana, isto é,
4 10 14 = ÷ =
i
h

7º passo: utiliza-se a fórmula
i
i
ant ac
h
f
F
n
l Md ×
|
|
|
|
.
|

\
|
÷
+ =
2
inf
,
Logo,
7 , 12 7 , 2 10 4
13
11 19
10
2
inf
= + = ×
|
.
|

\
| ÷
+ = ×
|
|
|
|
.
|

\
|
÷
+ =
i
i
ant ac
h
f
F
n
l Md

Dizemos então que 50% dos dados da distribuição está abaixo de 12,7 e os outros 50 %
estão acima.

8.4 Moda
É a mais simples das medidas de centro: é o valor que ocorre com maior freqüên-
cia num conjunto de valores, isto é, é o valor que aparece em maior número de vezes . É
representada por Mo.
8.4.1 Dados agrupados
Neste caso a moda é facilmente reconhecida de acordo com a definição, basta procu-
rar o valor que mais se repete.
Exemplo 8.6 - Determine a moda no conjunto de valores: 2, 3, 4, 4, 5, 6, 7.
Como o número 4 ocorre mais vezes, então a Mo = 4.

Quando na série não existe valor que apareça mais vezes que outros, dizemos en-
tão que a série não possui moda, isto é, ela é amodal.
Quando existe uma única moda, a série é modal.
Quando existem duas modas a série é bimodal.
Quando existe mais de duas modas a série chamasse multimodal.

8.4.2 Dados agrupados sem intervalo de classe
A determinação da moda é imediata, bastando localizar na tabela o valor que tem
maior freqüência.



Exemplo 8.7 - Vejamos: Determine a moda dos valores da tabela abaixo:
Tabela 8.5
Pontos f
i

0 2
1 5
2 9
3 7
5 6
6 4
Σ 33
Mo = 2, pois o valor 2 aparece nove vezes, isto é, possui a maior freqüência (9).

8.4.3 Dados agrupados com intervalo de classe
A moda, nesse caso, é determinada através do método de CZUBER, cuja fórmula é a
seguinte:
i
h
d d
d
l Mo ×
+
+ =
2 1
1
inf
Onde:
inf
l
– Limite inferior da classe modal
1
d
– é a diferença entre a frequencia simple da classe modal e a frequencia simples an-
terior a classe modal, isto é,
ant Mo
f f d ÷ =
1

2
d
– é a diferença entre a frequencia simple da classe modal e a frequencia simples pos-
terior a classe modal, isto é,
post Mo
f f d ÷ =
2

i
h
– amplitude do Intervalo da classe modal

Exemplo 8.8 - Determine a moda para a distribuição abaixo:
Tabela 8.6
Idades f
i

20 |― 25 5
25 |― 30 8
30 |― 35 11
35 |― 40 6
40 |― 45 3
n 33

1º passo: indica-se a classe modal. No caso, a 3ª classe (30 |― 35), pois, tem a maior
freqüência (11).
2º passo: Determinar a freqüência simples (ou absoluta) anterior a freqüência da classe
modal, isto é,
8 =
ant
f
, e a freqüência simples (ou absoluta) posterior a freqüência da
classe modal, isto é,
6 =
post
f
,
3º passo: Determinar
1
d
e
2
d
, isto é
3 8 11
1
= ÷ = ÷ =
ant Mo
f f d
e
5 6 11
2
= ÷ = ÷ =
post Mo
f f d


4º passo: Limite inferior da classe modal, isto é,
30
inf
= l

5º passo: Determinar a amplitude do intervalo da classe modal, isto é,
5 30 35 = ÷ =
i
h

6º passo: aplica-se a fórmula de CZUBER
i
h
d d
d
l Mo ×
+
+ =
2 1
1
inf
Logo,
9 , 1 30 5
5 3
3
30
2 1
1
inf
+ = ×
+
+ = ×
+
+ =
i
h
d d
d
l Mo

Portanto, Mo=31,9

8.5 Emprego das Medidas de Tendência Central
 A Média é utilizada quando:
a) Desejamos obter a medida de posição que possui a maior estabilidade.
b) Houver necessidade de um tratamento ulterior.

 A Mediana é utilizada quando:
c) Desejamos obter o ponto que divide a distribuição em partes iguais.
d) Há valores externos que afetam de uma maneira acentuada a média.
e) A variável em estudo é salário.

 A Moda é utilizada quando:
a) Desejamos obter uma medida rápida e aproximada de posição.
b) A medida de posição deve ser o valor mais típico da distribuição.


Atividade

1- O quadro a seguir apresenta a faixa de renda dos pescadores de Marechal Deodoro.
Determine a média de salários, o salário mais freqüente e o salário mediano dos pes-
cadores.

Faixa de Renda: f
i

de 50 à R$200 32
de 201 à R$350 24
de 351 à R$500 7
de 501 à R$700 1

Fonte: Alunos de Gestão Ambiental - 2007.1

2- Use a distribuição de freqüência dada abaixo, para determinar a idade média, a ida-
de mais freqüente e a idade mediana dos habitantes de Medicine Bow,Wyoming.

Idade Freqüência
0 --- 9 57
10 --- 19 68
20 --- 29 36
30 --- 39 55
40 --- 49 71
50 --- 59 44
60 --- 69 36
70 --- 79 14
80 --- 89 8
(Fonte: U.S. Bureau of the Census)






3. A tabela abaixo apresenta a distribuição de freqüências dos dados de peso em kg de 20
crianças submetidas a um determinado tratamento no Hospital de clinicas de Uberlân-
dia, MG, 2006. Determine a freqüência relativa e as freqüências acumuladas e o peso
médio dessas crianças.

Pesos ( em kg) freqüência
38,5 |− 43,5 3
43,5 |− 48,5 4
48,5 |− 53,5 7
53,5 |− 58,5 4
58,5 |− 63,5 2
Total
Fonte: Hospital de clinicas de Uberlândia, MG – 2006

4. Os dados a seguir referem-se aos casos e incidência (por 100.000 habitantes) de tu-
berculose pulmonar por faixa etária no município X em 2002. Determinar as fre-
qüências relativas e acumuladas, a idade média, a idade mais freqüente e a idade
mediana dos habitantes com tuberculose desse município.

Faixa etária (anos) fi
0 – 4 8
5 – 14 7
15 – 24 7
25 – 44 19
45 – 64 22
65 + 9
Total 72





5. Os dados a seguir referem-se aos salários de uma empresa. Determinar as freqüên-
cias relativas e acumuladas e a média dos salários dessa empresa.

Salários (R$) f
i

500 |÷ 700 18
700 |÷ 900 31
900 |÷ 1.100 15
1.100 |÷ 1.300 3
1.300 |÷ 1.500 1
1.500 |÷ 1.700 1
1.700 |÷ 1.900 1
Total E = 70











Medidas de Variabilidade






Medidas de Variabilidade
As medidas de tendencia central descritas anteriomente sãi uteis por identificarem
um valor “tipico” em um conjunto de dados. Por outro lado, as medidas de variabilidade
dizem respeito à descrição d eum conjunto de valores em termos da variabilidade
existenet entre os itens incluidos dentro do conjunto. São diponiveis diversas tecnicas
para a medida da variabilidade em um conjunto de dados. Serão descritos neste capituo
a amplitude total, o desvio médio, a variância, o desvio-padrão e o coeficeinte de
variação.

9.1 Amplitude total
A amplitude total, ou
T
A , é a diferença entre o maior valor e o menor valor de uma
distribuição de freqüência ou de uma série
min max
X X A
T
÷ =
série na observado valor maior X =
max

série na observado valor menor X =
min

9.1.1 Amplitude total para dados não agrupados
Exemplo 9.1: O peso atingido por dois grupos de recém-nascidos prematuros de ex-
tremo baixo peso foi registrado em dez semanas consecutivas, conforme tabela abaixo.
Determinar a amplitude total de cada uma delas
Amplitude total de A = 670 – 560 = 110g
Amplitude total de B = 900 – 330 = 570g
A amplitude total é fácil de calcular porque só usa dois números do conjunto de da-
dos.




Tabela 9.1 – Peso de dois grupos de recem-nascidos prematuros

9.1.2 Amplitude total para dados agrupados sem intervalo de classe
Exemplo 9.2: Os dados da distribuição de freqüências representam o número de fi-
lhos por família de 32 famílias entrevistadas em um determinado hospital. Vamos deter-
minar a amplitude total desta distribuição
Tabela 9.2 – Distribuição do número de filhos por familia
Nº de filhos por família
(x
i
)
Famílias (
i
f )
0 4
1 8
2 10
3 7
4 3
Total N=32
Amplitude total = 4 - 0 = 4

9.1.3 Amplitude total para dados agrupados com intervalo de classe
Grupo B
560 330
560 420
570 480
580 520
610 570
630 670
630 670
670 770
670 820
670 900
Grupo A
Média = 615g
Mediana = 620g
Moda = 670g
Média = 615g
Mediana = 620g
Moda = 670g
A expressão
min max
X X A
T
÷ = para os dados agrupados com intervalos de classe é
escrita da seguinte forma:
min max
L L A
T
÷ =
e L class última da superior Limite
max
=
classe primeira da inferior Limite
min
= L
Exemplo 9.3: Foi feito um estudo sobre a concentração de nitratos na água de 100
bueiros que deságuam em uma lagoa. Os resultados são apresentados na Tabela:
Tabela 9.3 – Concentração de nitrato por bueiros
Concentração de Nitrato
(mg/l)
Número de bueiros (
i
f )
140 |--- 160 7
160 |--- 180 20
180 |--- 200 33
200 |--- 220 25
220 |--- 240 11
240 |--- 260 4
n 100
120 140 260
min max
= ÷ = ÷ = L L A
T
mg/l
Conhecer apenas a amplitude total da distribuição é levar em consideração somen-
te os extremos, sem considerar os termos internos, e, nesse caso, o resultado não repre-
senta se há equilíbrio ou não na distribuição dos termos da série.

9.2 Desvio
Para aprender a calcular medidas de variação que usem todos os valores do conjun-
to de dados, primeiro você precisa saber o que é um desvio
O desvio de cada valor x é a diferença entre o valor de x e a média do conjunto de
dados.
Em uma população, o desvio de cada valor x é:
µ ÷ x

Em uma amostra, o desvio de cada valor x é: x x ÷
Exemplo 9.4: Do exemplo 9.1, temos que:
Tabela 9.4 – Tabela de Desvios
x
µ ÷ x

x
µ ÷ x

560 -55 330 -285
560 -55 420 -195
570 -45 480 -135
580 -35 520 -95
610 -5 570 -45
630 15 670 55
630 15 670 55
670 55 770 155
670 55 820 205
670 55 900 285

¿
= ÷ 0 ) ( µ x

A soma dos desvios é sempre zero.

9.3 Desvio Médio

9.3.1 Desvio Médio para dados não agrupados
O desvio médio, ou DM, é baseado na diferença entre cada valor de um conjunto
de dados e a média do conjunto de dados. O que é calculado é a média destes desvios
em valores absolutos (módulo).
Utilizando a população temos:
N
x
DM
¿
÷
=
µ

Utilizando a amostra temos:
n
x x
DM
¿
÷
=
Exemplo 9.5: Durante certo mês, foi feito um estudo para determinar a concentra-
ção de progesterona na saliva de pacientes de determinado hospital, conformes os dados
a seguir: 8, 11, 5, 14, 8, 11, 16, 11. A média aritmética é 10,5 ng/ml. Assim, a tabela dos
desvios é dada por:
Tabela 9.5 – Concentração de progesterona na saliva de pacientes
x
µ ÷ x

µ ÷ x

5 -5,5 5,5
8 -2,5 2,5
8 -2,5 2,5
11 0,5 0,5
11 0,5 0,5
11 0,5 0,5
14 3,5 3,5
16 5,5 5,5
Total 21,0
Utilizando os cálculos da tabela, o desvio médio é calculado da seguinte forma:
ml ng
N
x
DM / 6 , 2 625 , 2
8
0 , 21
~ = =
÷
=
¿
µ

Desta forma, podemos dizer que, em média, as concentrações de progesterona na
saliva de pacientes, diferem por 2,6 ng/ml da média aritmética do grupo, em ambas as
direções.
9.3.2 Desvio Médio para dados agrupados
Para dados agrupados em uma distribuição de freqüências, o desvio médio é dado
por:
:
N
x f
DM
i ¿
÷
=
µ
se utilizarmos a população;
n
x x f
DM
i ¿
÷
= se utilizarmos a amostra.
Exemplo 9.6: Os dados da distribuição de freqüências representam o número de fi-
lhos por família de 32 famílias entrevistadas em um determinado hospital. Vamos deter-
minar o desvio médio desta distribuição.
Tabela 9.6 – Número de filhos por familia
Nº de filhos por
família (x)
Famílias (
i
f )
i
xf
µ ÷ x

µ ÷ x f
i

0 4 0 1,9 7,6
1 8 8 0,9 7,2
2 10 20 0,1 1
3 7 21 1,1 7,7
4 3 12 2,1 6,3
Total N=32
61 =
¿ i
xf
29,8
A média é dada dividindo
¿ i
xf por N, isto é, 1,90625. Logo, o desvio médio é da-
do por:
93 , 0
32
8 , 29
= =
÷
=
¿
N
x f
DM
i
µ

9.3.3 Desvio Médio para dados agrupados em intervalos de classe
Para dados agrupados em uma distribuição de freqüências em intervalos de classe,
o ponto médio de cada classe é tomado pra representar todas as medidas incluídas no
intervalo de classe. Assim, o desvio médio é dado como a expressão anterior.
:
N
x f
DM
i ¿
÷
=
µ
se utilizarmos a população;
n
x x f
DM
i ¿
÷
= se utilizarmos a amostra.
Exemplo 9.7: Os dados, da distribuição de freqüências abaixo, representam o um
estudo sobre a concentração de nitratos na água de 100 bueiros que deságuam em uma
lagoa. A média de concentração de nitrato na água é 195mg/l. O desvio médio é calcula-
do da seguinte forma, partindo dos cálculos da tabela:Os resultados são apresentados na
Tabela:
60 , 19
100
1960
= =
÷
=
¿
N
x f
DM
i
µ

Tabela 9.7: Folha de calculo para determinar o desvio médio para dados agrupados
em intervalos de classe
Concentração
de nitrato
(mg/l)
Nº de bueiros
(
i
f )
Ponto Médio
( x )
µ ÷ x

µ ÷ x f
i

140 |--- 160 7 150 45 315
160 |--- 180 20 170 25 500
180 |--- 200 33 190 5 165
200 |--- 220 25 210 15 375
220 |--- 240 11 230 35 385
240 |--- 260 4 250 55 220
100 1960

9.4 Variância e Desvio Padrão
A Variância é similar ao desvio médio no sentido de que é também baseado nas di-
ferenças entre cada valor do conjunto de dados e a média aritmética do conjunto de da-
dos. Ela difere do desvio médio uma vez que aquelas diferenças são elevadas ao quadra-
do antes de serem somadas. Para uma determinada população, a variância populacio-
nal:é representada pela letra grega minúscula
2
o (ler “sigma quadrado” ou “sigma
dois”), sendo dadas pelas formulas:
N
x
¿
÷
=
2
2
) ( µ
o , para dados não agrupados.
N
x f
i ¿
÷
=
2
2
) ( µ
o , para dados agrupados sem intervalos de classe.
N
x f
i i ¿
÷
=
2
2
) ( µ
o ou
2
2
|
|
.
|

\
|
÷ =
¿ ¿
N
x f
N
x f
i i i i
o , para dados agrupados em in-
tervalos de classe, onde
i
x indica o ponto médio de cada intervalo de classe.
Exemplo 9.8: Para os dados de concentração de progesterona nos pacientes do e-
xemplo 9.2, a média aritmética é 10,5 ng/ml. Considerando os dados como sendo uma
população estatística de interesse, a variância é determinada como segue, a partir da
tabela 9.8.
75 , 10
8
86
) (
2
2
= =
÷
=
¿
N
x µ
o

Tabela 9.8 – Calculo para determinar a Variância para dados não agrupados
x
µ ÷ x

2
) ( µ ÷ x

5 -5,5 30,25
8 -2,5 6,25
8 -2,5 6,25
11 0,5 0,25
11 0,5 0,25
11 0,5 0,25
14 3,5 12,25
16 5,5 30,25
Total 86,00

Ao contrario da situação para outras estatísticas amostrais, a variância para uma
amostra não é, em termo computacional, exatamente equivalente à variância da popula-
ção. Antes, o denominador da fórmula da variância da amostra é ligeiramente diferente.
Essencialmente, é introduzido um fator de correção nesta expressão, de tal forma que a
variância amostral seja um estimador não tendencioso da variância populacional. A vari-
ância da amostra é representada por s², e suas fórmulas são dadas por:
1
) (
2
2
÷
÷
=
¿
n
x x
s , para dados não agrupados
1
) (
2
2
÷
÷
=
¿
n
x x f
s
i
ou
( )
|
|
.
|

\
|
÷
÷
=
¿
¿
n
x f
x f
n
s
i
i
2
2
2
1
1
, para dados agrupados
sem intervalo de classe.
1
) (
2
2
÷
÷
=
¿
n
x x f
s
i i
ou
( )
|
|
.
|

\
|
÷
÷
=
¿
¿
n
x f
x f
n
s
i i
i i
2
2
2
1
1
,para dados agrupados
em intervalos de classe, onde
i
x indica o ponto médio de cada intervalo de classe.
Exemplo 9.9: Para os dados, da distribuição de freqüências do exemplo 9.4, que re-
presentam a concentração de nitratos na água de 100 bueiros que deságuam em uma
lagoa, a média do valor das concentrações de nitratos é 195 mg/l. Considerando aqueles
dados como sendo uma amostra estatística de interesse, a variância é determinada como
segue, a partir da tabela 9.9:
93 , 592
99
58700
1
) (
2
2
= =
÷
÷
=
¿
n
x x f
s
i i

Tabela 9.9: Folha de calculo para determinar a variância para dados agrupados em
intervalos de classe
Concentração
de nitrato
(mg/l)
(
i
f )
Ponto Médio
( x )
x x ÷
2
) ( x x ÷

2
) ( x x f
i
÷

140 |--- 160 7 150 -45 2025 14.175
160 |--- 180 20 170 -25 625 12.500
180 |--- 200 33 190 -5 25 825
200 |--- 220 25 210 15 225 5.625
220 |--- 240 11 230 35 1225 13.475
240 |--- 260 4 250 55 3025 12.100
100 58.700

Em geral, é difícil interpretar o significado do valor da variância porque as unidades
nas quais tal valor é expresso não são as mesmas do que as das observações do conjunto
de dados. Por esta razão, a variância não é muito utilizada para representar algo que o-
correu com os dados pesquisados. Desta forma, a mais utilizada é a medida relacionada
com a raiz quadrada da variância, representada pela letra grega
o
para a população (ou
s para a amostra) e chamada de desvio padrão, é o que se utiliza com mais freqüência. As
fórmulas são:
Desvio padrão populacional para dados não agrupados:
( )
N
x
¿
÷
=
2
µ
o
Desvio padrão amostral para dados não agrupados
( )
1
2
÷
÷
=
¿
n
x x
s
Desvio padrão populacional para dados agrupados:
( )
N
x f
i ¿
÷
=
2
µ
o ou
2
2
|
|
.
|

\
|
÷ =
¿ ¿
N
x f
N
x f
i i i i
o
Desvio padrão amostral para dados agrupados
( )
1
2
÷
÷
=
¿
n
x x f
s
i
ou
( )
|
|
.
|

\
|
÷
÷
=
¿
¿
n
x f
x f
n
s
i i
i i
2
2
1
1


O desvio padrão é particularmente a medida mais usada na comparação de dife-
renças entre conjuntos de dados, por ter grande precisão, uma vez que é utilizada em
conjunção com numerosos métodos de inferência estatística. O desvio padrão determina
a dispersão dos valores em relação à média.
Exemplo 9.10: Para os dados, da distribuição de freqüências do exemplo 9.1, temos
o peso atingido por dois grupos de recém-nascidos prematuros de extremo baixo peso,
que foram registrados em dez semanas consecutivas. A média é 615g. Considerando a-
queles dados como sendo uma amostra estatística de interesse, o desvio-padrão é de-
terminado como segue, a partir da tabela.
( )
73 , 13 50 , 188
10
18850
2
= = =
÷
=
¿
N
x
A
µ
o g
( )
41 , 549 30185
10
301850
2
= = =
÷
=
¿
N
x
B
µ
o g
Tabela 9.10: Indica os desvios padrões de cada grupo de prematuros
Grupo A Grupo B
x
µ ÷ x
(
µ ÷ x

x
µ ÷ x
(
µ ÷ x

560 -55
3025
330 -285
81225
560 -55
3025
420 -195
38025
570 -45
2025
480 -135
18225
580 -35
1225
520 -95
9025
610 -5
25
570 -45
2025
630 15
225
670 55
3025
630 15
225
670 55
3025
670 55
3025
770 155
24025
670 55
3025
820 205
42025
670 55
3025
900 285
81225

18850

301850

9.5 Interpretação do Desvio Padrão
Há varias regras que permitem compreender o que revela o desvio-padrão. A Figura
abaixo mostra que para dados distribuídos de modo (pelo menos aproximadamente)
simétrico, tem-se:
 68% das observações feitas estão a um desvio padrão da média (diz-se que
estão entre menos um e mais um desvio padrão da média), denominada de
zona de neutralidade ou normalidade.
 95% das observações feitas estão a dois desvios padrão da média (diz-se que
estão entre menos dois e mais dois desvios padrão da média).
 99% das observações feitas estão a três desvios padrão da média (diz-se que
estão entre menos três e mais três desvios padrão da média).




9.6 Coeficiente de Variação (C.V.)
Trata-se de uma medida relativa de dispersão, útil para a comparação em termos
relativos do grau de concentração em torno da média de séries distintas. È dado por:


–4 –3 –2 –1 0 1 2 3 4
100 . 100 . × = × =
x
s
V C ou V C
µ
o
Exemplo 9.11: Num hospital, o salário médio dos homens é de R$4.000,00, com
desvio-padrão de R$1.500,00, e o das mulheres é em média de R$3.000,00, com desvio-
padrão de R$1.200,00. Então:
Para os homens

Para as mulheres
Logo, podemos concluir que os salários das mulheres apresentam maior dispersão
relativa que os dos homens. Para obtermos o resultado do C.V. em porcentagens, basta
multiplicarmos o resultado por 100. No caso:
C.V. para homens 37,5%
C.V. para mulheres 40%
Exemplo 9.12: Para os dados, da distribuição de freqüências do exemplo 9.7, que a
média é 615g e o desvio padrão para A e B são, respectivamente, 13,73g e 549,41g. Con-
siderando esses dados como sendo uma amostra estatística de interesse, o coeficiente
de variação é determinado como segue,
% 24 , 2 100
615
75 , 13
= × = =
µ
o
A
CV
% 33 , 89 100
615
41 , 549
= × = =
µ
o
B
CV

Logo, o grupo mais homogêneo é o grupo A.

375 , 0
000 . 4
500 . 1
. = = =
x
s
V C
4 , 0
000 . 3
200 . 1
. = = =
x
s
V C
Atividade

1. O quadro a seguir apresenta a faixa de renda dos pescadores de Marechal Deodoro.
Determine o desvio médio, variância, desvio padrão, coeficiente de variação e o in-
tervalo da zona de neutralidade.

Faixa de Renda: fi
de 50 à R$200 32
de 201 à R$350 24
de 351 à R$500 7
de 501 à R$700 1

2. O quadro a seguir apresenta a faixa etária dos pescadores de Marechal Deodoro. De-
termine o desvio padrão, o coeficiente de variação, o intervalo da zona de neutrali-
dade e a amplitude dos 95% centrais desta distribuição.

Faixa Etária: fi
de 15 à 25: 6
de 26 à 30: 5
de 31 à 40: 17
de 41 à 50: 21
de 51 à 60: 13
de 61 à 70 13
Total 75










Introdução a Probabilidade
















10.1 Métodos de Contagem

Os problemas de contagem são, em muitas vezes, considerados difíceis entre es-
tudantes e professores, apesar das técnicas matemáticas necessárias serem bastante
elementares: essencialmente, o conhecimento das operações aritméticas de soma, sub-
tração, multiplicação e divisão. O objetivo principal deste material é levar o estudante a
trabalhar com problemas de contagem e a ver que, afinal de contas, tais problemas po-
dem ser resolvidos com raciocínios simples na grande maioria dos casos, sem exigir o uso
de fórmulas complicadas. Veja os exemplos abaixo.
Exemplo 10.1. Um quadro com a forma abaixo vai ser pintado utilizando duas cores das
tres cores dadas.



Figura 10.1
a. Liste todos os possíveis quadros. Quantos são eles?
Solução. È importante ter um procedimento sistemático para listar todos os possíveis
quadros, sem repeti-los. Desta forma, devemos identificar as diferentes decisões a serem
tomadas e examinar todas as possibilidades para cada um deles. No caso deste proble-
ma, uma forma natural para planejar o preenchimento do quadro é:
- Escolher a cor a ser utilizada para parte externa do circulo;
- Em seguida, escolher a cor interna para o círculo.
A primeira decisão pode ser feita de 3 modos diferentes, já que a cor externa po-
de ser qualquer uma das disponíveis. Uma vez tomada esta decisão, a cor escolhida não
pode mais ser usada para o circulo interno. Por exemplo, se a cor amarela for escolhida
para a parte externa, a cor interna deverá ser verde ou branca.
Então, podemos listar todos os possíveis quadros, que são 6, de acordo com a fi-
gura abaixo.



Cor externa amarela


Cor externa branca


Cor externa verde

Figura 10.2
Um fato importante, que pode ser explorado na contagem eficiente do número
possível de quadro, é o seguinte: as cores disponíveis para pintar o circulo mudam de
acordo com a escolha da parte externa, mas a sua quantidade é sempre a mesma, já que,
qualquer que seja a cor externa escolhida. Portanto, poderíamos ter empregado o se-
guinte raciocínio para contar o número de possíveis quadros. Sem listá-los.
A cor externa pode ser escolhida de três formas diferentes. Qualquer que seja es-
ta escolha, a cor do circulo pode ser escolhida de duas formas. Logo, o número total de
possibilidades é 2+2+2=3x2=6.
procedimento acima nos mostra o Principio Multiplicativo ou Principio Funda-
mental da Contagem:
Se uma decisão
1
D pode ser tomada de p modos e, qualquer que seja esta escolha, a
decisão
2
D pode ser tomada de q modos, então o número de maneiras de se tomarem
consecutivamente as decisões
1
D e
2
D é igual a pq.







Podemos ilustra o Principio Multiplicativo com o auxilio de uma árvore de enume-
ração como mostra a Figura 10.3 a seguir.





Figura 10.3

Problemas
1) De acordo com o quadro abaixo, quantos são os possíveis quadros no caso em
que 4 cores estão disponíveis?





2) Quantas são as formas de pintar o quadro a seguir utilizando 3 cores diferentes
dentre 4 dadas?










Cor externa
Cor do circulo
De acordo com o exemplo e os problemas acima, você deve ter percebido qual é a
estratégia para resolver problemas de contagem:
I. Postura: Devemos sempre nos colocar no papel da pessoa que está fazen-
do a ação solicitada pelo problema e ver que decisões devemos tomar.
Nas diversas situações, nós nos solocamos no papel da pessoa que deveria
colorir o quadro.
II. Divisão: devemos, sempre que possível, dividir as decisões a serem toma-
das em decisões mais simples, correspondentes às diversas etapas do pro-
cesso de decisão. Colorir o quadro foi dividido em colorir cada região.
III. Não adiar dificuldades: Pequenas dificuldades adiadas costumam se trans-
formar em imensas dificuldades. Se uma das decisões a serem tomadas for
mais restrita que as demais, essa é a decisão que deve ser tomada em
primeiro lugar.

Uma das principais aplicações das técnicas de contagem é a resolução de proble-
mas simples de Probabilidade. O interesse dos matemáticos no estudo sistemático de
probabilidades é relativamente recente e tem suas raízes no estudo dos jogos de azar.
O termo probabilidade é usado de modo muito amplo na conservação diária para
sugerir certo grau de incertezas sobre o que ocorreu no passado, o que ocorrerá no futu-
ro ou o que está ocorrendo no presente. O estudante poderá ficar contente porque acha
que sua “probabilidade“ de passar nas provas é grande. Os testes diagnósticos são uma
aplicação à medicina de probabilidade e baseasse no seguinte: Uma suspeita de que um
paciente padeça de certa enfermidade, que há uma incidência da enfermidade na popu-
lação (probabilidade de que a enfermidade atinja uma pessoa escolhida ao acaso.. Como
ajuda ao diagnostico da enfermidade, fazemos o paciente passar por uma série de provas
(testes) que dão como resultado : Positivo(+) ou Negativo (-).
A idéia de probabilidade desempenha papel importante em muitas situações que
envolvam uma tomada de decisão. Suponhamos que um empresário deseja lançar um
novo produto no mercado. Ele precisará de informações sobre a “probabilidade” de su-
cesso para seu novo produto. Os modelos probabilísticos podem ser úteis em diversas
áreas do conhecimento humano, tais como: Biologia, Economia, Administração, Enge-
nharia e outros ramos da ciência.
Para avaliar a probabilidade de um evento, podemos basear-nos em duas escolas
de pensamento.
1º. A escola objetiva ou clássica, na qual as regras do calculo das probabilidades de-
vem ser aplicadas somente a eventos que podem ser repetidos indefinidamente
sob as mesmas condições. Tais fundamentos garantem que se duas pessoas, iso-
ladas e acuradamente, determinassem a probabilidade de certo evento, chegari-
am ao mesmo resultado. Por exemplo: Uma probabilidade associada ao fato de se
receberem duas figuras em um jogo de cartas, ou de ganhar numa loteria em que
15000 pessoas possuam bilhetes, pois os “experimentos” podem ser repetidos
sob as mesmas condições, e diferentes pessoas avaliariam com os mesmos valo-
res tais possibilidades. Adeptos dessa escola jamais cogitariam atribuir a “proba-
bilidade” de que o Flamengo ganhe no seu próximo jogo ou de que João seja pri-
meiro homem a pisar em Marte. Tais eventos não resultam de experimentos que
possam ser repetidos sob as mesmas condições.
2º. Para a avaliação desses experimentos, deveremos valer-nos dos fundamentos da
“escola subjetiva” ou personalista. Tal escola considera que a probabilidade de
certo evento é medida pelo grau de crença que cada pessoa atribui à ocorrência
desses eventos. Evidentemente, neste caso, teremos diferentes “possibilidades”
para um mesmo evento. Mesmo admitindo a dificuldade originada por diferentes
probabilidades ao mesmo evento, os defensores dessa escola crêem que as pes-
soas que se utilizam sistematicamente das probabilidades subjetivas conseguem
tomar decisões acertadas.

10.2 Conceitos básicos

10.2.1 Experimento Aleatório
Experimento Aleatório é aquele que poderá ser repetido sob as mesmas condições
indefinidamente. Tal experimento apresenta variações de resultados, não sendo possível
afirmar a priori qual será sua determinação antes que o mesmo tenha sido realizado. É
possível entretanto, descrever todos os possíveis resultados – as possibilidades.
A palavra Fenômeno significa experimento e a palavra aleatório significa causal.
As principais características de um experimento aleatório são:
- Pode ser repetido indefinidamente sob as mesmas condições;
- Em qualquer repetição do experimento, não sabemos, com certeza, qual particu-
lar resultado, de todos os possíveis, irá ocorrer, embora posamos precisar quais
sejam esses possíveis resultados.
Perguntas como as seguintes ilustram algumas situações imprevisíveis:
 Quantas pessoas ganharão o premio da Mega Sena da próxima semana?
 Lançando dois dados, qual será a soma dos pontos das faces superiores?
 Quantos automóveis estarão circulando na cidade de Maceió em 2015?
 Lançando uma moeda, que face ficará para cima , cara ou coroa?
O sorteio dos números das Mega Sena, o lançamento dos dois dados e da moeda e a
determinação do número de carros que circularão em Maceió em 2015 são fenômenos
que podem apresentar dois ou mais resultados: eles são considerados fenômenos aleató-
rios.
10.2.2 Espaço Amostral
Os resultados de uma experiência que envolve um fenômeno aleatório dependem do
interesse do pesquisador, isto é, e que o observador deseja focalizar sua atenção.
Como descrever matematicamente uma experiência desse tipo e seus resultados?
Parece natural nós falarmos de conjunto de resultados possíveis para um experimen-
to aleatório. Assim, utilizaremos conuntos para descrever esses possíveis resultados.
O conjunto de todos os possíveis resultados de um experimento aleatório chamará
Espaço Amostral e representaremos pela letra S.
Um espaço amostral S associado a uma experiência é um conjunto de tal modo
que:
1º.) todo resultado possível da experiência está em S;
2º.) todo elemento de S é algum resultado da experiência.
O número de elementos do espaço amostral S será indicado pó n(S).
Exemplo 10.2: Uma letra da palavra honestidade é sorteada ao acaso. Qual o espaço a-
mostral desse experimento?
S={h, o, n, e , s, t, i , d, a}
Exemplo 10.3: Retirar uma carta de um baralho comum de 52 cartas. Se o interesse do
jogador for observar o naipe da carta, qual o espaço amostarl?
S={ouros, copa, paus, espada}
10.2.3 Evento
É comum os pesquisadores estarem interessados em avaliar um resultado ou grupo
de resultados possíveis do espaço amostral. Os grupos de resultados que podem interes-
sar a alguém de algum modo são chamados Eventos. Podemos dizer também que, qual-
quer conjunto de resultados de um experimento será denominado de evento. Como e-
vento é um subconjunto de S, indicaremos os eventos por letras maiúsculas: A, B, C, etc.
Exemplo 10.4: Seja o experimento lançar um dado e seja A o evento sair um número par.
Assim,
Espaço amostral S={1, 2, 3, 4, 5, 6}
Evento A={2, 4, 6}

Evento simples é aquele formado por um único elemento do espaço amostral, en-
tretanto o evento que possui mais de um elemento é denominado de composto.
Diante do que foi exposto sobre o conceito de eventos, notamos que S (espaço
amostral) e o conjunto vazio também são eventos e são chamados respectivamente de
evento certo e evento impossível. Assim, o evento obter um naipe na retirada de uma
carta é um evento certo, enquanto que obter um oito no lançamento de uma dado cons-
titui um evento impossível.
Como evento é um conjunto, podemos realizar com eles as operações de união e
intersecção de conjuntos. Logo,
B A - é o evento que ocorre se A ocorrer ou B ocorrer ou ambos ocorrerem.
B A· - é o evento que ocorre se A e b ocorrerem.
A - (lê-se A traço) é o evento que ocorre se A não ocorrer.

Exemplo 10.5: Seja E o experimento sortear um cartão dentre dez cartões numerados de
1 a 10. Sejam os eventos: A={sair o número cinco} e B={sair um número par}, então:
S={1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
A={5}, B={2, 4, 6, 8, 10}
} 10 , 8 , 6 , 4 , 2 , 5 { = B A
| = ·B A (evento impossível)
} 10 , 9 , 8 , 7 , 6 , 4 , 3 , 2 , 1 { = A , } 9 , 7 , 5 , 3 , 1 { = B
Dois eventos A e B são denominados mutuamente exclusivos se eles não puderem
ocorrer simultaneamente, isto é, | = ·B A . No exemplo anterior A e B são mutuamen-
te exclusivos, pois a ocorrência de A impede a ocorrência de B e vice-versa ( | = ·B A ).

10.3 Regra Básica de Probabilidade
A preocupação maior será avaliar a probabilidade dos eventos. Para isto, iremos
admitir que todos os elementos do espaço amostral têm a mesma chance, ou seja, os
resultados são igualmente prováveis. Insto significa que, se N for o número de elementos
de S, então a probabilidade de cada evento simples ocorrer será dada por
N
1
. Isto é, se
} , , , , {
3 2 1 n
a a a a S  = é um espaço amostral equiprovável, então a probabilidade de
cada evento simples é
n
a p
i
1
) ( = .
Simbolizando um evento qualquer do espaço amostral de um experimento pela
letra A, define-se a probabilidade desse evento ocorrer como:
N
n
A p
A
= ) ( ,
onde A é um subconjunto do espaço amostral,
A
n é o número de modos como A pode
ocorrer (ou total de pontos da amostra designada A) e N é o total de pontos possíveis do
experimento em questão (ou total de elementos da população que originou a amostra
A).
Exemplo 10.6: No lançamento de um dado se aposta na face ímpar. Qual a probabilidade
de vitoria?
Solução: No lançamento de um dado, o espaço amostral é:
S={1, 2, 3, 4, 5, 6}
Desse espaço amostral, são impares os pontos do subconjunto
A={1, 3, 5}
Como o número de elementos de S é 6 e o número de elementos de A é 3. Temos
que, a probabilidade de vitoria é:
% 50 5 , 0
2
1
6
3
) ( = = = = A p
Ou seja, obtêm a chance de vitoria dividindo o total de números ímpares no lan-
çamento de um dado isolado, pelo total de resultados que ele pode apresentar.
Exemplo 10.7: Em genética utilizamos a mesma linha de raciocínio.Qual a probabilidade
de um casal ter dois filhos do sexo feminino?
Solução: O nascimento da primeira filha não afeta a chance de o segundo filho ser
do sexo feminino, pois a segregação dos alelos de um gene é tão ao acaso quanto jogar
uma moeda para cima e obter “cara” ou “coroa”. Portanto:
Probabilidade de
ser menina
X Probabilidade
de ser menina

2
1

X
2
1

4
1
=

Resultado 1/4 ou 25%

10.4 Regras Básicas do Calculo das Probabilidades
Para maior facilidade na solução de problemas de probabilidades, devemos entender
as seguintes propriedades e regras:
1ª A probabilidade de um evento A deve ser um número maior ou igual a zero e me-
nor ou igual a 1, isto é, 1 ) ( 0 s s A P .
2ª A probabilidade do evento certo é igual a 1, isto é, 1 ) ( = S P .
3ª A probabilidade do evento impossível é igual a zero, isto é, 0 ) ( = | P .
4ª Regra da Soma das Probabilidades. Se A e B são dois eventos mutuamente exclu-
sivos (ou excludentes), isto é, | = ·B A , então
) ( ) ( ) ( ) ( B P A P B A P B A P + = + =
5ª Se A e B não forem mutuamente exclusivos (ou não excludentes), então:
) ( ) ( ) ( ) ( B A P B P A P B A P · ÷ + =
6ª Se A é o evento complementar de A, então:
) ( 1 ) ( A P A P ÷ =
Exemplo 10.8: Seja a experiência de lançar um dado. Dados os eventos A={sair o nú-
mero 3}, b={sair o número par} e C={sair um número ímpar}. Determinar:
a)
) (A P
;
b) ) (B P ;
c) ) (C P ;
d) ) ( B A P ;
e) ) ( C A P · ;
f) ) (A P .
Solução: Como S= {1, 2, 3, 4, 5, 6}; A={3}, B={2, 4, 6}; C={1, 3, 5}, então:
a)
6
1
) ( = A P
b)
2
1
6
3
) ( = = B P
c)
2
1
6
3
) ( = = C P
d)
3
2
2
1
6
1
) ( ) ( ) ( = + = + = B P A P B A P , observe que | = ·B A .
e)
6
1
) ( =
·
= ·
S de elementos de numero
C A de elementos de numero
C A P , observe que
} 3 { = ·C A
f)
6
5
6
1
1 ) ( 1 ) ( = ÷ = ÷ = A P A P , observe que } 6 , 5 , 4 , 2 , 1 { = A .
Exemplo 10.9: Qual a probabilidade de um casal ter dois filhos, sendo um menino e
uma menina?
Solução: Para responder esta questão, utilizaremos as duas regras
Probabilidade
de ser menina
(1ºFilho)

X
Probabilidade
de ser menina
(2ºFilho)

OU
Probabilidade
de ser menina
(1ºFilho)

X
Probabilidade
de ser menina
(2ºFilho)
2
1

x
2
1

+
2
1

x
2
1

2
1
4
2
4
1
4
1
= = +

Resultado 1/2 ou 50%
10.4.1 Probabilidade Condicional
Se A e B são eventos de um espaço amostral S, com 0 ) ( = B P , então a probabili-
dade condicional do evento A, tendo ocorrido o evento B, é indicada por ) / ( B A P e
definida pela expressão:
) (
) (
) / (
B P
B A P
B A P
·
=
Podemos encontrar uma expressão mais pratica para o cálculo da probabilidade con-
dicional:
B eevnto do elementos número
B A de elementos de numero
B A P
·
= ) / (
Exemplo 10.10: A tabela 1 apresenta o número de clientes de uma cantina de um
hospital. Qual a probabilidade de um cliente da cantina ser não-paciente do hospital,
dado que tem até 30 anos?
Tabela 10.1 – Clientes de uma Cantina.

Idade
Paciente?
Total Sim Não
Até 30 anos 22 30 52
De 31 a 40 anos 49 70 119
Mais de 40 anos 29 40 69
Total 100 140 240

Solução:
A={cliente da cantina com idade até 30 anos}
B={cliente do cantina não-paciente do hospital}
De acordo com a tabela 10.1, dos 240 clientes pesquisados, 140 são não-
pacientes, dos quais 30 têm até 30 anos. Isso significa que a probabilidade de se esco-
lher um cliente da cantina e ele:
a. Não ser paciente do hospital, é 140 (casos favoráveis) dividido por 240 (to-
tal de possibilidades), isto é, 140/240=7/12=0,5833=58,33%.
b. Além de não ser paciente do hospital, ter idade até 30 anos, é 30 (casos
favoráveis) dividido por 240 (total de possibilidades), isto é,
30/240=1/8=0,125=12,5%.
Nestas condições, a probabilidade de um cliente da cantina não ser paciente
do hospital com idade de até 30 anos é dada por:
% 43 , 21
14
3
140
30
140
240
240
30
240
140
240
30
) (
) (
) / ( = = = × = =
·
=
B P
B A P
B A P
Em síntese, o que a probabilidade condicional revela é quanto mais infor-
mação se tiver, menor será o espaço amostral de análise. No exemplo, em vez de
considerar todos os 240 clientes da cantina, basta avaliar os 140 não-pacientes do
hospital.
10.4.2 Regra do produto
A partir da definição de probabilidade condicional, podemos explicitar ) ( B A P ·
e encontrar a regra do produto para dois eventos, assim:
) / ( ) ( ) ( B A P B P B A P × = · ou ) / ( ) ( ) ( A B P A P B A P × = ·
Então, a probabilidade da ocorrência simultânea de dois eventos de um mesmo
espaço amostral é igual à probabilidade de um deles ocorrer, pela probabilidade con-
dicional do outro, dado o primeiro.
Exemplo 10.11: Retirar sem reposição duas células de uma amostra de 10 células,
onde 4 são benignas. Qual a probabilidade de que ambas sejam malignas?
Solução: Sejam os eventos
A={a 1ª célula ser maligna}
B={a 2ª célula ser maligna}
Desta forma, precisamos avaliar ) ( B A P · .
3
1
9
5
10
6
) / ( ) ( ) ( = × = × = · A B P A P B A P
Observe que ) / ( A B P é a probabilidade de a 2ª célula ser maligna, dado que a 1ª foi
maligna.


10.4.3 Regra do produto para dois eventos independentes
Dois eventos são considerados de independentes se a probabilidade de ocorrên-
cia de um não altera a chance de ocorrência do outro. Em termos matemáticos,
isso permite escrever que ) ( ) / ( A P B A P = , assim como que ) ( ) / ( B P A B P = .
Por outro lado, fazendo algumas transformações elementares em
) (
) (
) / (
B P
B A P
B A P
·
= permitem escrever ) / ( ) ( ) ( B A P B P B A P × = · . Nessa equa-
ção, fazer ) ( ) / ( A P B A P = permite escrever que, para eventos independentes:
) ( ) ( ) ( A P B P B A P × = ·
Exemplo 10.12: Retira-se com reposição duas cartas de um baralho com 52 cartas.
Qual a probabilidade de que ambas sejam de copas?
Solução: Sejam os eventos:
A={a 1ª carta é de copas}
B={a 2ª carta é de copas}
Como A e b são independentes, a ocorrencia de um deles não está vinculado à ocor-
rência do outro. Veja que, o processo é com reposição, desta forma, o espaço amos-
tral não é alterado para o cálculo da probabilidade do outro evento. Assim,
6
1
52
13
52
13
) ( ) ( ) ( = × = × = · A P B P B A P

10.5 Distribuição de Probabilidades
Apresentaremos três modelos teóricos de distribuição de probabilidade, aos quais
um experimento aleatório estudado possa ser adaptado, o que permitirá a solução de
grande número de problemas práticos.
10.5.1 Variáveis aleatórias
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído
um número. Fica, então, definida uma função chamada variável aleatória.
Muitas vezes não estamos interessados propriamente no resultado de um expe-
rimento aleatório, mas em alguma característica numérica a ele associada. Essa caracte-
rística será chamada variável aleatória.
Assim, se o espaço amostral relativo ao "lançamento simultâneo de duas moedas"
é S = {(c,c), (c,k), (k,c), (k,k)} e se X representa o "número de caras" que aparecem, a cada
ponto amostral podemos associar um número para X, de acordo com a tabela abaixo (X é
a variável aleatória associada ao número de caras que foi observado):
Tabela 10.2 – lançamento simultâneo de duas moedas
Ponto Amostral X
( c,c ) 2
( c,k ) 1
( k,c ) 1
( k,k ) 0
Logo podemos escrever:
Tabela 10.3 – Probabilidade de sair cara
Números de caras ( X) Probabilidade (X)
2 1/4
1 2/4
0 1/4
Total 4/4 = 1

10.5.2 Variável Aleatória Discreta
Uma variável aleatória é denominada discreta quando se refere a experimentos
dos quais resultam valores contáveis ou pontos específicos em dado intervalo. Uma vari-
ável aleatória discreta conveniente é o conjunto dos números naturais, N={0, 1, 2, 3, ...,
n,...}.
A possibilidade de contar, de descrever variáveis por números, é estatisticamente
muito relevante. Mas, felizmente ou infelizmente, nem tudo são números. Há coisas que
simplesmente não se pode expressar por números. Como por exemplo, imagine se você
perguntar a um visitante: “Você se lembra de algum comercial sobre roupas veiculados
na TV local?” A resposta, nesse caso, não é um número; é um simples sim ou não. Você
pode taquigrafar o não com n e o sim com um s, assim como pode atribuir zero a quem
diz não e um a quem diz sim. Cada uma dessas formas tem suas virtudes e defeitos. As
atribuições n e s são auto-explicáveis; com os números zero e um podem-se fazer contas.
10.5.3 Variável Aleatória Continua
Diz-se que a variável aleatório é continua quando relativa a coisas mensuráveis, a
eventos que podem assumir qualquer valor numérico em dado intervalo. É especialmen-
te adequada a medidas de tempo, distâncias, velocidades, volumes e pesos.
Você poderá usar uma variável continua para monitorar o tempo entre atendi-
mentos no laboratório de analises clinicas, assim como pode para determinar a distancia
do ambulatório médico aos locais de exames.
Exemplo 10.3: Consideremos a distribuição de freqüências relativa ao número de aciden-
tes diários na Rodovia do SOL durante o mês de nov/97:
Tabela 10.4 – Distribuição do número de acidentes diários na Rodovia do Sol
Número de acidentes Frequência
0 22
1 5
2 2
3 1
Podemos então escrever a tabela de distribuição de probabilidade:
Tabela 10.5 – Probabilidade do numero de acidentes
Número de acidentes (X) Probabilidade (X)
0 0,73
1 0,17
2 0,07
3 0,03
Total 1,00
Construímos acima uma tabela onde aparecem os valores de uma variável aleatória
X e as probabilidades de X ocorrer que é a tabela de distribuição de probabilidades.
Atividade

Descreva o espaço amostral para os experimentos das questões 1 e 2:
1 Escolher dois estudantes, entre 4, para serem o presidente e o tesoureiro da comis-
são de formatura. Se cada comissão é representada por um para ordenado em que o
1º nome é o do presidente e o 2º é o do tesoureiro, o que significa o par (Maria, Jo-
ão) nesse experimento?

2. Faz-se um levantamento em famílias com 3 crianças e registra-se o sexo (M ou F)
das crianças em ordem decrescente de idade. O que significa a seqüência (MFF) nes-
se experimento?

3. Estilo de vida é um fator que agrega o modo como as pessoas vivem, como se vêem
e como querem que os outros as vejam . È também função de variáveis como renda,
ocupação, instrução e convivio social. Alguns estilos são especialmente interessan-
tes para quem gerencia atrações (ambientalistas gostam de zôos e passeios ecológi-
cos, etc). A tabela a seguir mostra o resultado de um teste de identificação de estilo
de vida com 150 pessoas aleatoriamente selecionadas.
Estilo de vida
Pesquisado Tipo A Tipo B Total
Homem 78 42 120
Mulher 19 11 30
Total 97 53 150
a) Escolhendo um dos questionários preenchidos pelos entrevistados sobre prefe-
rências por atrações turísticas, qual a probabilidade de ele se referir a alguém:
i) Do estilo de vida A?
ii) Do sexo feminino?
iii) Do Estilo B, dado que é mulher?
iv) Do sexo masculino ou que tenha estilo de vida Tipo B?
b) Os eventos sexo feminino e tipo A são mutuamente excludentes?
c) Os eventos tipo A e sexo masculino são independentes
2) Ao inspecionar 10.000 caixas de frutas recebidas dos produtores ECD e HND, um ata-
cadista constata o seguinte:
Caixas com Frutas
Fornecedor Caixas recebidas Danificadas Muito Maduras
ECD 6000 200 840
HND 4000 365 295
Total 10000 565 1135

Se o atacadista colocar à venda as 10.000 caixas nas condições recebidas:
a) Qual a probabilidade de uma caixa selecionada ao acaso:
i) Conter frutas danificadas?
ii) Conter frutas muito maduras?
iii) Ser do fornecedor HND ou do ECD?
b) Selecionada uma caixa com frutas muito maduras , qual a probabilidade de ser de
HND?
c) Qual a probabilidade de uma caixa conter frutas danificadas ou muito maduras,
supondo esses eventos mutuamente excludentes?











Correlação e Regressão


Em muitas situações do dia a dia, torna-se interessante e útil estabelecermos uma re-
lação entre duas ou mais variáveis. A matemática estabelece vários tipos de relações en-
tre variáveis, as relações funcionais e as correlações.
As relações funcionais são relações matemáticas expressas por sentenças matemáti-
cas. São exemplos já vistos anteriormente:
a) Área do retângulo (A = a.b) é a relação entre os lados do retângulo;
b) Densidade de massa (d
m
= m/V) é a relação entre a massa e o volume de um cor-
po;
c) Perímetro de uma circunferência (C = 2pi.R) é a relação entre o cumprimento da
circunferência e o valor do raio.
Pretende-se mostrar nesta unidade a natureza das relações estatísticas e verificar
quais variáveis explicam ou modificam os fenômenos estudados, onde se pode avaliar,
estimar e prever suas ocorrências futuras. Em razão disto, temos como objetivos mostrar
como:
 Relacionar variáveis especificas, fato fundamental na tomada de decisões;
 Determinar e explicitar as relações entre as variáveis que caracterizam os even-
tos;
 Avaliar a qualidade das relações entre as variáveis;
 Obter equações que relacionam as variáveis;
 Analisar estatisticamente as referidas equações.
As analises em questão terão por base os modelos de regressão e seus coeficientes
de correlação. Observe-se que os referidos modelos são complementares, não antagôni-
cos. Isto é, enquanto o modelo de regressão define a relação matemática entre as variá-
veis, o coeficiente de correlação simplesmente diz quão forte é essa relação.
Relações estatísticas e correlações
São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa,
fazem-se comparações que eventualmente podem conduzir (ou não) à ligação entre as
variáveis.
Exemplo: relação entre a idade e a estatura de uma criança ou a relação entre a classe
social de uma pessoa e o atendimento num hospital particular.
Em se tratando de licenciatura em biologia, podemos estabelecer relações que
envolvem variáveis como classe social, idade, sexo, cultura, situação econômica, salário,
peso, altura, etc.
No estudo estatístico, a relação entre duas ou mais variáveis denomina-se corre-
lação.
A utilidade e importância das correlações entre duas variáveis podem conduzir à
descoberta de novas situações e de novos métodos, cujas estimativas são vitais em to-
madas de decisões em pesquisas.

11.1 Correlação Linear

Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se
de uma linha reta. È uma linha de tendência, pois procura acompanhar a tendência da
distribuição de pontos, que pode corresponder a uma reta ou uma curva. Por outro lado
é, também, uma linha média, porque procura deixar a mesma quantidade de pontos a-
baixo e acima da linha reta.
O sinal positivo do coeficiente de correlação linera indica que o sentido da corre-
lação corresponde a uma reta de inclinação decrescente, e o sinal negativo corresponde
a uma reta de inclinação crescente.

Figura 11.1

0
1
2
3
4
5
6
7
8
1 2 3 4 5 6
Série1





0
1
2
3
4
5
6
7
8
1 2 3 4 5 6
Série1
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7
Série1
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7
Série1
Correlação linear perfeita
negativa, isto é, r=-1

Fraca correlação negativa, r<0
Forte correlação positiva, r>0



11.2 Coeficiente de correlação de Pearson
O coeficiente de correlação linear pode ser apresentado como uma medida de
correlação, pois tem como objetivo indicar o nível de intensidade que ocorre na correla-
ção entre as variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.
Coeficiente de correlação de Pearson (r) é dado por:

=

2

2

2

2

Onde:
r = o coeficiente de correlação de Pearson
n = o número de dados os de observações

= a variável independente

= a variável dependente
O valor do coeficiente de correlação r tem variação entre +1 e -1, ou seja, está li-
mitado entre os valores do intervalo −1, +1.


0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
0 1 2 3 4 5 6 7
Série1
Ausência de correlação
linear, r=0

Propriedades do Coeficiente de Correlação Linear
 Carece de unidades de medidas (adimensional).
 È invariante para as transformações lineares (mudança de origem e de escalas)
das variáveis.
 Só assume valores compreendidos ente -1 e +1.
 Quando |r| está próximo de um valor, afirma-se que há uma relação linear muito
forte entre as variáveis.
 Quando ≈ 0, pode-se afirmar que não há relação linear entre ambas as variá-
veis . Desta forma, diz-se que as variáveis são não-correlacionadas.
Portanto, afirmar que = ±1 é o mesmo que dizer que as observações de ambas as va-
riáveis estão perfeitamente alinhadas.

11.3 Regressão – Reta de Regressão (ou Reta de Mínimos Quadra-
dos ou Reta de Ajuste)

Um dos maiores problemas para o investigador de fenômenos humanos ou físicos
é o estabelecimento de um modelo matemático que descreve e explique o fenômeno
ocorrido na vida real, com boa aproximação. A busca de uma relação funcional entre as
variáveis observadas que descrevem o fato é uma tarefa de muitos pesquisadores em
diversas áreas do conhecimento. Assim, por exemplo, o pediatra tem interesse em esta-
belecer uma relação funcional entre o peso de a altura do bebê; um economista busca
encontrar uma função que explique o comportamento das vendas em função do preço; o
médico tem interesse em relacionar através de uma função o volume do plasma sanguí-
neo e a superfície dos corpos dos pacientes, etc.
Seja Y uma variável que queremos estudar e cujo comportamento futuro deseja-
mos descobrir. É fácil identificarmos uma série de variáveis

: (
1
, X
2
, X
3
, ⋯, X
n
que
influenciará o comportamento de Y, a variável dependente do modelo. A Estatística ofe-
rece meios de chegarmos à função entre a variável dependente (Y) e as variáveis inde-
pendentes (
1
, X
2
, X
3
, ⋯, X
n
através da análise de regressão. Quanto maior o numero
de variáveis explicativas, mais completo será o modelo. Todavia, sua solução será tam-
bém mais complexa e difícil. Em razão disso, nós apenas utilizaremos o modelo de duas
variáveis: a variável dependente Y e a variável independente X. Portanto, apresentare-
mos o estudo da função linear (ajustamento de uma reta) que é dada por:
= +


Onde
= constante (ponto em que a reta corta o eixo dos y)
= constante = coeficiente de regressão.
Y = variável dependente
X= variável independente

Sendo a e b os parâmetros da equação da reta , estes podem ser calculados por
meio das expressões:
( )
2
2
¿ ¿
¿ ¿ ¿
÷
× ÷
=
i i
i i i i
x x n
y x y x n
a
e
n
x
a
n
y
b
i i ¿ ¿
÷ =


Uma maneira simples para auxiliar na determinação da função entre as variáveis
dependentes e independentes é a construção do gráfico denominado “diagrama de dis-
persão”. Para construirmos o diagrama de dispersão devemos coletar uma amostra de
valores X e Y:
1
,
1
,
2
,
2
,
3
,
3
, ⋯,

,

, e depois marcar esses pontos no
sistema de coordenadas cartesianas.
Um exemplo simples consiste em considerar uma população formada por estudantes do
curso de Biologia, definindo sobre ela as variáveis
s centimetro em medida altura X ÷
metros em medida altura Y ÷
Veja que não é necessário fazer grandes esforço para intuir que a função entre ambas é
dada por:
100
X
Y =
Obter essa função é menos evidente quando o que medimos sobre o mesmo grupo de
estudantes é:
s centimetro em medida altura X ÷
quilos em medido peso Y ÷
O fato é que, uma vez conhecida a altura
i
x de um estudante, não é certo que
possamos determinar, de modo exato, seu peso
i
y (por exemplo, dois estudantes que
medem 1,72 m podem pesar, respectivamente, 62 e 65 quilos). No entanto, alguma rela-
ção entre eles devem existir, pois parece muito mais provável que um individuo de 2 m
pese mais que outro cuja altura é 1,30 m. Pode nos parecer mais ou menos aproximada
uma relação entre ambas as variáveis.

Exemplo 11.1: Em um grupo de pacientes de um hospital, mediu-se as quantidades an-
tropométricas peso e idade, obtendo-se os seguintes dados:
Tabela 11.1 - Resultados das medições
X (idade) 12 8 10 11 7 7 10 14
Y (peso) 58 42 51 54 40 39 49 56

Responda:
a) Existe uma relação linear importante entre essas variáveis?
b) Calcule a reta de regressão da idade em função do peso e a do peso em função da
idade.

Solução:
a) Para sabermos se há uma relação linear entre as variáveis em estudo, calcularemos o
coeficiente de correlação de Pearson.
Para isto elaboraremos uma tabela contendo nas colunas as variáveis dependentes (
i
y
),
as independentes (
i
x
) e os produtos
i i
y x
,
2
i
x
e
2
i
y
.
Tabela 11.2 – Relação estre as variaveis X e Y
X (idade) (
i
x
)
Y (peso) (
i
y
),
i i
y x

2
i
x

2
i
y

12 58 696 144 3364
8 42 336 64 1764
10 51 510 100 2601
11 54 594 121 2916
7 40 280 49 1600
7 39 273 49 1521
10 49 490 100 2401
14 56 784 196 3136
79 389 3963 823 19303

Assim, o coeficiente de correlação de Pearson é:

( ) | | ( ) | |
( ) | | ( ) | |
2 2 2
2
2
2
389 19303 8 79 823 8
389 79 3963 8
÷ × ÷ ×
× ÷ ×
=
÷ ÷
÷
=
¿ ¿ ¿ ¿
¿ ¿ ¿
i i i i
i i i i
y y n x x n
y x y x n
r
9431 , 0
663 , 1031
973
1064329
973
3103 343
30731 31704
= = =
×
÷
= r
Portanto o ajuste linear é muito bom.
b) Iremos calcular agora os coeficientes da equação
= +

( )
( )
8367 , 2
343
973
79 823 8
389 79 3963 8
2 2
2
= =
÷ ×
× ÷ ×
=
÷
× ÷
=
¿ ¿
¿ ¿ ¿
i i
i i i i
x x n
y x y x n
a

6122 , 20 875 , 9 8367 , 2 625 , 48
8
79
8367 , 2
8
389
= × ÷ = × ÷ = ÷ =
¿ ¿
n
x
a
n
y
b
i i
Logo, X Y 6122 , 20 8367 , 2 + =

Exemplo 11.2: Determine o coeficiente de correlação e a equação da reta de regressão
da tabela abaixo, que trata de uma pesquisa entre o peso total do lixo descartado por dia
com o peso do papel contido no lixo.



Tabela 11.2 – Relação do peso total do lixo descartado por dia e o peso papel contido no
lixo
Peso to-
tal(
i
x
)
10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14
Peso do
papel (
i
y
)
2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,35 11,43

Solução:
Para calcularmos o coeficiente de correlação de Pearson, necessitamos elaborar uma
tabela contendo nas colunas as variáveis dependentes (
i
y
), as independentes (
i
x
) e os
produtos
i i
y x
,
2
i
x
e
2
i
y
.

Tabela 11.3 – Calculos para construção da reta de ajuste
(
i
x
) (
i
y
)
i i
y x

2
i
x

2
i
y

10,47 2,43
25,4421 109,621 5,9049
19,85 5,12
101,632 394,023 26,214
21,25 6,88
146,2 451,563 47,334
24,36 6,22
151,519 593,41 38,688
27,38 8,84
242,039 749,664 78,146
28,09 8,76
246,068 789,048 76,738
33,61 7,54
253,419 1129,63 56,852
35,73 8,47
302,633 1276,63 71,741
38,33 9,55
366,052 1469,19 91,203
49,14 11,43
561,67 2414,74 130,64
288,21 75,24 2396,68 9377,52 623,47

9206 , 0
57 , 2478
83 , 2281
6143317
83 , 2281
59 , 573 21 , 10710
92 , 21684 75 , 23966
= = =
×
÷
= r
Portanto o ajuste linear é muito bom.
Para encontrar a equação da reta precisamos determinar:
( )
213 , 0
21 , 10710
83 , 2281
0 , 83065 2 , 93775
92 , 21684 75 , 23966
2
2
= =
÷
÷
=
÷
× ÷
=
¿ ¿
¿ ¿ ¿
i i
i i i i
x x n
y x y x n
a


38 , 1 82 , 28 213 , 0 52 , 7 = × ÷ = ÷ =
¿ ¿
n
x
a
n
y
b
i i

Logo, 213 , 0 38 , 1 + = X Y


Referências

BARBETTA, Pedro Alberto. Estatístico aplicado ás Ciências Sociais, 2ª Edição, Editora da
UFSC, Florianópolis – SC, 1998.
BERQUÓ, E. S.; SOUZA, J. M. P. e GOTLIEB, S. L. D.. Bioestatística, Editora USP, São Paulo-
SP, 1981.
BRAULE, Ricardo. Estatística aplicada com excell para cursos de administração e econo-
mia, 1ª edição, Editora Campus, Rio de Janeiro, 2001.
BUNCHAFT & KELLNER. Estatística sem Mistérios, vol. 1, 1ª edição, Editora Vozes, Petró-
polis - RJ, 1997.
BUSSAB, Wilton. Estatística Básica. Saraiva. 5a edição 2006. 540p. ISBN 8502034979
CRESPO, Antonio Arnot. Estatística fácil, 11ª edição, Editora Saraiva, São Paulo, 1994.
FONSECA, Jairo Simon e MARTINS, Gilberto de Andrade. Curso de Estatística, 6ª edição,
Editora Atlas, São Paulo, 1996.
KAZMIER, Leonard J. . Estatistica Aplicada à Economia e Administração. Coleção Schaum.
Editora McGraw-Hill do Brasil, São Paulo-SP, 1982
MANN, Prem S. Introdução à Estatística. LTC. 5a edição 2006, 774p. ISBN 852161506X
McCLAVE, J. T., BENSON, P. G., SINCICH, T. Statistics for Business and economics. 8 ed.
Nova Jersey: Prentice-Hall, 2001.
MILONE, Guiseppe. Estatística Geral e Aplicada. Thomson Pioneira. 498p.1a edição 2003.
ISBN 8522103399
MOORE, David S. A Estatística Básica e sua Prática. LTC. 3a edição 2005. 688p. ISBN
8521614438
PAGAMO, Marcello e GAUVREAU, Kimberlee. Principios de Bioestatística, 1ª edição, Edi-
tora Thomson, São Paulo-SP, 2004.
RIUS DIAZ, Francisca e LOPEZ, Francisco Javier Barón. Bioestatística, 1ª edição, Editora
Thomson, São Paulo-SP, 2007.
TRIOLA, Mário F. Introdução à Estatística. LTC. 10a edição 2008. 722p. ISBN 8521615868
VIEIRA, S.. Introdução a Bioestatística, Editora Campus Ltda, Natal-RN, 1991
VIEIRA, Sônia. Princípios de Estatística, 1ª edição, Editora Pioneira, São Paulo, 1999.
WILLCOX, Walter. The Founder of Statistics. Review of the International Statistical Insti-
tute 5(4):321-328, (1938).
WITTE, John S.; WITTE, Robert S. Estatística. LTC. 7a edição 2005. 506p. ISBN 8521614411

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->