Você está na página 1de 61

Universidade Federal do Sul e Sudeste do Pará

Instituto de Geociências e Engenharias


Faculdade de Engenharia de Materiais

Estatística

Prof. Dr. Fabio Barros de Sousa

Marabá - Pará
2022
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

UNIDADE 1 - CONCEITOS FUNDAMENTAIS

1.1. INTRODUÇÃO
A palavra estatística provém do latim status (estado) e é comumente
associada a censos, pesquisas de opinião pública, aos vários índices
governamentais, aos gráficos e medidas publicadas diariamente na imprensa. Na
realidade, como veremos adiante, a estatística engloba muitos outros aspectos.
Em alguma fase de seu trabalho, o pesquisador ou profissional se vê às
voltas com o problema de analisar e entender um conjunto de dados. Muitas vezes
ele necessitará resumir os dados para que sejam informativos, ou para compará-los
com outros resultados, ou ainda para julgar sua adequação a alguma teoria. A
estatística é fundamental na análise de dados provenientes de quaisquer processos
onde exista incerteza.

1.2. O QUE É ESTATÍSTICA?


Vários autores têm procurado definir a Estatística. Existem muitos livros sobre
estatística, todos contendo definições, desde as mais simples até as mais
complexas. A que se verá a seguir é a anunciada por Dugé de Bernonville, e que
julga-se ser simples e fácil de ser memorizada:
“Estatística é um conjunto de métodos e processos quantitativos que
serve para estudar e medir os fenômenos coletivos”.

A Estatística pode ser dividida em duas áreas:


1.2.1. Estatística Descritiva: é a parte da Estatística que tem por objeto descrever
os dados observados.
1.2.2. Estatística Indutiva (Inferência Estatística): é a parte da Estatística que tem
por objetivo obter e generalizar conclusões para a população a partir de uma
amostra, por meio do cálculo de probabilidade.
Portanto, pode-se dizer que a Estatística tem por objetivo o estudo dos
fenômenos coletivos e das relações que existem entre eles. Entende-se como
fenômeno coletivo aquele que se refere a um conjunto de elementos, pois a
estatística busca encontrar leis de comportamento para todo o conjunto e não se
preocupa com cada um dos elementos em particular.

2
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

1.3. POPULAÇÃO, CENSO E AMOSTRA

1.3.1. População ou Universo (N): é o conjunto constituído de elementos


(indivíduos, objetos, imóveis, etc.), que possuem alguma característica em comum,
num determinado instante/período de tempo.
A população, segundo o seu tamanho, pode ser finita ou infinita. É finita
quando possui um número determinado de elementos; a população infinita possui
um número infinito de elementos. Contudo tal definição existe apenas no campo
teórico, uma vez que na prática, nunca encontraremos populações com infinitos
elementos e sim com grande número de componentes e, tais populações são
tratadas como infinitas.
Os estudos destas populações podem ser feito de duas formas:

1.3.2. Censo: é a coleta exaustiva das informações de todas as unidades


(elementos) da população em estudo.
Na maioria das vezes, devido ao alto custo, ao intenso trabalho e ao tempo
desprendido, limitam-se as observações referentes a uma determinada pesquisa a
apenas uma parte da população que denominamos de amostra.

1.3.3. Amostra (n): é uma parte representativa da população (subconjunto finito),


selecionado adequadamente para estudo, onde a seleção depende do processo
denominado de amostragem.

1.3.4. Amostragem: É o processo de coleta das informações de parte da população,


chamada amostra, mediante métodos adequados de seleção destas unidades.

1.4. TIPOS DE AMOSTRAGEM E CÁLCULO AMOSTRAL


Quando se deseja colher informações sobre um ou mais aspectos de um
grupo grande ou numeroso, verifica-se, muitas vezes, ser praticamente impossível
fazer um levantamento do todo. Daí a necessidade de investigar apenas uma parte
desse todo. O problema da amostragem é, portanto, escolher uma parte, de tal
forma que ela seja a mais representativa possível do todo e, a partir dos resultados

3
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

obtidos, relativos a essa parte, poder inferir, o mais legitimamente possível, os


resultados do todo, se esta fosse verificada.
Apresenta-se a seguir um resumo dos quatro métodos mais usuais em
amostragem probabilística.

1.4.1. Amostragem Aleatória Simples (AAS): consistem em selecionar n unidades


amostrais de modo que cada unidade tenha a mesma chance de ser escolhida. Em
geral quando se tem características diferentes não se deve fazer a AAS, ou seja, a
população deve ser homogênea. Na prática, a amostra aleatória simples é escolhida
unidade por unidade. As unidades da população são numeradas de 1 a N. Em
seguida, escolhe-se uma série de números aleatórios, por meio de uma tabela de
números aleatórios, geradores de números aleatórios (software ou calculadora
científica) ou colocando-se todos os números dentro de uma urna, retirando-se uma
a uma, sem reposição, até completar a amostra de tamanho n.

1.4.2. Amostragem Aleatória Estratificada (AAE): consiste em subdividir a


população em grupos homogêneos (denominados estratos) segundo a(s) variável(is)
de interesse. Os estratos têm por objetivo controlar a variabilidade (menor
variabilidade), assim consegue-se diminuir o tamanho da amostra. O método de
estratificação mais comum é o proporcional, onde o tamanho dos estratos amostrais
são proporcionais ao tamanho de cada estrato (h) na população (Nh), levando-se em

consideração o peso Wh de cada estrato. Porém, pode-se selecionar a amostra


uniformemente, onde o tamanho dos estratos são iguais.

1.4.3. Amostragem Aleatória de Conglomerados (AAG): neste caso, as unidades


amostrais são conglomerados (quarteirões, escolas, blocos de apartamento, etc). Os
conglomerados devem ser homogêneos entre si e heterogêneos dentro, segundo a
variável de interesse. A seleção dos conglomerados deve ser feita a partir da
amostragem aleatória simples, já que os conglomerados são homogêneos.

1.4.4. Amostragem Sistemática (AS): é uma variação da AAS, onde a população


ou a relação de seus componentes deve ser ordenada, de forma tal que cada
elemento seja identificado, unicamente, pela posição. A AS é eficiente à medida que

4
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

a relação (ou “listagem”, fila, a disposição dos prédios etc...) esteja “misturada” no
que se refere à característica em estudo.
Suponha por exemplo que o total populacional seja dado por N = nk, onde n é

o tamanho da amostra e k é o comprimento do intervalo entre as observações

amostradas. Neste caso, seleciona-se inicialmente um valor r entre 1 e k (inclusive),


para ser o “chute” inicial, ou seja, a primeira observação a ser selecionada, onde
k  N n e a partir daí considera-se todos os elementos em intervalos de k
unidades. Isto é, seleciona-se os elementos r, r + k, r + 2k, e assim

sucessivamente, até que se complete o tamanho da amostra (r + (n-1)×k).


Por exemplo, considerando uma população de 150 fichas de alunos, para
selecionar uma amostra sistemática de 10 fichas tem-se que k = 15 e se a primeira

unidade selecionada for a de número r = 10, as seguintes serão as fichas de número


25, 40, 55, 70, 85, 100, 115, 130, 145.

1.4.5 Tamanho Mínimo de Amostra


Uma maneira fácil de obter a amostra é por meio da fórmula a seguir
N  n0
n (1)
N  n0
onde N é o tamanho da população e n0 é a primeira aproximação do tamanho da

1
amostra, obtido por n0  . Sendo que E é o erro amostral máximo tolerável.
E2

Obs.: quando não se conhece o N (tamanho da população), pode-se considerar a


população como infinita, e neste caso é suficiente considerar o tamanho da amostra
(n) como sendo igual a n0 .

A Figura 1 mostra que para um erro amostral fixo (E), a medida que o

tamanho da população cresce, o tamanho amostral (n) tende para o tamanho

amostral mínimo ( n0 ). Desta forma, não é correta retirar amostras estabelecendo-se

percentuais da população.
Figura 1: Representação gráfica do tamanho da população (N) em função do tamanho da
amostra (n), fixando o erro amostral (E).

5
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

n0

No caso da Amostragem Aleatória Estratificada Proporcional, deve-se calcular


Nh
o tamanho amostral dentro de cada estrato (h), sendo dado por nh  n  , onde n
N
é obtido pela Equação (1), N h é o total populacional do estrato h e N é o tamanho

total da população. Já no caso da Amostragem Aleatória Estratificada Uniforme,


n
deve-se calcular o tamanho da amostra para cada estrato (h) a partir de nh  ,
m
com h  1,, m.

Exemplo: Com o objetivo de conhecer algumas características dos alunos de uma


escola com N alunos. Supondo que seja de interesse realizar um levantamento por
amostragem para avaliar diversas características da população de alunos desta
escola. Qual deve ser o tamanho mínimo ( n0 ) e o tamanho corrigido (n) da amostra,

tal que se possa admitir, com alta confiança, que os erros amostrais não
ultrapassem 4% ( E = 0,04). Calcule para:
a) N = 35 alunos; b) N = 200 alunos; c) N = 200.000 alunos.

Observe que para manter o mesmo erro amostral, no item a) foi necessária
uma amostra abrangendo quase 100% da população; enquanto que no item b) a
amostra abrange 76%; e no item c) abrange apenas 0,3% da população. É, portanto,
errônea a ideia de que para uma amostra ser representativa deva abranger uma
percentagem fixa da população.

6
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Exemplo: Suponha que em uma região existam 6.000 alunos de Ensino


Fundamental, 3.000 do Ensino Médio e 1.000 do Ensino Superior. Para selecionar
uma amostra de 250 alunos:

a) Utilizando uma amostragem aleatória simples:


Para selecionar uma amostra aleatória simples deve-se garantir que a
população a ser estudada é homogênea, ou seja, esta população não pode ser
subdividida em relação a alguma característica em comum. Considerando que isso
seja verdade, ou seja, que a população de 10.000 estudantes é homogênea
seleciona-se uma amostra de 250 alunos, enumerando-se a população de 1 a
10.000 e fazendo um sorteio aleatório de 250 alunos.

b) Utilizando uma amostragem estratificada:


Considerando agora que a população estudada é subdividida em estrato, ou
seja, é heterogênea em relação aos tipos de ensino fundamental, médio e superior.
Desta forma, pode-se estabelecer a amostra a partir de dois métodos:

b1) AAE Uniforme:


m = 3 (número de estratos), h = 1, 2, 3, n = 250 (tamanho da amostra).
nh = 250 / 3 = 83 estudantes.
Relaciona-se os alunos de acordo com a escolaridade e seleciona-se, por
amostragem aleatória simples ou sistemática, os 83 estudantes de cada estrato.

b2) AAE Proporcional:


m = 3 (número de estratos), h = 1, 2, 3 n = 250 (tamanho da amostra).
6000
n1  250   250  0,60  150 alunos do ensino fundamental
10000
3000
n2  250   250  0,30  75 alunos do ensino médio
10000
1000
n3  250   250  0,10  25 alunos do ensino superior.
10000
Relaciona-se os alunos de acordo com a escolaridade e seleciona-se, por
amostragem aleatória simples ou sistemática.

7
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

b3) Utilizando-se amostragem sistemática para selecionar os alunos:


Enumera-se os 10.000 alunos por algum critério. Para selecionar n = 250,

então k = 10.000 / 250 = 40. Seleciona-se um número de 1 a 40, digamos 20. Então,

as unidades amostrais serão: 20o, 60o, 100o, 140o, ..., 9980o (20+249×40).

1.5. VARIÁVEL
A estatística ocupa-se fundamentalmente das propriedades das populações
cujas características são passíveis de representação. A característica que interessa
analisar é chamada de variável.
Variável: é convencionalmente o conjunto de resultados possíveis de um fenômeno,
conjunto este chamado domínio da variável.
As variáveis podem ser divididas em dois tipos: qualitativas e quantitativas.

Variável Qualitativa: quando o resultado da observação é apresentado na forma de


qualidade ou atributo.
Exemplo: sexo, estado civil, grau de escolaridade, cor dos olhos, etc. Pode ser
subdividida em nominal e ordinal.
Nominal: assume resultados em categorias ou atributos sem ordenação. Exemplo:
Gênero, cor dos olhos.
Ordinal: assume resultados em categorias que podem ser naturalmente ordenados.
Exemplo: Escolaridade, dia da semana, faixa etária, faixa salarial, etc.

Variável Quantitativa: quando o resultado da observação é expresso em números.


Exemplo: número de empregados, número de imóveis, salário, altura, peso, etc.
A variável quantitativa pode ser:
Contínua: quando assume qualquer valor entre dois limites e que resultam
normalmente de uma mensuração. Exemplo: peso (em Kg), altura (em cm), idade,
salário (em R$), temperatura (em oC), etc.
Discreta: quando assume valores inteiros, inclusive zero e que resultem,
frequentemente de uma contagem. Exemplo: número de alunos, número de filhos,
tamanho da família, etc.

8
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Quadro 1: Esquema de classificação de variáveis.


Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua

Exercício: Classifique as variáveis abaixo:


a) Número de filhos dos funcionários de uma escola.
b) Altura dos estudantes da turma A do Ensino Fundamental de uma escola.
c) Cor dos cabelos dos alunos de uma faculdade.
d) Salário dos professores de uma escola.
e) Número de indivíduos nas famílias dos moradores de um conjunto residencial.
f) Estado civil dos funcionários de uma escola.
g) Comprimento dos pregos produzidos por uma máquina.
h) Número de peças defeituosas fabricadas por uma máquina diariamente.

1.6. ARREDONDAMENTO DE DADOS


Conforme IBGE1 (1993) deve-se utilizar as seguintes regras de
arredondamento:
1.6.1. Regra I - Se o 1º algarismo a ser abandonado for menor que “5” o último a
permanecer fica inalterado.
Exemplo: Arredondar para centésimos os números abaixo.
a) 47,3227  47,32 b) 0,29364  0,29 c) 53,77474  53,77 d) 30,00132  30,00

1.6.2. Regra II - Se o último algarismo a permanecer for maior ou igual a “5” será
acrescido de uma unidade o algarismo a permanecer.

Exemplo: Arredondar para décimos os números abaixo.


a) 1,4632  1,5 b) 23,09425  23,1 c) 38,97777  39,0 d) 74,28583  74,3

Ajustamento: quando temos parcelas de percentagem que sofreram


arredondamento, pode ocorrer de o resultado não somar 100%. Neste caso é

1
IBGE. Centro de Documentação e Disseminação de Informação. Normas de apresentação
tabular/Fundação Instituto Brasileiro de Geografia e Estatística, Centro de Documentação e
Disseminação de Informações. 3ª Ed. Rio de Janeiro, 1993. 62 p.

9
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

necessário fazer o ajustamento, adicionando-se ou subtraindo-se, conforme o caso,


à parcela maior. Em caso de empate não deve ser acrescentado o décimo faltante a
nenhuma das parcelas, por exemplo, Classe A: 33,33%, Classe B: 33,33% e Classe
C: 33,33%.

Exemplo: Arredondar para décimos as parcelas abaixo as ajustando se for o caso.


40,457%  40,5 40,7
19,199%  19,2 19,2

13,535%  13,5 13,5

26,643%  26,6 26,6

99,8 100,0%

UNIDADE 2 - FASES DO TRABALHO ESTATÍSTICO E ELABORAÇÃO DE


QUESTIONÁRIOS

2.1. FASES DO TRABALHO ESTATÍSTICO

1a. DEFINIÇÃO DO PROBLEMA: Saber exatamente aquilo que se pretende


pesquisar, ou seja, definir corretamente o problema.

2a. PLANEJAMENTO: Como levantar informações? Que dados devem ser obtidos?
Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de
atividades? Os custos envolvidos? etc.

3a. COLETA DE DADOS: Fase operacional. É o registro sistemático de dados, com


um objetivo determinado.
i) Dados primários: quando são publicados pela própria pessoa ou organização
que os haja recolhido.
Exemplo: tabelas do censo demográfico do IBGE.
ii) Dados secundários: quando são publicados por outra organização.
Exemplo: quando determinado jornal publica estatísticas referentes ao censo
demográfico extraídas do IBGE.

10
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Obs.: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz
o grande risco de erros de transcrição.

iii) Coleta Direta: quando é obtida diretamente da fonte.


Exemplo: Empresa que realiza uma pesquisa para saber a preferência dos
consumidores pela sua marca.
A coleta direta dos dados pode ser:
Coleta contínua: registros de nascimento, óbitos, casamentos;
Coleta periódica: recenseamento demográfico, censo industrial;
Coleta ocasional: registro de casos de dengue.
iv) Coleta indireta: É feita por deduções a partir dos elementos conseguidos pela
coleta direta, por analogia, por avaliação, indícios ou proporcionalização.

4a. APURAÇÃO E CRÍTICA DOS DADOS: Resumo dos dados a partir de sua
contagem e agrupamento. É a condensação e tabulação de dados.

5a. APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se


excluem mutuamente. A apresentação tabular, ou seja, é uma apresentação
numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo
regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação
gráfica dos dados numéricos constitui uma apresentação geométrica permitindo
uma visão rápida e clara do fenômeno.

6a. ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do trabalho


estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo
de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno
(estatística descritiva). Também podem ser feitas generalizações (inferências) e
previsões.

7a. APRESENTAÇÃO DE RELATÓRIO FINAL: Esta fase representa a finalização


do trabalho estatístico. Nela, deve-se apresentar um relatório técnico com a
metodologia adotada, os resultados encontrados e as conclusões possíveis de
serem apresentadas.

11
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

2.2. ELABORAÇÃO DE QUESTIONÁRIOS


Um questionário é um instrumento para levantar informações a que se deve
responder sem a interferência do avaliador/pesquisador. Geralmente usa-se o termo
“questionário” para designar qualquer instrumento de coleta de informações. No
entanto, quando este instrumento é preenchido pela população-alvo da avaliação o
termo técnico para designá-lo é “formulário”.
Existem diversos tipos de questionários e nenhum deles pode ser
considerado como ideal para coletar todos os tipos de informações.
Antes de iniciar qualquer questionário (ou entrevista) devem-se analisar quais
os objetivos da pesquisa, pois eles indicarão os tipos de perguntas mais
adequadas a cada situação. As perguntas do questionário devem dar subsídios para
responder aos objetivos. Após análise e definição do que realmente se deseja,
inicia-se o processo de elaboração do questionário.
É muito importante procurar informações a respeito de questionários já
utilizados para fazer as mesmas perguntas que se pretende. Provavelmente na
revisão de literatura tem-se conhecimento de outros estudos do mesmo assunto ou
parecidos. Aproveite essa experiência prévia de outras pessoas para aprimorar o
seu conhecimento. Talvez não seja possível utilizar o questionário integralmente, já
que pode haver perguntas que não se adaptam as necessidades da pesquisa atual.
Nesses casos, utilize as questões de interesse e elabore as demais perguntas
necessárias, tomando os devidos cuidados. O motivo de utilizar outros questionários
garante que se utilizem perguntas já testadas, facilitando assim que os resultados
sejam comparáveis.
Os seguintes itens devem ser observados na elaboração de novas perguntas:
 Clareza da Pergunta: A pergunta deve conter o mínimo de informações possíveis
para que seja compreensível e não deixe margem para dúvidas.
 Adequação da Linguagem: A pergunta deve possuir uma linguagem simples, que
possa ser compreendida independentemente do grau de instrução do entrevistado.
 Objetividade: A pergunta deve ser curta e direta, enfatizando o ponto principal que
se tem interesse. Perguntas confusas geram respostas incompletas ou em branco.
 Finalidade da Pergunta: Pergunte-se sempre: Por que você quer saber isso? É
realmente necessária essa pergunta?
Uma vez definido o questionário e antes de ser utilizado na pesquisa, deve-se
fazer o que se denomina “pré-teste”. O “pré-teste” serve para verificar se as
12
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

perguntas estão formuladas de forma clara e se não há nenhum problema não


previsto. É o momento de identificar possíveis erros no questionário.
É importante que a coleta das variáveis seja da forma mais básica possível,
pois isso facilita a tabulação, quantificação e análise dos resultados. Por exemplo,
pergunte a idade em anos ou a data de nascimento do entrevistado, ou pergunte a
instrução em anos de estudo completos do entrevistado, entre outros.

Tipos de questionários:
 Com questões fechadas: tem a vantagem de permitir respostas padronizadas
que permitem comparação com outras avaliações. Também permite maior
economia de recursos (por facilitar o tratamento e análise da informação e por
exigir menor tempo). A desvantagem é que permite facilitar a resposta (por esta já
ser oferecida) para um informante que não saberia ou que encontraria maior
dificuldade em responder a uma determinada questão.
 Com questões fechadas e abertas: algumas questões abertas podem ser
incluídas no questionário, quando não se sabem todas as respostas que se podem
obter dos informantes.

Dificuldades apontadas:
 Formular as perguntas com objetividade e clareza para atingir o objetivo;
 Escolher as questões mais relevantes, limitando o número, em relação ao perfil do
entrevistado e ao tema;
 Elaborar as questões de forma a não constranger o entrevistado;
 Elaborar as questões sem “duplo sentido”;
 Fechar as questões;
 Elencar todas as alternativas de respostas possíveis (abrangentes, mas em
número reduzido);
 Elaborar perguntas que não induzam a resposta;
 Trabalhar com intervalos de classe (categorização);
 Formular ou selecionar as perguntas atendendo ao foco (objetivo) da pesquisa;
 Fazer a categorização das respostas nas perguntas abertas;
 Uso de termos que parecem de fácil entendimento para o entrevistador, mas não o
são para o entrevistado;

13
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

 Dificuldade no registro das respostas de perguntas abertas, principalmente quando


o entrevistador é das séries iniciais (compromete a “fidelidade” dos dados
obtidos?);
 Ordenação adequada das questões e das alternativas de respostas para uma não
influenciar a outra ou para não induzir.

O que deve ser evitado na elaboração do questionário:


 Não inclua duas perguntas em uma: isso leva a respostas que podem não ser
relevantes ou podem ser induzidas, além de não se poder identificar a que questão
ela se refere.
 De preferência não utilize questões com e, ou. Elas podem ser na verdade duas
questões diferentes. Esteja certo de quando usar tal terminologia.
 Evite questões ambíguas: pelas palavras utilizadas; pelas expressões muito
coloquiais ou por usar palavras muito difíceis para a compreensão do informante.
 Cada pergunta deve ser concreta e específica e permitir uma resposta também
concreta.
 Não induza a resposta através do modo afirmativo da pergunta: por exemplo, ao
perguntar sobre tabagismo, não diga: Você fuma? Mas sim: Você não fuma?
 Redobre a atenção ao formular perguntas que abordem assuntos delicados, muito
íntimos ou incômodos para o informante.
 Antes de usar seu questionário faça um pré-teste com ele. Este teste deve ser feito
com um informante com as mesmas características do informante-alvo da
avaliação.
 O questionário não deve ser muito longo, mas também não precisa ser muito curto.

Algumas sugestões na elaboração do questionário:


 Comece com as perguntas mais fáceis.
 Use uma ordem lógica para o informante no ordenamento das questões, variando
por tamanho e tipo sempre que possível.
 Informações que são necessárias para outras perguntas devem vir primeiro.
 Se for utilizar questões abertas, estas devem vir no final, junto com questões que
abordem temas mais delicados para o informante.
 Quando for necessário verificar a resposta do informante para uma questão mais
delicada, faça a mesma pergunta na negativa mais adiante. Um exemplo: O aborto

14
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

deve ser legalizado: Concordo__ Discordo__. E mais adiante no questionário: O


aborto não deve ser legalizado: Concordo__ Discordo __.

UNIDADE 3 - TABELAS ESTATÍSTICAS


3.1. TABELA: É um quadro, aberto nas laterais, que resume um conjunto de dados
dispostos segundo linhas e colunas de maneira sistemática.

3.1.1. Principais Elementos de uma Tabela:


a) Título da Tabela: localizado no topo da tabela, deve conter informações, as mais
completas possíveis, respondendo às perguntas: O que?, Quando? e Onde?,
além de conter a palavra “TABELA” e sua respectiva numeração.
b) Corpo da Tabela: é o conjunto de linhas e colunas que contém informações sobre
a variável em estudo, onde:
# na parte superior da tabela tem-se o cabeçalho da coluna, que especifica o
conteúdo das colunas;
# verticalmente têm-se as colunas (indicadora e numérica), onde a coluna
indicadora é aquela que especifica o conteúdo das linhas e na coluna numérica
os valores numéricos destas linhas.
c) Rodapé: localizado na parte inferior da Tabela (fora) e contém informações sobre
o responsável pela informação (FONTE), algum texto esclarecedor a cerca do
conteúdo da tabela (NOTA) e por fim algum símbolo remissível atribuído a algum
elemento da tabela que necessite de uma nota (CHAMADA).

Observação: Nenhuma casa deve ficar sem preenchimento. Todas devem ter o
registro de algum número ou sinal:
- (hífen): quando o valor numérico é nulo;
... (reticências): quando não se dispõe de dado;
? (ponto de interrogação): quando há dúvida sobre a exatidão do valor;
0; 0,0; ou 0,00 (zero), quando o valor numérico é pequeno para ser expresso
pela unidade utilizada. Este deve conter o mesmo número de casas decimais
padronizado pela tabela;
x (letra x): quando o dado for omitido a fim de evitar individualização da
informação.

15
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

3.1.2. Regras para Tabelas


a) em artigos ou publicações que contenham muitas tabelas, estas serão numeradas
em ordem crescente, conforme o aparecimento;
b) tabelas são fechadas no alto e embaixo por linhas horizontais, mas não à
esquerda e à direita por linhas verticais. Traços verticais para separar colunas no
corpo da tabela podem ser empregados;
c) uma vez definido um determinado número de casas decimais, esse número será
mantido para todas as casas de modo a assegurar uniformidade na apresentação
dos dados;
d) totais e subtotais serão destacados.

Tabela 1: Esquema de apresentação de uma tabela.


Título: O que? Quando? Onde?
 cabeçalho
Corpo Coluna Coluna
da indicadora numérica
Tabela Total
Rodapé: fonte, notas, observações.

3.2. SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um


conjunto de dados estatísticos em função da época, do local ou da espécie.

3.2.1. Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O


local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de
histórica ou evolutiva.

Tabela 2: Quantidade de alunos matriculados em uma escola, no 1º bimestre de


2011.
Mês Quantidade
Janeiro 20.000
Fevereiro 10.000
Total 30.000
Fonte: Dados fictícios, Março/2011.

3.2.2. Série Geográfica: Apresenta como elemento variável o fator geográfico. A


época e o fato (espécie) são elementos fixos. Também é chamada de espacial,
territorial ou de localização.

16
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Tabela 3: Quantidade de alunos matriculados em escolas públicas, no 1º bimestre


de 2011, por cidade.
Cidade Quantidade
Marabá 13.000
Santarém 17.000
Belém 50.000
Total 80.000
Fonte: Dados fictícios, Março/2011.

3.2.3. Série Específica: O caráter variável é apenas o fato ou espécie. Também é


chamada de série categórica.

Tabela 4: Quantidade de carros vendidos da ABC Veículos LTDA, no 1º bimestre de


2011, por marca do carro.

Marca Quantidade
FIAT 18.000
GM 12.000
Chevrolet 10.000
Total 40.000
Fonte: Dados fictícios, Março/2011.

3.2.4. Série Conjugada: Também chamada de tabela de dupla entrada ou série


mista. São apropriadas à apresentação de duas ou mais séries de maneira
conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O
exemplo abaixo é de uma série geográfica-temporal.

Tabela 5: Quantidade de carros vendidos da ABC Veículos LTDA, no 1º bimestre de


2011 e por cidade da filial.
Mês
Filial Total
Janeiro Fevereiro
São Paulo 10.000 3.000 13.000
Rio de Janeiro 12.000 5.000 17.000
Total 22.000 8.000 30.000
Fonte: Dados fictícios, Março/2011.

3.2.6. Séries de Dados Agrupados ou Distribuição de Frequências


Neste caso TODOS os elementos são fixos (época, local e fenômeno). A
distribuição de frequência pode ser por intervalo ou por pontos, dependendo da
quantidade de informações que se tenha ou/e do tipo de variável. É um tipo de
tabela que condensa uma coleção de dados conforme as frequências (repetições de
seus valores). É utilizada quando se tem dados quantitativos discretos ou contínuos.

17
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

(i) Distribuição de Frequência por Intervalos: é uma série estatística na qual a


variável observada está dividida em subintervalos do intervalo total observado e o
tempo, a espécie e a região permanecem fixos.

Exemplo de Distribuição de Frequência por Intervalo:

Tabela 6: Tempo de Estudo (em dias) de 160 alunos da Escola W, no ano de 2010.
Tempo de Estudo Número de Fi fri Fri Xi
(em dias) Alunos (fi)
1ª classe 10 |─ 20 38
2ª classe 20 |─ 30 45
3ª classe 30 |─ 40 30
4ª classe 40 |─ 50 22
5ª classe 50 |─ 60 10
6ª classe 60 |─ 70 15
 160
Fonte: Dados Hipotéticos, JAN/2011.

a) Construção de Distribuições de Frequências por Intervalos:


1º Passo: montar o Rol (organizar os dados em ordem crescente ou decrescente).
2º Passo: calcular a Amplitude Total da distribuição de frequência (T), que é a
diferença existente entre o maior (Xmáximo) e o menor valor (Xmínimo) observado.
T  X máximo  X mínimo .
3º Passo: Determinar o Número de Classes da Distribuição de Frequência (K), que
são os subintervalos nos quais são contadas as observações da variável. Existem
varias maneiras de se calcular o número de classes, neste curso será utilizado o
método prático.
- Se n < 25, utiliza-se K=5 classes;

- Se n ≥ 25, utiliza-se: K  n.
Outra maneira de obter:
Fórmula de Sturges: k = 1 + 3,22log(49)  7 classes
Observação: Sempre arredondar o valor de K (é um número inteiro) seguindo as
regras de arredondamento.
4º Passo: calcular o intervalo de Classe ou Amplitude do Intervalo de Classe ( h),

T
que é o comprimento da classe. (geralmente este valor é fornecido): h  .
K
5º Passo: Construção das Classes

18
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

1ª Classe  Limite Inferior = menor valor do Rol


Limite Superior = Limite Inferior da 1ª Classe + Valor do Intervalo de classe
2ª Classe  Limite Inferior = Limite Superior da 1ª Classe
Limite Superior = Limite Inferior da 2ª Classe + Valor do Intervalo de classe
...
kª Classe  Limite Inferior = Limite Superior da (k-1)ª Classe
Limite Superior = Limite Inferior da kª Classe + Valor do Intervalo de classe.

Convenção: |─ inclui à esquerda e exclui à direita.


─| exclui à esquerda e inclui à direita.
─ exclui ambos.
|─| inclui ambos.

6º Passo: obtenção da Frequência Simples ou Frequência Absoluta da


Classe ( Fi ) que é o número de observações contadas dentro da classe.

7º Passo: Ponto Médio de Classe ( X i ): é a média aritmética calculada entre o limite

inferior ( li ) e o superior ( l s ) da classe. É o valor em estatística que representa os

(li  ls )
valores da variável dentro da classe. X i  .
2

b) Tipos de Frequências
b.1) Frequência Absoluta Acumulada de Classe (Fi): é a acumulação sucessiva,
a partir da primeira classe até uma classe qualquer, das frequências simples ou
absoluta das classes.
F1  f1
F2  f1  f 2
...
FK  f1  f 2  ...  f K
b.2) Frequência Relativa de Classe (fri): é a relação existente entre a frequência
absoluta ou simples de classe e o número de observações da variável.
fi
fri  K
 fi
i 1

Obs.: 1º)  fr 1 e
i 2º) n   f i .

19
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

b.3) Frequência Relativa Acumulada ( Fri ): é a acumulação sucessiva, a partir da

primeira classe até uma classe qualquer das frequências relativas das classes.
Fr1  fr1
Fr2  fr1  fr2
...
Frk  fr1  fr2  ...  frk
b.4) Percentual
i) Percentual Simples: é o percentual de cada intervalo e é calculada em função da
frequência simples;
ii) Percentual Acumulado: é o percentual de cada intervalo e é calculada em função
da frequência acumulado.

(ii) Distribuição de Frequência por Pontos


É uma série estatística na quais as frequências observadas estão associadas
a um ponto real observado. Na construção da distribuição por ponto, o numero
linhas (classes) na tabela é igual ao número de pontos existentes, e utilizam-se os
mesmos elementos da distribuição por intervalo, com a diferença que o próprio
ponto já é o valor de Xi (ponto médio na distribuição por intervalo).

Exemplo de Distribuição de Frequência por Pontos:

Tabela 07: Número de Dependentes dos Professores em Dezembro/2010.

Dependentes (Xi) Professores (fi) Fi fri Fri


1º ponto 0 40
2º ponto 1 50
3º ponto 2 30
4º ponto 3 20
5º ponto 4 10
 150
Fonte: Dados Hipotéticos, JAN/2011.

20
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

UNIDADE 4 - REPRESENTAÇÃO GRÁFICA

4.1. GRÁFICOS ESTATÍSTICOS: São representações visuais dos dados estatísticos


que devem corresponder, mas nunca substituir as tabelas estatísticas.
Características: Uso de escalas, sistema de coordenadas, simplicidade, clareza e
veracidade.
Obs.: 1) Uso indevido de gráficos: Podem trazer uma ideia falsa dos dados que
estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na
realidade, de um problema de construção de escalas.
2) Colocar a Fonte no final do Gráfico ou Figura (Ex.: Fonte: Quem forneceu e Data).

Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e


Cartogramas.

4.2. DIAGRAMAS: São gráficos geométricos dispostos em duas dimensões. São os


mais usados na representação de séries estatísticas. Eles podem ser:

4.2.1. Gráficos em Colunas ou em Barras


É a representação de uma série por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os
retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.
E Quando em barras, os retângulos têm a mesma altura e os comprimentos são
proporcionais aos respectivos dados.

i) Exemplo de Gráfico em Colunas

Figura 2: Percentual de Alunos Matriculados no Período de Janeiro de 2007 a Dezembro de 2010.

21
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

ii) Exemplo de Gráfico em Barras


Figura 3: Percentual de Alunos Matriculados no Ano de 2010, por Instituição de Ensino.

Observação: A ordem a ser observada é a cronológica, se a série for histórica, e


decrescente/crescente, se for geográfica ou categórica.

4.2.2. Gráficos em Colunas ou Barras Múltiplas


Este tipo de gráfico é geralmente empregado quando deseja-se representar,
simultaneamente, dois ou mais fenômenos estudados com o propósito de
comparação.

Figura 4: Quantidade de Alunos Aprovados e Reprovados no Período de Janeiro de 2007 a


Dezembro de 2010.
700 654

600
Quantidade de Alunos

500
432
387
400
298
300 Aprovados
247
223
175 Reprovados
200
108
100

0
2007 2008 2009 2010
Ano

Observação: Este tipo de gráfico pode ser feito em mais dimensões, quando isto
ocorre este gráfico denomina-se Estereograma.

4.2.3. Gráficos em Colunas ou Barras Empilhadas


Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo
fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.

22
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 5: Quantidade de Alunos Matriculados, no Período de Janeiro de 2007 a Dezembro de 2010,


por Turno.

Figura 6: Percentual de Alunos Matriculados, no Período de Janeiro de 2007 a Dezembro de 2010,


por Turno.

4.2.4. Gráficos em Linhas ou em Linhas Múltiplas


São frequentemente usados para representação de séries cronológicas com
um grande número de períodos de tempo. As linhas são mais eficientes do que as
colunas, quando existem intensas flutuações nas séries ou quando há necessidade
de se representarem várias séries em um mesmo gráfico.

Figura 7: Percentual de Desistência de Alunos: Escola XYZ, no Período de Agosto a Dezembro de


2010.

23
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 8: Quantidade de Desistência de Aluno por Turno, nos meses de Agosto a Dezembro de
2010.

4.2.5. Gráficos em setores


Este gráfico é construído com base em um círculo, e é empregado sempre
que desejamos ressaltar a participação do dado no total. O total é representado pelo
círculo, que fica dividido em tantos setores quantas são as partes. Os setores são
tais que suas áreas são respectivamente proporcionais aos dados da série. O
gráfico em setores só deve ser empregado quando há, no máximo, cinco dados.
Obs.: As séries temporais e variáveis qualitativas ordinais não podem ser
representadas por este tipo de gráfico.

Figura 9: Percentual de Alunos Matriculados em uma Escola Pública da Região Metropolitana de


Belém, no Ano de 2011, por Gênero.

4.3. PICTOGRAMAS: São construídos a partir de figuras representativas da


intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a
atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem
ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma
visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:

24
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 10: População Matriculada no Ensino Fundamental, do Estado Pará, no


Período de 2008 a 2011.

2008

2009

2010

2011

4.4. CARTOGRAMAS: São ilustrações relativas a cartas geográficas (mapas). O


objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados
com áreas geográficas ou políticas.

Figura 11: Percentual de Domicílios no Brasil com Automóveis de Uso Particular - 2011.

4.5. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

4.5.1. Histograma: É a representação gráfica de uma distribuição de frequência, a


partir de retângulos justapostos onde a base é colocada no eixo das abscissas
corresponde ao intervalo das classes, e a altura é dada pela frequência absoluta (ou
relativa) das classes.

25
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 12: Exemplo de Histograma.


50

45

40
Frequencia Simples

35

30

25

20

15

10

0
10 20 30 40 50 60 70
Tempo de Internações (dias)

Figura 13: Histograma dos salários pagos aos funcionários do Estado do Pará, no ano de 2000.

0,3

0,25
Relativa

0,2
Frequência

0,15
Frequência

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Salário emSalário
unidades monetárias

4.5.2. Polígono de Frequência: Unindo-se por linhas retas os pontos médios das
bases superiores dos retângulos do histograma, obtemos o polígono de frequência.
O polígono de frequência pode referir-se às frequências absolutas ou as relativas,
conforme a escala no eixo vertical. O polígono de frequência pode ser montado
sozinho (sem o histograma).

26
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 14: Exemplo de Polígono de Frequência.

41 43 47 51 55 59
61
Figura 15: Polígono de frequência das idades de alunos da Escola Onésima – Santarém – 2010.

50
45
40
35
Frequências

30
25
20
15
10
5
0
2,5 6,5 10,5 14,5 18,5 22,5 26,5 30,5
Ponto Médio

Obs.: Uma distribuição de frequências sem intervalos de classe é representada


graficamente por um diagrama onde cada valor da variável é representado por um
segmento de reta vertical e de comprimento proporcional à respectiva frequência.

UNIDADE 5 - MEDIDAS DE TENDÊNCIA CENTRAL

São medidas representativas das características avaliadas pelos seus valores


centrais, em torno dos quais tendem a concentrar-se os dados. Tais medidas
possibilitam comparações de séries de dados pelo confronto de seus valores. As
medidas de tendência centrais mais utilizadas são: média aritmética, moda e
mediana.

5.1. MÉDIA ARITMÉTICA: X


A média aritmética é obtida pela soma de todos os valores de uma variável X

dividida pelo número total de observações (n):

27
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

n
 Xi
X1  X 2  ...  X n i 1
X  .
n n
Exemplo: Sabendo-se que o atendimento diário em uma empresa de arquitetura,
durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para
atendimento médio diário na semana de:
10  14  13  15  16  18  12
X  14 pessoas.
7

Se os dados estão agrupados em uma distribuição de frequência, devem ser


consideradas duas possibilidades:
a) Sem intervalos de classe: Consideremos a distribuição relativa a 34 famílias de
quatro filhos, tomando para variável o número de filhos do gênero masculino.
Calcularemos a quantidade média de meninos por família:
Nº. de meninos Nº. de famílias ( f i )
0 2
1 6
2 10
3 12
4 4
Total 34

Como as frequências são números indicadores da intensidade de cada valor


da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a
média aritmética ponderada, dada pela fórmula:
k

f X  f 2 X 2  ...  f k X k ( f i  Xi) k
X  1 1
f 1  f 2  ...  f k
 i 1
k
em que f i
n
f
i 1
i
i 1

Que na prática pode ser determinado como:


xi fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78

28
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

k
 X i  fi 
Logo X  i 1
k
 78/34 = 2,3  2
 fi
i 1

b) Com intervalos de classe: Neste caso, convencionamos que todos os valores


incluídos em um determinado intervalo de classe coincidem com o seu ponto médio,

e determinamos a média aritmética ponderada por meio da fórmula com X i agora


sendo o ponto médio da classe.

Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo.


Estaturas (cm) Frequência ( f i ) Ponto médio ( X i ) X i fi
50 |─ 54 4 52 208
54 |─ 58 9 56 504
58 |─ 62 11 60 660
62 |─ 66 8 64 512
66 |─ 70 5 68 340
70 |─ 74 3 72 216
Total 40 2.440
k

 f i  Xi 
2440
Aplicando a fórmula acima temos: X  i 1
k
  61 . Logo: X  61 cm
40
f
i 1
i

5.2. MEDIANA: M d

Colocados os valores em ordem crescente de grandeza (rol), a mediana


( M d ) será o valor que ocupa a posição central da série de dados, ou seja, é o valor

que divide a série em duas partes com números iguais de elementos. A mediana é
preferível à média quando se está interessado em conhecer exatamente o centro da
distribuição dos dados, ou ainda, quando os valores extremos podem afetar
sensivelmente a média. O cálculo da mediana é feito sob duas condições:

5.2.1. A MEDIANA EM DADOS NÃO-AGRUPADOS


Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}.
De acordo com a definição de mediana, o primeiro passo a ser dado é o da
ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}.
O valor que divide a série acima em duas partes iguais é igual a 9, logo M d = 9.

29
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

i) Método prático para o cálculo da Mediana:


a) Se a série de dados tiver número ímpar de termos: O valor mediano será o
termo que ocupa a posição central do rol, ou seja, o termo cuja posição é dada pela
fórmula: (n + 1)/2
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}
1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}
2º - calcular a posição: n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º
elemento da série ordenada será a mediana.
Portanto, a mediana será o 5º elemento, então M d = 2

b) Se a série dada tiver número par de termos: O valor mediano será a média
aritmética dos valores centrais do rol, ou seja, os termos que ocupam a posição n/2
e n/2+1
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
2º - calcular a posição: n = 10 logo a mediana será a média aritmética do termo que
ocupa a posição n/2 = 10/2 =5, ou seja, o 5º termo e do termo que ocupa a posição
n/2+1 = 10/2+1 = 6, ou seja, o 6º termo.
No rol: 5º termo = 2 e 6º termo = 3
A mediana será a média aritmética do 5º e 6º termos da série, ou seja = (2+3) / 2 ou
seja, M d = 2,5.

5.2.2. A MEDIANA EM DADOS AGRUPADOS


a) Sem intervalos de classe: Neste caso, é o bastante identificar a frequência
acumulada ( FAc ) imediatamente superior à metade da soma das frequências. A

mediana será aquele valor da variável que corresponde a tal Frequência


acumulada.

Exemplo: conforme distribuição de frequências abaixo:


Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc (i ) )
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 -

30
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Quando o somatório das frequências for ímpar o valor mediano será o termo que

ocupa a posição dada pela fórmula: f i 1


2
Como o somatório das frequências = 35 a fórmula ficará: (35+1)/2 = 18º termo.
Localizando na coluna da variável (Xi), M d = 3.

Quando o somatório das frequências for par o valor mediano será a média aritmética
dos valores centrais da distribuição, ou seja, os termos que ocupam a posição

f i
e
f i
1
2 2
Exemplo: Calcule a Mediana da distribuição de frequências abaixo:
Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc (i ) )
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 -

Localizando a posição da mediana na frequência acumulada teremos: 8/2 = 4º termo


e 8/2+1 = 5º termo. Localizando na coluna da variável (Xi), o 4º termo = 15 e o 5º
termo = 16. Logo M d = (15 + 16) / 2 = 15,5

b) Com intervalos de classe: Devemos seguir os seguintes passos:


1º) Determinamos as frequências acumuladas;

2º) Calculamos
f i
para localizar a classe mediana;
2
3º) Marcamos a classe correspondente à frequência acumulada imediatamente

superior à
f i
. Tal classe será a classe mediana;
2

k 
 i f i  FAc( ant ) 
1
4º) Calculamos a Mediana pela fórmula: M d  li   h
 f i 
 
onde: li = Limite inferior da classe da mediana;

31
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

FAc(ant ) = Frequência acumulada anterior da classe da M d ;

f i = Frequência simples da classe da mediana;

h = Intervalo de classe.

Exemplo

Classes Frequência ( f i ) Frequência acumulada ( FAc( i ) )


50 |─ 54 4 4
54 |─ 58 9 13
58 |─ 62 11 24
62 |─ 66 8 32
66 |─ 70 5 37
70 |─ 74 3 40
Total 40

1º Localizar a classe mediana:


 f i  40  20 . A frequência acumulada que contém
2 2
a 20ª unidade é a 3ª classe (classe mediana será 58 |─ 62)
2º Identificar os elementos da fórmula na classe mediana:
l i = 58; FAc(ant ) = 13; h = 4 e f i = 11;

3º Substituindo esses valores na fórmula, obtemos:

Md  58 
20  13.  4  60,54
11
Obs: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

5.3. MODA: M o

A moda ( M o ) é o valor que ocorre com maior frequência ou o valor que mais

se repete. Quando a série de dados é tal que as frequências são maiores nos
extremos, ou quando se quer destacar um valor de alta frequência ou quando se
pretende obter uma medida rápida e aproximada da tendência central, a moda pode
então, ser considerada para a interpretação dos dados. Com relação à moda, uma
série de dados pode ser classificada em amodal (não possui moda), unimodal
(possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui
mais de duas modas).

5.3.1. A Moda quando os dados não estão agrupados


A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor
que mais se repete.
32
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Ex: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
Ex: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.

Em outros casos, pode haver dois ou mais valores de concentração. Dizemos,


então, que a série tem dois ou mais valores modais.
Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A série é bimodal.

5.3.2. A Moda quando os dados estão agrupados


a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar
imediatamente a moda: basta localizar o valor da variável de maior frequência.

Ex: Qual a temperatura mais comum medida no mês abaixo:


Temperatura Frequência
0º C 3
1º C 9
2º C 12
3º C 6
Resp: 2º C é a temperatura modal, pois é a de maior Frequência .

b) Com intervalos de classe: A classe que apresenta a maior Frequência é


denominada classe modal. Pela definição, podemos afirmar que a moda, neste
caso, é o valor dominante que está compreendido entre os limites da classe
modal. O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor a denominação de moda bruta.

M o  (li  ls ) / 2
onde li = limite inferior da classe modal e l s = limite superior da classe modal.

Exemplo: Calcule a estatura modal conforme a tabela abaixo.


Classes (em cm) Frequência
54 |─ 58 9
58 |─ 62 11
62 |─ 66 8
66 |─ 70 5
Resposta: a classe modal é 58|─ 62, pois é a de maior frequência. li = 58 e l s = 62

33
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

M o = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real


da moda).

Método mais elaborado pela fórmula de CZUBER:

 ( fMo  fant )   ( fMo  fant ) 


Mo  li     h ou Mo  li    h
 Mo
2 f  ( fant  fpost 
)   ( f 
 Mo antf )  ( fMo  fpost 
)
onde: li = Limite inferior da classe modal;

f Mo = Frequência modal;

f ant = Frequência simples anterior à classe modal;

f post = Frequência simples posterior à classe modal;

h = Intervalo de classe.

Exemplo: Calcule a Moda da tabela do exemplo anterior pelo processo de CZUBER


 11  9 
Mo  58     4  59,6
 2  11  9  8

Obs.: A moda é utilizada quando desejamos obter uma medida rápida e


aproximada de posição ou quando a medida de posição deva ser o valor mais típico
da distribuição. Já a média aritmética é a medida de posição que possui a maior
estabilidade e a mediana é a medida mais central.

5.4. MEDIDAS SEPARATRIZES


Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à
mediana relativamente à sua característica de separar a série em partes que
apresentam o mesmo número de valores.
Essas medidas - os quartis, os decis e os percentis - são conhecidas pelo
nome genérico de separatrizes.

5.4.1. QUARTIS - Qq
Denominamos quartis os valores de uma série que a dividem em quatro
partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em
quatro partes iguais.
34
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Obs: O quartil 2 (Q2) SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE.

i) QUARTIS EM DADOS NÃO AGRUPADOS


O método mais prático é utilizar o princípio do cálculo da mediana para os 3
quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.

Exemplo 1: Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}


- O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos
valores: {2, 5, 6, 9, 10, 13, 15}
- O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9
que será = Q2 = 9.
- Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta
calcular as medianas das partes iguais provenientes da verdadeira Mediana da série
(quartil 2).
Logo em {2, 5, 6} a mediana é = 5. Ou seja: será o Quartil 2 = Q2 = 5
Em {10, 13, 15} a mediana é =13. Ou seja: será o Quartil 2 = Q2 = 13

Exemplo 2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}


A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5
O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5}
Q1 = (2+3)/2 = 2,5
O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13}
Q3 = (9+9)/2 = 9

ii) QUARTIS PARA DADOS AGRUPADOS EM CLASSES


A fórmula para determinação dos quartis para dados agrupados é semelhante
à usada para o cálculo da mediana.
Passos para Determinação do Quartil ( Qq ):
k
q   fi
1º passo: calcula-se a posição: p  i 1
;
4
2º passo: identifica-se a classe Qq pela coluna das Frequências Acumuladas;

3º passo: Aplica-se a fórmula:

35
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

 k 
 i
1
fi 
q  FAc( ant)  , para q = 1, 2, 3
Qq  li Qq   4  h
 fi Qq 
 
 
 

onde: liQq = Limite inferior da classe do Quartil;


FAc(ant) = Frequência acumulada anterior a classe do Quartil;
f iQ = Frequência simples da classe do Quartil;
q

h = Intervalo de classe.

Exemplo 3 - Calcule os quartis da tabela abaixo:


Classes Frequência (fi) Frequência acumulada
50 |─ 54 4 4
54 |─ 58 9 13
58 |─ 62 11 24
62 |─ 66 8 32
66 |─ 70 5 37
70 |─ 74 3 40
Total 40

O quartil 2 = M d , logo:

p  2  40  20 . Logo.a classe mediana será 58 |─ 62


4
li = 58........... FAc(ant) = 13........... fi = 11........... hi = 4

Substituindo esses valores na fórmula, obtemos:


 20  13 
Q2  58    4  60,54  Md
 11 
10  4 
O quartil 1: p  1 40  10  Q1  54    4  56,66
4  9 
 30  24 
O quartil 3: 3. fi / 4 = 30  Q3  62    4  65
 8 

5.4.2. DECIS - Dd
A definição dos decis obedece ao mesmo princípio dos quartis, com a
modificação da porcentagem de valores que ficam aquém e além do decil que se
pretende calcular. A fórmula básica será: k×fi /10 onde k é o número de ordem do
decil a ser calculado. Indicam-se os decis: D1, D2, ... , D9. Deste modo precisa-se de
9 decis para se dividir uma série em 10 partes iguais.

36
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

De especial interesse é o quinto decil, que divide o conjunto em duas partes


iguais. Assim sendo, o QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL, que por
sua vez É IGUAL À MEDIANA.
Para D5 tem-se: 5. fi / 10 = fi / 2

Exemplo: Calcule o 3º decil da tabela anterior com classes.


k= 3 onde 3x (fi / 10) = 3 x 40/10 = 12.
Este resultado corresponde a 2ª classe.
12  4 
D3  54     4  54  3,55  57,55
 9 

5.4.3. PERCENTIL ou CENTIL


Denomina-se percentis ou centis como sendo os noventa e nove valores
que separam uma série em 100 partes iguais. Indicamos: P 1, P2,... , P99. É evidente
que P50 = Md; P25 = Q1 e P75 = Q3.
O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém
a fórmula será: k×fi / 100, onde k é o número de ordem do centil a ser calculado.
Para P45 temos: 45×fi / 100
Ex: Calcule o 45º Centil da tabela anterior com classes.

Relação entre as Medidas Separatrizes:


Uma relação importante entre as quatro Medidas Separatrizes é na verdade
uma relação até visual, que não precisamos fazer esforço para percebê-la, basta
traçar uma reta horizontal (que representará o conjunto de dados), e depois fazer as
divisões, exatamente como mostramos nas seções anteriores, como pode ser visto a
seguir:
|-------------------|-------------------|
1 Md 100
|---------|---------|---------|---------|
Q1 Q2 Q3
|---|---|---|---|---|---|---|---|---|---|
D1 D2 D3 D4 D5 D6 D7 D8 D9
|---|---|---|---|---|---|---|---|---|---|
P10 P20 P30 P40 P50 P60 P70 P80 P90

Daí, concluí-se sem maiores dificuldades que: Md  Q2  D5  P50

37
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

UNIDADE 6 - MEDIDAS DE DISPERSÃO

6.1. MEDIDAS DE DISPERSÃO ABSOLUTA


6.1.1. AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o
ponto de referência.

Quando os dados não estão agrupados a amplitude total é a diferença entre o maior
e o menor valor observado: AT  X Máx  X Mín .

Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será:


AT = 70 – 40 =30

Quando os dados estão agrupados sem intervalos de classe ainda temos:


AT  X Máx  X Mín .

Exemplo:
Xi fi
0 2
1 6 AT = 4 - 0 = 4
3 5
4 3

Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior


da última classe e o limite inferior da primeira classe. Então:

AT  LMáx  LMín
Exemplo:
Classes fi
4 |─ 6 6
6 |─ 8 2 AT = 10 – 4 = 6
8 |─10 3

A amplitude total tem o inconveniente de só levar em conta os dois valores


extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso
da amplitude total quando se quer determinar a amplitude da temperatura em um
dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita
exatidão.

6.1.2. DESVIO QUARTIL: Também chamado de amplitude semi-interquatílica e é


baseada nos quartis. Dq  (Q3  Q1 ) / 2

Observações:

38
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

1) O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de
calcular e de interpretar. Além do mais, não é afetado pelos valores extremos,
grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os
dados figurem valores extremos que não se consideram representativos.
2) O desvio quartil deverá ser usado preferencialmente quando a medida de
tendência central for a mediana.
3) Trata-se de uma medida insensível à distribuição dos itens menores que Q 1, entre
Q1 e Q3 e maiores que Q3.

Exemplo: Para os valores: 40, 45, 48, 62 e 70 o desvio quartil será:


Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75

6.1.3 DESVIO MÉDIO ABSOLUTO - DM

i) Para dados brutos: É a média aritmética dos valores absolutos dos desvios
tomados em relação a uma das seguintes medidas de tendência central: média ou
mediana.
n
 ( xi  x )
a) para a Média = DM  i  1
n
n
 ( xi  Md )
b) para a Mediana = DM  i  1
n
c) As barras verticais indicam que são tomados os valores absolutos, prescindindo
do sinal dos desvios.

Exemplo: Calcular o desvio médio do conjunto de números {- 4, - 3, - 2, 3, 5}


X = - 0, 2 e M d = - 2

Tabela auxiliar para cálculo do desvio médio


Xi
-4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
-3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
-2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7
= 16,8 = 15

Pela Média: DM = 16,8 / 5 = 3,36 Pela Mediana: DM = 15 / 5 = 3

39
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

6.1.4. DESVIO PADRÃO - S


É a medida de dispersão mais empregada, pois leva em consideração a
totalidade dos valores da variável em estudo. É um indicador de variabilidade
bastante estável. O desvio padrão baseia-se nos desvios em torno da média
aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da
média aritmética dos quadrados dos desvios e é representada por:
n
 (Xi  X )
2

S i 1 quando tratamos de uma população de dados não-agrupados.


n

Exemplo: Calcular o desvio padrão da população representada por {-4, -3, -2, 3, 5}.
Como X = - 0,2, então:

-4 - 3,8 14,44
-3 - 2,8 7,84
-2 - 1,8 3,24
3 3,2 10,24
5 5,2 27,04
= 62,8

Sabe-se que n = 5 e 62,8/5 = 12,56.

(Xi  X )
2
62,8
S   12,56  3,54
n 5
Obs: Quando nosso interesse não se restringe à descrição dos dados, mas partindo
da amostra, visamos tirar inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A

fórmula ficará então: S 


(X i  X )2
n 1

Se os dados {- 4 , -3 , -2 , 3 , 5} representassem uma amostra o desvio padrão


amostral será a raiz quadrada de 62,8 / (5 -1) = 3,96.
O desvio padrão detém algumas propriedades, dentre as quais destacamos:
1ª: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma
variável, o desvio padrão não se altera.

40
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

2ª: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por
essa constante.
Quando os dados estão agrupados (temos a presença de Frequência s) a fórmula
do desvio padrão será:

S
 (X i  X )2 fi  (X i  X )2 fi
S
 fi ou
 f i 1 quando se trata de uma amostra.

Ex: Calcule o desvio padrão populacional da tabela abaixo:


Xi f i Xi . f i
0 2 0 -2,1 4,41 8,82
1 6 6 -1,1 1,21 7,26
2 12 24 -0,1 0,01 0,12
3 7 21 0,9 0,81 5,67
4 3 12 1,9 3,61 10,83
Total 30 63 32,70

Sabe-se que  f i  30 e 32,7 / 30 = 1,09.


A raiz quadrada de 1,09 é o desvio padrão = 1,044
Se considerar os dados como sendo de uma amostra o desvio padrão será a raiz
quadrada de 32,7 / (30 -1) = 1,062.
O desvio padrão pode ser calculado usando a seguinte fórmula prática:

(  X i fi ) 2 (  X i fi ) 2
 X i fi   X i fi 
2 2

S n ou S  n quando se trata de uma amostra.


 i
f  i
f  1

Ex: Calcule o desvio padrão populacional do exemplo anterior:


.
0 2 0 0 0
1 6 6 1 6
2 12 24 4 48
3 7 21 9 63
4 3 12 16 48
Total 30 63 165

(63)2
165 
S 30  1,09  1,044
30
Se os dados forem uma amostra, o resultado será:

41
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

(63)2
165 
S 30  1,128  1,062
30  1
Obs.: Nas tabelas de distribuições de frequências com intervalos de classe a fórmula
a ser utilizada é a mesma do exemplo anterior.

Ex: Calcule o desvio padrão populacional da tabela abaixo:


É necessário calcular o ponto médio das classes

Pontos .
2├ 4 8 3 24 9 72
4├ 6 7 5 35 25 175
6├ 8 13 7 91 49 637
8├ 10 2 9 18 81 162
Total () 30 168 1046

Usando a fórmula prática:

(  Xi fi ) 2 (168) 2
 Xi fi 
2
1046 
S n  30  3,507  1,873
 fi 30

Se os dados forem uma amostra, o resultado será:

(  Xi fi ) 2 (168) 2
 Xi fi 
2
1046 
S n  30  3,628  1,905
 fi  1 30  1

2
6.1.5. VARIÂNCIA - S
É o desvio padrão elevado ao quadrado. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente importante na
inferência estatística e em combinações de amostras.

6.2. MEDIDA DE DISPERSÃO RELATIVA


6.2.1 Coeficiente de Variação
É uma medida adimensional, útil para comparar variabilidades de diferentes
amostras, onde as médias são muito desiguais ou as unidades de medidas são
diferentes. O coeficiente de variação (CV) é o desvio padrão expresso em

42
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

porcentagem da média, isto é, magnitude relativa do desvio padrão quando


comparado com a média da distribuição das medidas. O coeficiente é dado por:
S
CV( X)   100%
X
Exemplo: Tome os resultados das estaturas e dos pesos de um mesmo grupo de
indivíduos:
Discriminação Média Desvio Padrão
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado


menor será o de maior homogeneidade (menor dispersão ou variabilidade).
CV estatura = (5 / 175) x 100 = 2,85%
CV peso = (2 / 68) x 100 = 2,94%.
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão
que os pesos.

UNIDADE 7 - CORRELAÇÃO LINEAR DE PEARSON

Frequentemente procura-se verificar se existe relação entre duas ou mais


variáveis.
 O peso pode estar relacionado com a idade das pessoas;
 O consumo das famílias pode estar relacionado com sua renda,
 Bem como, a demanda de um determinado produto e seu preço.

A verificação da existência e do grau de relação entre variáveis é o objeto de


estudo da correlação.

Karl Pearson

Nascimento: 27 de março de 1857, em


Londres
Morte: 27 de abril de 1936, em Londres

43
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

7.1 Correlação Linear Simples


Se um sistema de coordenadas retangulares mostra a localização dos pontos
(x, y) e se todos os pontos desse diagrama parecem cair nas proximidades de uma
reta, a correlação é denominada linear.

Fazendo X a variável independente, se Y tende a aumentar quando X cresce,


a correlação é denominada positiva. Se Y tende a diminuir quando X aumenta, a
correlação é denominação negativa.

7.1.1. Diagramas de Dispersão

Figura 16: Exemplos de Diagramas de Dispersão.

Observação: Para correlações na forma da Figura 16(h) é necessário que seja


aplicada uma transformação nos dados, ou seja, é necessário linearizar os dados, já
que os mesmos não têm comportamento linear.

44
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

7.2. Coeficiente de Correlação Linear de Pearson


O instrumento de medida da correlação linear é dado pelo coeficiente de
correlação de Pearson. E pode ser calculado a partir da fórmula a seguir:
n

 x i  x  yi  y 
r i 1
ou
n n

 x  x  y  y
2 2
i i
i 1 i 1
n n n
n xi yi   xi  yi
r i 1 i 1 i 1

 n 2  n 2
 n 2  n 2

 n x    x   n y    y  
 i 1 i  i 1 i   i 1 i
 i 1  
i
 
n

S xy  x i  x  yi  y 
ou r , onde S xy 
i 1
, S x e S y são os desvios padrão
SxS y n 1
n

x y i i  nx y
de X e Y, respectivamente. Assim r i 1
.
(n  1) S x S y

Obs.: O campo de variação do coeficiente r situa-se entre -1 e +1.

7.2.1. Interpretando o valor de r


Figura 17: Escala de Correlação entre as Variáveis X e Y.

i) Valores de r acima de 0,90 ou abaixo de -0,90 indicam uma forte correlação;


ii) Valores de r que vão de 0,50 a 0,90 ou de -0,50 a -0,90 indicam correlação
moderada;
iii) Valores de r de 0 a 0,50 e de -0,50 a 0,00 indicam fraca correlação.

45
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Quanto mais próximo de -1 ou +1, mais forte será a correlação entre as


variáveis estudadas.

Exemplo: Construa o diagrama de dispersão e calcule o coeficiente de correlação


linear entre as variáveis X e Y da tabela abaixo.
X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9

Solução: calcular primeiramente os somatórios


X Y XY X2 Y2
1 1 1 1 1
3 2 6 9 4
4 4 16 16 16
6 4 24 36 16
8 5 40 64 25
9 7 63 81 49
11 8 88 121 64
14 9 126 196 81
56 40 364 524 256

Portanto

n xi yi  ( xi )( yi ) 8  364  (56)(40)


r 
n x i
2 2

  x i  n yi   y i 
2 2
 8  524  (56) 8  256  (40) 
2 2

2912 2240 672 672 672


r     0,98
(4192 3136)(2048 1600) 1056 448 473088 687,81

Exemplo 1: Nota da prova e tempo de estudo. X é o tempo de estudo (em horas) e Y


é a nota da prova. A Tabela abaixo apresenta os pares de observações (Xi, Yi) para
cada estudante.
Tempo (X) Nota (Y)
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3

O coeficiente de correlação de Pearson dos dados é dado por r = 0,996. Pode-se


dizer que existe uma forte correlação positiva entre a nota da prova e o tempo de
estudo, quanto maior a nota da prova, maior o tempo de estudo.

46
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

Figura 18: Diagrama de Dispersão.

10
T em po

3.5 4.5 5.5 6.5 7.5 8.5 9.5


Nota

Exercícios:
1) Construa o diagrama de dispersão, calcule o coeficiente de correlação de
Pearson e interprete:

a) Considerando as alturas de homens e mulheres:


Homens (cm) Mulheres (cm)
170 165
182 168
179 151
168 155

b) Considere as duas variáveis observadas em 50 estados norte-americanos. Onde


foram medidas a taxa de criminalidade (Y) e a taxa de analfabetismo (X). E
considere as medidas x  1,17 , y  7,38 , S x  0,609 , S y  3,692 e x y
i i  509,12 .

c) Considere as duas variáveis observadas em 50 estados norte-americanos. Onde


foram observadas a expectativa de vida (Y) e a taxa de analfabetismo (X). E
considere as medidas x  1,17 , y  70,88 , S x  0,609 , S y  1,342 e x y i i  4.122,8 .

d) Considere as variáveis observadas em nove localidades com as mesmas


características demográficas e socioeconômicas. Sendo Y o consumo de cerveja
diário por mil habitantes, em litros e X a temperatura máxima (em ºC).
Localidade (X) Temperatura (Y)
16 290
31 374

47
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

38 393
39 425
37 406
36 370
36 365
22 320
10 269

e) Considere a altura (cm) e o peso (kg) de 12 indivíduos.

Altura (X) Peso (Y)


175 76
169 71
185 90
180 81
170 70
174 73
187 76
168 65
176 70
195 92
196 90
162 55

2) Calcule o coeficiente de correlação:

Paciente X (tempo (minutos) em repouso) Y (Pressão arterial diastólica)


1 0 72
2 5 66
3 10 70
4 15 64
5 20 66

3) Avalie o tipo de correlação a partir do Diagrama abaixo:


Figura 3: Diagrama de dispersão da pressão arterial diastólica (Y) e do tempo
(minutos) em repouso (X).

48
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

UNIDADE 8 - AJUSTAMENTO DE CURVAS (REGRESSÃO)

Na prática, constata-se frequentemente a existência de uma relação entre


duas (ou mais) variáveis e se deseja expressar tal relação sob forma matemática,
estabelecendo-se uma equação (função) entre as variáveis.
Supondo a variável X independente (variável explicativa) e a variável Y
aleatória (variável dependente ou resposta), dizemos que Y  f  x  .

As retas de regressão linear são funções resultantes do ajuste de uma função


linear entre duas variáveis Y e X. Para obter a reta de regressão é necessário
calcular o coeficiente angular (coeficiente de regressão) e o intercepto da reta com a
ordenada Y, ou seja, o ponto onde a reta ajustada corta o eixo de Y.

Figura 19. Representação da reta de regressão ajustada.

Y = a + bX

8.1. Ajustamento da Reta


Estabelecida a função Y  a  bX , é necessário conhecer os valores de a e b
de forma que a reta passe tão próxima quando possível dos pontos assinalados no

49
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

diagrama de dispersão. Isto é, deseja-se minimizar a discrepância total entre os


pontos marcados e a reta que será determinada.
Utilizando o método dos mínimos quadrados, para se estimar os parâmetros

n xi yi   xi  yi
a e b , tem-se: b  a  Y  bX ,
n xi2   xi 
de 2 e

onde n é o número de observações ou tamanho da amostra, X é a média da


variável X e Y é a média da variável Y. Comumente a reta ajustada é representada
por Yˆ  E (Y )  a  bX para a e b estimados.

Exemplo: Utilizando os dados abaixo:


Quantidade (X) em unidades 10 11 12 13 14 15
Custos (Y) em R$ 100 112 119 130 139 142
a) Construa o diagrama de dispersão.
b) Calcule o coeficiente de correlação linear.
c) Encontre a reta de regressão linear ajustada.
d) Qual é o custo para 16 unidades de X?

Solução:
Figura 20: Diagrama de dispersão.

140

130
Custos (Y)

120

110

100

10 11 12 13 14 15
Quantidade (X)

X Y XY X2 Y2
10 100 1000 100 10000
11 112 1232 121 12544
12 119 1428 144 14161
13 130 1690 169 16900
14 139 1946 196 19321
15 142 2130 225 20164
75 742 9426 955 93090

50
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

O coeficiente de correlação linear de Pearson é dado por:


n xi yi  ( xi )( yi )
r
n x i
2
  x i 
2
n y i
2
  y i 
2

69426(75)(742) 5655655650
r  
6955(75) 693090(742) 
2 2 57305625558540550564

 906  906  906  0,99


1057976 837480 915,14

Para ajustar uma reta de regressão linear aos dados deve-se encontrar os
coeficientes de regressão a e b, também chamados de parâmetros. E os mesmos
são estimados a partir de:

n xi yi   xi  yi 6  9426  (75)(742) 906 906


b     8,63
n x   xi  6  955  (75) 5730  5625 105
2 2 2
i

X x i

75
 12,5 Y  y i

742
 123,67
n 6 n 6
a  Y  b X  123,67  (8,63  12,5)  15,795  15,80 .
Portanto a reta ajustada é dada por Yˆ  15,8  8,63 X . i i

O custo para 16 unidades de X é dado a partir da substituição do valor de X = 16 na

equação Yˆi  15,8  8,63 X i , logo Yˆ16 é dado por:


Yˆ16  15,8  8,63  16  153,88 .
O custo para 16 unidades de X é dado por R$153,88.

Exercícios:
1) Para as medidas de quantidade de chuva (X) que ocorreu em vários anos e a
respectiva safra de trigo (Y), encontre os itens:
a) Construa o diagrama de dispersão.
b) Calcule o coeficiente de correlação linear.
c) Encontre a reta de regressão linear ajustada.
d) Qual é a safra de trigo para uma precipitação pluviométrica de 500 mm?

Precipitação Pluviométrica (mm) Safra de Trigo (t/ha)


327,7 5,4420

51
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

182,9 2,4991
287,0 4,5454
472,4 7,0184
223,5 3,6224
261,6 3,8749
403,9 6,2086
332,7 4,7370

2) A matéria-prima usada na fabricação de uma fibra sintética é armazenada em um


local onde não há controle de umidade. Durante 12 dias, mediu-se a umidade
relativa (X) no local de armazenamento e o conteúdo de umidade (Y) (ambos em
percentagens) de uma amostra da matéria-prima, obtendo-se os seguintes
resultados:
a) Construa o diagrama de dispersão.
b) Calcule o coeficiente de correlação linear de Pearson.
c) Ajuste uma reta de mínimos quadrados que nos permita predizer o conteúdo de
umidade em termos da umidade relativa.
d) Com o resultado do item (a), estime o conteúdo de umidade quando a umidade
relativa é 38%.
Umidade (%) Conteúdo de umidade (%)
46 12
53 14
37 11
42 13
34 10

52
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

29 8
60 17
44 12
41 10
48 15
33 9
40 13
Tabulação de dados

Quadro 1 – Exemplo de Banco de Dados. Informações sobre o estado civil, grau de


instrução, número de filhos, salário (expresso como fração do salário mínimo), idade
(medida em anos e meses) e procedência de 40 funcionários da Empresa
GloboAnalisys, em 2011.
N°de Salário Idade Região de
N° Estado civil Grau de instrução
filhos* (em SM) anos meses procedência
1 Solteiro Ensino fundamental — 4,00 26 03 Interior
2 Casado Ensino fundamental 1 4,56 32 10 Capital
3 Casado Ensino fundamental 2 5,25 36 05 Capital
4 Solteiro Ensino médio — 5,73 20 10 Outro
5 Solteiro Ensino fundamental — 6,26 40 07 Outro
6 Casado Ensino fundamental 0 6,66 28 00 Interior
7 Solteiro Ensino fundamental — 6,86 41 00 Interior
8 Solteiro Ensino fundamental — 7,39 43 04 Capital
9 Casado Ensino médio 1 7,59 34 10 Capital
10 Solteiro Ensino médio — 7,44. 23 06 Outro
11 Casado Ensino médio 2 8,12 33 06 Interior
12 Solteiro Ensino fundamental — 8,46 27 11 Capital
13 Solteiro Ensino médio — 8,74 37 05 Outro
14 Casado Ensino fundamental 3 8,95 44 02 Outro
15 Casado Ensino médio 0 9,13 30 05 Interior
16 Solteiro Ensino médio — 9,35 38 08 Outro
17 Casado Ensino médio 1 9,77 31 07 Capital
18 Casado Ensino fundamental 2 9,80 39 07 Outro
19 Solteiro Superior — 10,53 25 08 interior
20 Solteiro Ensino médio — 10,76 37 04 Interior
21 Casado Ensino médio 1 11,06 30 09 Outro
22 Solteiro Ensino médio — 11,59 34 02 Capital
23 Solteiro Ensino fundamental — 12,00 41 00 Outro
24 Casado Superior 0 12,79 26 01 Outro
25 Casado Ensino médio 2 13,23 32 05 Interior
26 Casado Ensino médio 2 13,60 35 00 Outro
27 Solteiro Ensino fundamental — 13,85 46 07 Outro
28 Casado Ensino médio 0 14,69 29 08 Interior
29 Casado Ensino médio 5 14,71 40 06 Interior
30 Casado Ensino médio 2 15,99 35 10 Capital
31 Solteiro Superior — 16,22 31 05 Outro
32 Casado Ensino médio 1 16,61 36 04 Interior
33 Casado Superior 3 17,26 43 07 Capital
34 Solteiro Superior — 18,75 33 07 Capital
35 Casado Ensino médio 2 19,40 48 11 Capital
36 Casado Superior 3 19,82 42 02 Interior
37 Solteiro Ensino Médio — 20,25 32 06 Interior
38 Solteiro Superior — 22,10 28 05 Capital
39 Casado Ensino Fundamental 5 23,30 41 03 Capital
40 Casado Ensino Médio 4 24,50 30 01 Interior
Fonte: Adaptado de Bussab e Morettin (2010).
Nota: * A pergunta Número de filhos não foi feita para os funcionários solteiros.

53
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

EXERCÍCIOS
1. Considerando os dados do Quadro 1 referentes a Empresa GloboAnalisys, que
realizou um levantamento sobre alguns aspectos socioeconômicos dos seus
funcionários, em Dezembro de 2011. Pede-se:
a) Classificar as variáveis
b) Organizar as variáveis em tabelas
c) Construir gráficos para representar cada tabela
d) Fazer a análise de dados de cada tabela

2. Classifique as variáveis em qualitativas (nornal ou ordinal) ou quantitativas (contínuas


ou discretas):
a) Cor dos olhos
b) Número de filhos
c) O ponto obtido em cada jogada de um dado
d) Número de peças produzidas/hora
e) Diâmetro externo de uma peça
f) Vocação profissional
g) Precipitação pluviométrica (mm)
h) Número de ações negociadas na BOVESPA
i) Salário dos professores
j) Comprimento de um prego produzido por uma máquina
k) Sexo dos filhos
l) Produção de algodão (kg/ha)
m) Comprimento de um segmento de reta
n) Número de livros de Matemática de uma biblioteca
o) Número de defeitos de aparelhos de televisão

3. Verificou-se em 2010, o seguinte movimento de importação, de mercadorias:


9.319.906 t, oriundas da Arábia Saudita, no valor de US$ 1.089.760.000; 7.960.090 t,
dos Estados Unidos, no vator de US$3.348.549.000; 458.403 t do Japão, no valor de
US$ 1.058.433.000. Confeccione a séne correspondente e classifique-a. Dados
fornecidos pelo Ministério da Agricultura em Dezembro de 2011.

54
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

4. O Departamento de Relações Industriais da Empresa K forneceu dados referente


ao contingente operacional, sendo 100 homens e 40 mulheres. Dos homens, 40 são
menores. Entre as mulheres 10 são menores. Represente esses dados em uma
tabela e classifique-a.

5. O pessoal docente do Estado de São Paulo no ano de 2010 é o seguinte; rede


estadual (Ensino Fundamental: 171.910; Ensino Médio: 38.281) rede municipal
(Ensino Fundamental: 18.429; Ensino Médio: 1.304); rede particular (Ensino
Fundamental: 31.514; Ensino Médio: 19.902). Construa uma série estatística e
classifique-a.

6. O Brasil apresentou a seguinte produção de laminados não-planos, no


período de 2008 a 2010: vergalhões, 2.203, 1.272, 1.139, respectivamente;
barras, 1.141, 1.272, 1.139, respectivamente; perfilados, 526, 538, 425,
respectivamente; tubos, 390, 344, 330, respectivamente. Montar uma tabela de dupla
entrada. Valores em 1.000 t.

7. Montar uma série para representar os valores das exportações de açúcar,


fornecidas pelo Instituto do Açúcar e do Álcool, nos anos de 2004 a 2010, em
milhares de dólares; 60.193 - 80.114 - 812.826 – 106.879 – 112.064 – 126.740 –
149.548.

8. Montar uma série cronológica para representar a quantidade de alunos matriculados


no ensino de Ensino Fundamental no Brasil nos anos de 2005 a 2010 em milhares de
alunos, segundo dados fictícios: 19.720 - 21.473 – 21.887 – 22.598 – 22.473 –
23.564.

9. Idealizar uma série geográfica para representar o seguinte fato:


estabelecimentos de ensino da Região Norte do Brasil, em 2011. A Região Norte
subdividi-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem
um total de 29, 13, 78, 4, 110 e 9 estabelecimentos de ensino
respectivamente, segundo dados fictícios.

55
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

10. Utilizar uma série específica para representar o pessoal docente em exercício
em 2011, divididos segundo a natureza: Pública (Pará: 70.992; Amapá: 45.119) e
Particular (Pará: 66.447; Amapá: 49.664), de acordo com o Ministério da Educação,
em Dezembro de 2011.

11. Idealizar uma série geográfica para representar o seguinte fato: população da
região Norte do Brasil em 2010, sabendo-se que em Rondônia, Acre, Amazonas,
Roraima, Pará, Amapá e Tocantins, tem-se, respectivamente: 1.560.501 - 732.793
- 3.480.937 - 451.227 - 7.588.078 - 668.689 - 1.383.453 habitantes, segundo
dados da Fundação IBGE.

12. Construir um gráfico adequado para os Exercícios de 3 a 11.

13. Os dados abaixo representam o número de filhos de 60 casais residentes na


zona urbana de uma determinada cidade:
1 5 1 2 2 3 0 2 8 6
0 1 2 3 5 0 4 0 5 6
7 0 2 2 3 4 2 6 3 0
1 2 0 2 1 3 0 6 4 0
1 0 5 6 8 7 2 0 6 0
3 6 9 8 2 0 1 2 0 3
a. Classifique a variável.
b. Construir uma distribuição de frequências sem classes para os dados.
c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Calcular a média aritmética, a moda e a mediana.
g. Calcular a variância, o desvio-padrão e o coeficiente de variação.
h. Analisar os resultados.

14. Considere os dados relativos às alturas de 100 indivíduos (dadas em cm):


151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170

a. Classifique a variável.

56
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

b. Construir uma distribuição de frequências com classes para os dados.


c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Construir o histograma e o polígono de frequências.
g. Calcular a média aritmética, a moda e a mediana.
h. Calcular os quartis, decil 1, decil 9, percentil 10 e 90.
i. Calcular a variância, o desvio-padrão e o coeficiente de variação.
j. Analisar os resultados.

15. Resultados da prova de Rapidez Numérica - Exame de Admissão do Colégio


São José - 2011:
25 33 35 37 55 27 40 16 14 46
39 28 34 29 44 36 22 27 21 21
29 21 28 29 33 42 15 33 24 27
41 20 23 38 47 32 15 51 19 17
27 33 46 10 16 34 18 36 19 26
a. Classifique a variável.
b. Construir uma distribuição de frequências com classes para os dados.
c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Construir o histograma e o polígono de frequências
g. Calcular a média aritmética, a moda e a mediana.
h. Calcular os quartis, decil 6, percentil 14 e 86.
i. Calcular a variância, o desvio-padrão e o coeficiente de variação.
j. Analisar os resultados.

16. A tabela abaixo representa a distribuição dos salários (em R$) de 100 pessoas:
200 150 120 300 500 120 100 200 350 100
250 350 125 140 140 150 200 350 500 600
120 200 140 150 250 100 120 150 200 600
500 150 250 350 450 430 425 600 120 150
350 600 120 150 135 170 450 100 200 100
100 250 220 230 350 600 500 150 100 250
120 100 120 120 240 350 120 100 200 142
250 350 120 100 100 550 450 400 300 200
100 350 150 180 190 200 300 500 100 150
120 100 200 150 140 120 500 600 100 150

57
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

a. Classifique a variável.
b. Construir uma distribuição de frequências com classes para os dados.
c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Construir o histograma e o polígono de frequências.
g. Calcular a média aritmética, a moda e a mediana.
h. Calcular os quartis, decil 4, percentil 30 e 80.
i. Calcular a variância, o desvio-padrão e o coeficiente de variação.
j. Analisar os resultados.

17. Considere os dados de notas obtidas na prova de Matemática da 6 a série -1°


bimestre de 2011, do Colégio C.
5,0 4,5 3,0 2,0 1,5 8,0 7,0 6,2 7,0 6,0
7,0 6,0 6,5 8,0 8,0 7,0 5,0 5,0 3,0 2,0
6,5 4,0 6,0 4,0 5,0 3,0 4,5 4,5 8,0 4,4
7,0 5,0 5,0 7,0 7,0 6,0 9,0 5,5 5,0 8,0
3,0 7,0 1,0 4,0 5,5 2,0 3,5 2,0 2,0 2,5
7,0 7,0 8,0 1,0 3,0 0,5 9,5 5,5 2,0 6,0
a. Classifique a variável.
b. Construir uma distribuição de frequências com classes para os dados.
c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Construir o histograma e o polígono de frequências
g. Calcular a média aritmética, a moda e a mediana.
h. Calcular os quartis, decil 4, percentil 30 e 80.
i. Calcular a variância, o desvio-padrão e o coeficiente de variação.
j. Analisar os resultados.

18. Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos


da Escola A:
X 11 14 19 19 22 28 30 31 34 37
Y 13 14 18 15 22 17 24 22 24 25
a. Verifique, pelo diagrama, se existe correlação.
b. Em caso afirmativo, calcule o coeficiente de correlação e interprete.

58
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA

c. Calcule a reta ajustada.


d. Estime os pontos correspondentes de um aluno no teste Y que tirou 20 pontos
no teste X.

19. Informações sobre o grau de instrução e o local de nascimento de 30 estudantes


universitários do Curso de Administração, em 2011.
Estado civil Local de nascimento Estado civil Local de nascimento
Solteiro Capital Casado Interior
Casado Interior Solteiro Capital
Solteiro Capital Solteiro Capital
Solteiro Capital Casado Capital
Casado Capital Solteiro Interior
Solteiro Interior Solteiro Capital
Solteiro Capital Solteiro Capital
Solteiro Capital Casado Interior
Casado Interior Solteiro Capital
Solteiro Capital Solteiro Capital
Solteiro Capital Casado Capital
Casado Capital Solteiro Interior
Solteiro Interior Solteiro Capital
Solteiro Capital Solteiro Capital
Solteiro Capital Solteiro Capital
a. Elaborar uma tabela simples para as variáveis estado civil e local de nascimento,
com a porcentagem.
b. Construir um gráfico para cada tabela.

59
MODELO DE QUESTIONÁRIO FECHADO

É um questionário que não dar ao entrevistado a oportunidade de responder com suas próprias
opiniões, porque as respostas às perguntas do questionário foram fornecidas pelo pesquisador.
A seguir, exemplo de um questionário fechado.

1. Qual é a sua idade? _____ anos completos. Altura: ____ metros. Peso: ______
quilogramas. 2. Sexo: ( ) Masculino ( ) Feminino

3. Como você se considera?


( ) Branco (a); ( ) Negro (a); ( ) Pardo (a)/mulato (a); ( ) Amarelo (a) (de origem oriental);
( ) Indígena ou de origem indígena.

4. Quantos filhos você tem? ____

5. Qual a faixa de renda mensal da sua família?


a. ( ) Menos que R$545,00;
b. ( ) De R$545,00 e R$1.634,99;
c. ( ) De R$1.635,00 até R$2.724,99;
d. ( ) De R$2.725,00 até R$5.449,99;
e. ( ) Mais de R$5.450,00.

6. Qual é a carga horária semanal aproximada de sua atividade remunerada? _____ horas

7. Possui outro curso de graduação? ( ) Sim ( ) Não

8. Como você avalia o nível de exigência do seu curso de Engenharia de Materiais na


Unifesspa?
a. ( ) Fraco;
b. ( ) Moderado;
c. ( ) Forte.

9. Em sua opinião, qual é a principal contribuição do curso na sua vida? (Marcar apenas uma
alternativa.)
a. ( ) A obtenção de diploma de nível superior;
b. ( ) A aquisição de cultura geral;
c. ( ) A aquisição de formação profissional;
d. ( ) A aquisição de formação teórica;
e. ( ) Melhores perspectivas de ganhos financeiros.
f. ( ) Outra. Qual? __________________________________________
MODELO DE QUESTIONÁRIO ABERTO

É um questionário que libera seus respondentes para poder responder e não determina a escolha
da resposta. A seguir, é apresentado um exemplo de questionário aberto.

1) Na sua opinião, qual é o papel do Ministério da Saúde na vida cotidiana


das pessoas?
__________________________________________________________
__________________________________________________________
__________________________________________________________
__________________________________________________________
__________________________________________________________
__________________________________________________________
__________________________________________________________

2) Na sua opinião, o Ministério da Saúde está realmente ajudou as pessoas


a lidar com a pandemia de COVID 19?
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________

3) Na sua opinião, qual é a maneira correta de lidar com a pandemia de


COVID 19?
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________

ATIVIDADE NO LABORATÓRIO DE INFORMÁTICA

1) Reproduza através da utilização do GOOGLE Forms os dois tipos de


questionários aqui apresentados.
2) Compartilhe o link para seus amigos e parentes para que possam responder.
3) Verifique as respostas e os gráficos criados automaticamente no GOOGLE
Forms.
4) Compartilhe em grupo a análise dos dados coletados nos dois formulários
propostos. (A sala será dividida em dois grupos).
Obs.: Todos farão os dois modelos de formulário, o professor da disciplina irá
escolher os dois grupos e os seus respectivos formulários. Os grupos ficarão
livres para fazer as modificações que acharem necessárias nas questões.

Você também pode gostar