Você está na página 1de 51

Noções de Probabilidade e Estatística



• Conhecimentos deestatística eprobabilidade: representação e
análisede dados; medidasdetendênciacentral (médias, modae
mediana);desviosevariância;noçõesdeprobabilidade

CONCEITOS BÁSICOS DE ESTATÍSTICA

Introdução
Todas as ciências têm suas raízes na história do homem.
Desde a Antiguidade muitos povos já faziam uso dos recursos da Estatística, através de registro de
número de óbitos, nascimentos, número de habitantes, além das estimativas das riquezas individuais e
sociais, entre muitas outras.
Na Idade Média as informações colhidas tinham como finalidade tributária e bélica.
Somente a partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais,
originando as primeiras tábuas e tabelas e os primeiros números relativos.
No século XVII o estudo de tais fatos foi adquirido, aos poucos, feição verdadeiramente científica.
Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu
objetivo e suas relações com as ciências.
A estatística não se limita somente a compilar tabelas de dados e os ilustrar graficamente. Ela é, hoje
em dia, um instrumento útil e, em alguns casos, indispensável para tomadas de decisão em diversos
campos: científico, econômico, social, político….
Todavia, antes de chegarmos à parte de interpretação para tomadas de decisão, há que proceder a
um indispensável trabalho de recolha e organização de dados, sendo a recolha feita através de
recenseamentos (ou censos ou levantamentos estatísticos) ou sondagens.
Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. No nosso cotidiano,
precisamos tomar decisões, muitas vezes decisões rápidas.
Em linhas gerais a Estatística fornece métodos que auxiliam o processo de tomada de decisão através
da análise dos dados que possuímos.
Podemos ainda dizer que a Estatística é:

É a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem
decisões.

Em resumo:

A ESTATÍSTICA é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, análise e interpretação de dados e para utilização dos mesmos na tomada de
decisões.

01
Divisão da estatística
- Estatística Descritiva: coleta, organização e descrição dos dados. Ela preocupa-se com a forma
pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as
informações contidas nestes dados mediante a utilização de medidas estatísticas.

- Estatística Indutiva ou Inferencial: análise e a interpretação desses dados. A inferência estatística


baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado
população), quando se observou apenas uma parte (amostra) representativa desta população.

Método Estatístico
Atualmente quase todo acréscimo de conhecimento resulta da observação e do estudo. A verdade é
que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos, ou seja
desenvolvemos maneiras ou métodos para tais fins.

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.

Podemos destacar dois métodos:


- Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e
variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Muito utilizado
no estudo da Física, da Química etc

- Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas
causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final,
que influências cabem a cada uma delas.

Fases do método estatístico


- Coleta de dados: após cuidadoso planejamento e a devida determinação das características
mensuráveis do fenômeno que se quer pesquisar, damos início à coleta de dados numéricos necessários
à sua descrição.

A coleta pode ser:


Direta: quando é feita sobre elementos Indireta: quando é indeferida de
informativos de registro obrigatório (nascimento, elementos conhecidos (coleta direta) e/ou de
casamentos e óbitos, importação e exportação de conhecimento de outros fenômenos
mercadorias), dados coletados pelo próprio relacionados com o fenômeno estudado.
pesquisador através de inquéritos e questionários, Exemplo: pesquisas de mortalidade infantil,
como por exemplo o censo demográfico. A coleta que é feita através de dados colhidos por
direta de dados pode ser classificada em fator do uma coleta direta (número de nascimentos
tempo: versus números de obtidos de crianças)
(i) contínua (registro) – quando feita continuamente.
(ii) periódica –quando feita em intervalos
constantes de tempo (exemplo o censo de 10 em
10 anos, etc)
(iii) ocasional – quando feita
extemporaneamente, a fim de atender uma
conjuntura ou a uma emergência (caso de
epidemias)

- Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados,
à procura de possível falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo
vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas.
A crítica é interna quando visa observar os elementos originais dos dados da coleta.

- Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios
de classificação, que pode ser manual, eletromecânica ou eletrônica.

- Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada
(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.
02
- Análise dos resultados: realizadas anteriores (Estatística Descritiva), fazemos uma análise dos
resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução
ou inferência, e tiramos desses resultados conclusões e previsões.

Mais alguns conceitos devem ser aprendidos para darmos continuidade ao nosso entendimento sobre
Estatística.

- Variáveis: conjunto de resultados possíveis de um fenômeno.


As variáveis podem ser:
1) Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor
da pele, entre outros. Dizemos que estamos qualificando.
2) Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos
alunos, etc). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome
de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto
enumerável recebe o nome de variável discreta.

- População estatística ou universo estatístico: conjunto de entes portadores de, pelo menos, uma
característica comum.
Exemplos: estudantes (os que estudam), concurseiros (os que prestam concursos), ...
Podemos ainda pesquisar uma ou mais características dos elementos de alguma população, as quais
devem ser perfeitamente definidas. É necessário existir um critério de constituição da população, válido
para qualquer pessoa, no tempo ou no espaço.

- Amostra: é um subconjunto finito de uma população.

A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados
verificados em amostras retiradas dessa população. É preciso garantir que a amostra possua as mesmas
características da população, no que diz respeito ao fenômeno que desejamos pesquisar.

Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.


Principais propriedades:
- Admite erros processual zero e tem 100% de confiabilidade;
- É caro;
- É lento;
- É quase sempre desatualizado (visto que se realizam em períodos de anos 10 em 10 anos);
- Nem sempre é viável.

Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo
de probabilidades.
Principais da Estimação:
- Admite erro processual positivo e tem confiabilidade menor que 100%.
- É barata.
- É rápida.
- É atualizada.
- É sempre viável.

Dados brutos: quando observamos ou fazemos n perguntas as quais nos dão n dados ou respostas,
obtemos uma sequência de n valores numéricos. A toda sequência denominamos dados brutos.

03
Dados brutos é uma sequência de valores numéricos não organizados, obtidos diretamente da
observação de um fenômeno coletivo.

Rol: é uma sequência ordenada dos dados brutos.


Exemplo: Um aluno obteve as seguintes notas no ano letivo em Matemática: 5,5 ; 7 ; 6,5 ; 9
Os dados brutos é a sequência descrita acima
Rol: 5,5 – 6,5 – 7 – 9 (ordenação crescente das notas).

Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999
TAVARES, Prof. Marcelo – Estatística Aplicada à Administração – Sistema Universidade Aberta do Brasil- 2007
Reis, Marcelo Menezes - Estatística aplicada à administração / Marcelo Menezes Reis. –Florianópolis: Departamento de Ciências da Administração /UFSC,
2008.
Questões

01. (Câmara Munic. Itatiba/SP – Analista de Recursos Humanos – VUNESP) Em estatística, a


técnica que nos permite fazer inferências sobre uma população, a partir da análise de uma parte dela,
denomina-se
(A) dedução.
(B) amostragem.
(C) probabilidade.
(D) descrição.
(E) extração.

02. (EBSERH – Analista Administrativo – Estatística (HE-UFSCAR) – INSTITUTO AOCP) Que


parte da estatística se preocupa apenas em descrever determinada característica da população?
(A) Regressão estatística.
(B) Estatística contínua.
(C) Estatística descritiva.
(D) Estatística amostral.
(E) Estatística inferencial.

03. (EBSERH – Médico do Trabalho – IADES) “Costuma ser encontrada com maior frequência em
jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é a
representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de simplificar
informações.” O texto faz referência à:
(A) Estatística inferencial
(B) Estatística de probabilidade
(C) Estatística por amostragem
(D) Estatística descritiva
(E) Média aritmética

04. (ANS – Ativ. Téc. de Complexidade Intelectual - Administração – FUNCAB) A estatística


descritiva:
(A) permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza;
estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir da amostra.
(B) é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e
interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
(C) é a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela
disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes.
(D) é a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever
os fenômenos aleatórios ou seja, aqueles em que está presente a incerteza.
(E) é a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que
possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a
partir da amostra.

04
Respostas

01. Resposta: B.

02. Resposta: C.

03. Resposta: D.

04. Resposta: C.

AMOSTRAGEM

Amostragem é um técnica especial para recolher amostras, que garante, tanto quanto possível, o
acaso na escolha.

Probabilística (aleatória): A probabilidade de um elemento da população ser escolhido é conhecida.


Cada elemento da população passa a ter a mesma chance de ser escolhido.
Não-probabilística (não aleatória): Não se conhece a probabilidade de um elemento ser escolhido
para participar da amostra.

No quadro abaixo está descrita os métodos de amostragem:

AMOSTRAGEM PROBABILÍSTICA

Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico.
Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um
dispositivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra.
Exemplo: 15% dos alunos de uma população de notas entre 8 e 10, serão sorteados para receber uma
bolsa de estudos de inglês.

Vantagens Desvantagens
- Facilidade de cálculo estatístico; - Requer listagem da população;
- Probabilidade elevada de compatibilidade - Trabalhosa em populações elevadas;
dos dados da amostra e da população. - Custos elevados se a dispersão da amostra
for elevada.

Amostragem sistemática: escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória


simples, porque inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a
seleção da amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se
acham ordenados, não havendo necessidade de construir um sistema de referência.

05
Exemplo: Amostra de 15% dos alunos com déficit de atenção diagnosticado. Sorteia-se um valor de 1
a 5. Se o sorteado for o 2, incluem-se na amostra o aluno 2, o 7, o 12 e assim por diante de cinco em
cinco.

Amostragem proporcional estratificada: muitas vezes a população se divide em subpopulações –


estratos, então classificamos a população em, ao menos dois estratos, e extraímos uma amostra de cada
um. Podemos determinar características como sexo, cor da pele, faixa etária, entre outros.
Exemplo: Supondo que dos noventa alunos de uma escola, 54 sejam meninos e 36 sejam meninas
vamos obter a amostra proporcional estratificada de 10% desta população.
Temos dois estratos: sexo masculino e feminino.

Sexo População 10% Amostra


10𝑥54
M 54 = 5,4 5
100
10𝑥36
F 36 = 3,6 4
100
10𝑥90
Total 90 = 9,0 9
100

Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem aos meninos e de 55 a 90, as


meninas.
Para amostragem muito grande também fazemos o uso da Tabela de Números Aleatórios, elaborada
a fim de facilitar os cálculos, que foi construída de modo que os dez algarismos (0 a 9) são distribuídos
ao acaso nas linhas e colunas, conforme pode ser visto abaixo:

Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da


mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa
necessidade. Os números obtidos irão indicar os elementos da amostra.
No nosso exemplo vamos definir como critérios a primeira e a segunda colunas da esquerda, de cima
para baixo (constituídos de 2 algarismos), obtermos os seguintes números.

06
A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice versa), verticalmente
(de cima para baixo ou vice versa), diagonalmente (no sentido ascendente ou descendente), formando
desenho de alguma letra e até mesmo escolhendo uma única linha ou coluna. O critério adotado deve ser
definido antes do início do processo.

57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Eliminamos os números maiores que 90 e os números repetidos.

Assim temos:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas.

Vantagens Desvantagens
- Pressupõe um erro de amostragem menor; - Necessita de maior informação sobre a
- Assegura uma boa representatividade das população;
variáveis estratificadas; - Cálculo estatístico mais complexo.
- Podem empregar-se metodologias diferentes
para cada estrato;
- Fácil organização do trabalho de campo.

Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos


(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.
Exemplo:

O mapa mostra os conglomerados selecionados (neste caso os municípios), que apresentaram a maior
proporção de casos de dengue confirmados no Estado de São Paulo até março de 2015.

Vantagens Desvantagens
- Não existem listagem de toda a população; - Maior erro de amostragem;
- Concentra os trabalhos de campo num - Cálculo estatístico mais complexo na
número limitado de elementos da população. estimação do erro de amostragem.

AMOSTRAGEM NÃO-PROBABILÍSTICA

Amostragem por cotas: consiste em uma amostragem por julgamento que ocorre em suas etapas.
Em um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir,
selecionam-se os elementos da amostra com base em um julgamento.

07
Amostragem por julgamento: quando o pesquisador seleciona os elementos mais representativos
da amostra de acordo com seu julgamento pessoal. Essa amostragem é ideal quando o tamanho da
população é pequeno e suas características, bem conhecidas.

Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de
entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra
consecutiva.
Exemplo: Em uma pesquisa sobre dengue, arrolar os 200 pacientes que receberam diagnostico em
um hospital.

Vantagens Desvantagens
- Mais econômica; - Maior erro de amostragem que em amostras
- Fácil administração; aleatórias;
- Não necessita de listagem da população. - Não existem metodologias válidas para o
cálculo do erro de amostragem;
- Limitação representativa;
- Maior dificuldade de controle de trabalho de
campo

Tamanho da Amostra
O tamanho da amostra deve ser determinado antes de se iniciar a pesquisa.
Deve-se usar a maior amostra possível, pois quanto maior a amostra, maior a representatividade da
população. Amostras menores possuem resultados menos precisos.
É muito importante usarmos amostras de tamanhos adequados, para que os dados tenham maior
confiabilidade e precisão.
Consideramos:

Amostras grandes: n > 100


Amostras médias: n > 30
Amostras pequenas: n < 30
Amostras muito pequenas: n < 12

Erros de amostragem
Diferença randômica(aleatória) entre a amostra e população da qual a amostra foi retirada. O tamanho
do erro pode ser medido em amostras probabilísticas, expressa como “erro padrão” (ou precisão) de
média, proporção entre outros.
Erro padrão da média: é usado para estimar o desvio padrão da distribuição das médias amostrais,
tanto para populações finitas ou infinitas (será abordado em medidas de dispersão).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2004.
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999.
DORA, Filho U – Introdução à Bioestatística para simples mortais – São Paulo – Elsevier: 1999.
http://www.andremachado.org

Questões

01. (TRT/MG – Analista Judiciário – FCC) O objetivo de uma pesquisa era o de se obter, relativamente
aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para
cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e,
dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a
renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram,
respectivamente,
(A) censo e amostragem por conglomerados.
(B) amostragem aleatória e amostragem sistemática.
(C) censo e amostragem casual simples.
(D) amostragem estratificada e amostragem sistemática.
(E) amostragem sistemática e amostragem em dois estágios.

08
02. (EPE – Analista de Pesquisa Energética – CESGRANRIO) Considere um planejamento amostral
para uma população de interesse no qual é feita uma divisão dessa população em grupos idênticos à
população alvo, como uma espécie de microcosmos da população, e, em seguida, seleciona-se
aleatoriamente um dos grupos e retira-se a amostra do grupo selecionado.
A técnica de amostragem descrita acima é definida como:
(A) amostragem aleatória simples
(B) amostragem por conglomerados
(C) amostragem estratificada
(D) amostragem sistemática
(E) amostragem por cotas

03. (MTur – Estatístico – ESAF) Com relação à amostragem, pode-se afirmar que:
(A) na amostragem por quotas, tem-se uma amostra não probabilística na qual divide-se a população
em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos
individuais obedece o critério de uma amostra sistemática.
(B) na amostragem estratificada, divide-se a população em grupos (ou classes, ou estratos), de modo
que os elementos pertencentes ao mesmo estrato sejam o mais heterogêneos possível com respeito à
característica em estudo. Para cada grupo toma-se uma subamostra pelo procedimento a.a.s., e a amostra
global é o resultado da combinação das subamostras de todos os estratos
(C) na amostragem por conglomerados, seleciona-se primeiro, ao acaso, grupos (conglomerados) de
elementos individuais da população. A seguir, toma-se ou todos os elementos ou uma subamostra de
cada conglomerado. Nos conglomerados, as diferenças entre eles devem ser tão grandes quanto
possível, enquanto as diferenças dentro devem ser tão pequenas quanto possível.
(D) na amostragem por quotas, tem-se uma amostra probabilística na qual divide-se a população em
subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais
é por sorteio.
(E) na amostragem sistemática, toma-se cada k-ésima unidade da população previamente ordenada,
em que k é a razão de amostragem. O procedimento deve começar ao acaso, sorteando-se um número
entre 1 e k.

04. (TJ-ES – Analista Jurídico – CESPE) No que concerne aos planos amostrais, julgue os itens a
seguir.

Tanto na amostragem estratificada quanto na amostragem por conglomerados, a população é dividida


em grupos. Na amostragem por conglomerados, de cada grupo seleciona-se um conjunto de elementos;
na amostragem estratificada, devem-se selecionar quais estratos serão amostrados e, desses, observar
todos os elementos.
( ) Certo ( ) Errado

Respostas

01. Resposta: C.
Vide a definição apresentada em nosso material.

02. Resposta: B.
Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos
(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.

03. Resposta: E.
Escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque
inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da
amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham
ordenados, não havendo necessidade de construir um sistema de referência.

04. Resposta: Errado.


As definições de amostragem estratificada e por conglomerados estão invertidas.

09
MÉDIA ARITMÉTICA

Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e efetue uma certa operação com todos os
elementos de A.
Se for possível substituir cada um dos elementos do conjunto A por um número x de modo que o
resultado da operação citada seja o mesmo diz – se, por definição, que x será a média dos elementos de
A relativa a essa operação.

Média Aritmética Simples16

A média dos elementos do conjunto numérico A relativa à adição é chamada média aritmética.

Cálculo da média aritmética


Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn}, então, por
definição:

A média aritmética(x) dos n elementos do conjunto numérico A é a soma de todos os seus


elementos, dividida pelo número de elementos n.
Exemplos:
1) Calcular a média aritmética entre os números 3, 4, 6, 9, e 13.
Se x for a média aritmética dos elementos do conjunto (3, 4, 6, 9, 13), então x será a soma dos 5
elementos, dividida por 5. Assim:
3+4+6+9+13 35
𝑥= ↔ 𝑥= ↔ 𝑥 =7
5 5

A média aritmética é 7.

2) Os gastos (em reais) de 15 turistas em Porto Seguro estão indicados a seguir:


65 – 80 – 45 – 40 – 65 – 80 – 85 – 90
75 – 75 – 70 – 75 – 75 – 90 – 65

Se somarmos todos os valores teremos:


65 + 80 + 45 + 40 + 65+, , , +90 + 65 1075
𝑥= = = 71,70
15 15

Assim podemos concluir que o gasto médio do grupo de turistas foi de R$ 71,70.

Questões

01. (Câmara Municipal de São José dos Campos/SP – Analista Técnico Legislativo – Designer
Gráfico – VUNESP) Na festa de seu aniversário em 2014, todos os sete filhos de João estavam presentes.
A idade de João nessa ocasião representava 2 vezes a média aritmética da idade de seus filhos, e a razão
entre a soma das idades deles e a idade de João valia
(A) 1,5.
(B) 2,0.
(C) 2,5.
(D) 3,0.
(E) 3,5.

02. (TJ/SC - Técnico Judiciário - Auxiliar TJ-SC) Os censos populacionais produzem informações
que permitem conhecer a distribuição territorial e as principais características das pessoas e dos
16
IEZZI, Gelson – Matemática – Volume Único
10
domicílios, acompanhar sua evolução ao longo do tempo, e planejar adequadamente o uso sustentável
dos recursos, sendo imprescindíveis para a definição de políticas públicas e a tomada de decisões de
investimento. Constituem a única fonte de referência sobre a situação de vida da população nos
municípios e em seus recortes internos – distritos, bairros e localidades, rurais ou urbanos – cujas
realidades socioeconômicas dependem dos resultados censitários para serem conhecidas.
http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm
(Acesso dia29/08/2011)
Um dos resultados possíveis de se conhecer, é a distribuição entre homens e mulheres no território
brasileiro. A seguir parte da pirâmide etária da população brasileira disponibilizada pelo IBGE.

http://www.ibge.gov.br/censo2010/piramide_etaria/index.php
(Acesso dia29/08/2011)
O quadro abaixo, mostra a distribuição da quantidade de homens e mulheres, por faixa etária de uma
determinada cidade. (Dados aproximados)
Considerando somente a população masculina dos 20 aos 44 anos e com base no quadro abaixo a
frequência relativa, dos homens, da classe [30, 34] é:

(A) 64%.
(B) 35%.
(C) 25%.
(D) 29%.
(E) 30%.

03. (EsSA - Sargento - Conhecimentos Gerais - Todas as Áreas – EB) Em uma turma a média
aritmética das notas é 7,5. Sabe-se que a média aritmética das notas das mulheres é 8 e das notas dos
homens é 6. Se o número de mulheres excede o de homens em 8, pode-se afirmar que o número total de
alunos da turma é
(A) 4.
(B) 8.
(C) 12.
(D) 16.
(E) 20.

04. (SAP/SP - Oficial Administrativo – VUNESP) A altura média, em metros, dos cinco ocupantes de
um carro era y. Quando dois deles, cujas alturas somavam 3,45 m, saíram do carro, a altura média dos
que permaneceram passou a ser 1,8 m que, em relação à média original y, é
(A) 3 cm maior.
(B) 2 cm maior.
(C) igual.
(D) 2 cm menor.
(E) 3 cm menor.

05. (PC/SP – Oficial Administrativo – VUNESP) Em uma empresa com 5 funcionários, a soma dos
dois menores salários é R$ 4.000,00, e a soma dos três maiores salários é R$ 12.000,00. Excluindo-se o

11
menor e o maior desses cinco salários, a média dos 3 restantes é R$ 3.000,00, podendo-se concluir que
a média aritmética entre o menor e o maior desses salários é igual a
(A) R$ 3.500,00.
(B) R$ 3.400,00.
(C) R$ 3.050,00.
(D) R$ 2.800,00.
(E) R$ 2.500,00.

Comentários

01. Alternativa: E.
Foi dado que: J = 2.M
𝑎+𝑏+⋯+𝑔
𝐽= = 2. 𝑀 (I)
7

Foi pedido: 𝑎+𝑏+⋯+𝑔 = ?


𝐽

Na equação ( I ), temos que:

7 = 𝑎+𝑏+⋯+𝑔
𝐽
7 𝑎+𝑏+⋯+𝑔
=
2 𝑀
𝑎+𝑏+⋯+𝑔
= 3,5
𝑀
02. Alternativa: E.
[30, 34] = 600, somatória de todos os homens é: 300+400+600+500+200= 2000
600 600
= = 0,3 . (100) = 30%
300+400+600+500+200 2000

03. Alternativa: D.
Do enunciado temos m = h + 8 (sendo m = mulheres e h = homens).

𝑆
A média da turma é 7,5, sendo S a soma das notas: = 7,5 → 𝑆 = 7,5(𝑚 + ℎ)
𝑚+ℎ

A média das mulheres é 8, sendo S1 a soma das notas: 𝑆1 = 8 → 𝑆 = 8𝑚


𝑆2𝑚 1
A média dos homens é 6, sendo S2 a soma das notas: =6→𝑆
2
= 6ℎ

Somando as notas dos homens e das mulheres:


S1 + S2 = S
8m + 6h = 7,5(m + h)
8m + 6h = 7,5m + 7,5h
8m – 7,5m = 7,5h – 6h
0,5m =1,5h
𝑚 1,0,55ℎ
=
𝑚 =3ℎ
h + 8 = 3h
8 = 3h – h
8 = 2h → h = 4
m = 4 + 8 = 12
Total de alunos = 12 + 4 = 16

12
04. Alternativa: A.
Sendo S a soma das alturas e y a média, temos:
𝑆
= 𝑦 → S = 5y
5

𝑆−3,45
= 1,8 → S – 3,45 = 1,8.3
3
S – 3,45 = 5,4
S = 5,4 + 3,45
S = 8,85, então:
5y = 8,85
y = 8,85 : 5 = 1,77
1,80 – 1,77 = 0,03 m = 3 cm a mais.

05. Alternativa: A.
x1 + x2 + x3 + x4 + x5
x1 + x2 = 4000
x3 + x4 + x5 = 12000

𝑥2+ 𝑥3 +𝑥4 3
= 3000
x2 + x3 + x4 = 9000
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 4000 + 12000 = 16000

Sendo 𝑥1 𝑒 𝑥5 o menor e o maior salário, respectivamente:


𝑥1 + 9000 + 𝑥5 = 16000

𝑥1 + 𝑥5 = 16000 − 9000 = 7000

Então, a média aritmética:


𝑥1 + 𝑥2 7000
= = 3500
2 2
Média Aritmética Ponderada

A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um
“determinado peso” é chamada média aritmética ponderada17.

Cálculo da média aritmética ponderada


Se x for a média aritmética ponderada dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn} com
“pesos” P1; P2; P3; ...; Pn, respectivamente, então, por definição:

P1 . x + P2 . x + P3 . x + ... + Pn . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn ↔ (P1 + P2 + P3 + ... + Pn) . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn e, portanto,

𝑥 1 ; 𝑥2 ; 𝑥3 ; …; 𝑥𝑛
Observe que se P1 = P2 = P3 = ... = Pn = 1, então 𝑥 = : que é a média aritmética simples.
𝑛

A média aritmética ponderada dos n elementos do conjunto numérico A é a soma dos produtos
de cada elemento multiplicado pelo respectivo peso, dividida pela soma dos pesos.

17
IEZZI, Gelson – Matemática – Volume Único

13
Exemplos:
1) Calcular a média aritmética ponderada dos números 35, 20 e 10 com pesos 2, 3, e 5,
respectivamente.

Se x for a média aritmética ponderada, então:


2 .35 + 3 .20 + 5 .10 70 + 60 + 50 180

𝑥= ↔ 𝑥= ↔ 𝑥= ↔ 𝑥 = 18
2+3+5 10 10

A média aritmética ponderada é 18.

2) Em um dia de pesca nos rios do pantanal, uma equipe de pescadores anotou a quantidade de peixes
capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado em Campo Grande.

Tipo de peixe Quilo de peixe pescado Preço por quilo


Peixe A 18 R$ 3,00
Peixe B 10 R$ 5,00
Peixe C 6 R$ 9,00

Vamos determinar o preço médio do quilograma do peixe vendido pelos pescadores ao supermercado.
Considerando que a variável em estudo é o preço do quilo do peixe e fazendo a leitura da tabela,
concluímos que foram pescados 18 kg de peixe ao valor unitário de R$ 3,00, 10 kg de peixe ao valor
unitário de R$ 5,00 e 6 kg de peixe ao valor de R$ 9,00.
Vamos chamar o preço médio de p:
18𝑥3,00 + 10𝑥5,00 + 6𝑥9,00 54 + 50 + 54
𝑝= = = 158 = 4,65 𝑟𝑒𝑎𝑖𝑠
18 + 10 + 6 34 34

Neste caso o fator de ponderação foi a quantidade de peixes capturadas de cada espécie.

A palavra média, sem especificações (aritmética ou ponderada), deve ser entendida como média
aritmética.

Questões

01. (EPCAR – Cadete – EPCAR) Um líquido L1 de densidade 800 g/l será misturado a um líquido L2
de densidade 900 g/l Tal mistura será homogênea e terá a proporção de 3 partes de L1 para cada 5 partes
de L2 A densidade da mistura final, em g/l, será
(A) 861,5.
(B) 862.
(C) 862,5.
(D) 863.

02. (TJM-SP – Oficial de Justiça – VUNESP) Ao encerrar o movimento diário, um atacadista, que
vende à vista e a prazo, montou uma tabela relacionando a porcentagem do seu faturamento no dia com
o respectivo prazo, em dias, para que o pagamento seja efetuado.

PORCENTUAL DO PRAZO PARA


FATURAMENTO PAGAMENTO (DIAS)
15% À vista
20% 30
35% 60
20% 90
10% 120

O prazo médio, em dias, para pagamento das vendas efetuadas nesse dia, é igual a
(A) 75.
(B) 67.
(C) 60.
14
(D) 57.
(E) 55.

03. (SEDUC/RJ - Professor – Matemática – CEPERJ) Uma loja de roupas de malha vende camisetas
com malha de três qualidades. Cada camiseta de malha comum custa R$15,00, de malha superior custa
R$24,00 e de malha especial custa R$30,00. Certo mês, a loja vendeu 180 camisetas de malha comum,
150 de malha superior e 70 de malha especial. O preço médio, em reais, da venda de uma camiseta foi
de:
(A) 20.
(B) 20,5.
(C) 21.
(D) 21,5.
(E) 11.

04. (CÂMARA MUNICIPAL DE SÃO JOSÉ DO RIO PRETO/SP – Programador de Computador –


FIP) A média semestral de um curso é dada pela média ponderada de três provas com peso igual a 1
na primeira prova, peso 2 na segunda prova e peso 3 na terceira. Qual a média de um aluno que tirou
8,0 na primeira, 6,5 na segunda e 9,0 na terceira?
(A) 7,0
(B) 8,0
(C) 7,8
(D) 8,4
(E) 7,2

05. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática


– FUNCAB) A tabela abaixo mostra os valores mensais do Imposto Predial e Territorial Urbano (IPTU)
pagos pelos apartamentos de um condomínio. Determine a média aritmética desses valores.

Número de Apartamentos Valor de IPTU Pago


5 R$ 180,00
5 R$ 200,00
10 R$ 220,00
10 R$ 240,00
4 R$ 300,00
6 R$ 400,00

(A) R$ 248,50
(B) R$ 252,50
(C) R$ 255,50
(D) R$ 205,50
(E) R$ 202,50

06. (SAP/SP - AGENTE DE SEGURANÇA PENITENCIÁRIA DE CLASSE I – VUNESP) Em uma


seção de uma empresa com 20 funcionários, a distribuição dos salários mensais, segundo os cargos
que ocupam, é a seguinte:

Sabendo-se que o salário médio desses funcionários é de R$ 1.490,00, pode-se concluir que o salário
de cada um dos dois gerentes é de
(A) R$ 2.900,00.
(B) R$ 4.200,00.
(C) R$ 2.100,00.
(D) R$ 1.900,00.
(E) R$ 3.400,00.

15
07. (UFPE - Assistente em Administração – COVEST) Em um concurso existem provas de
Português, Matemática, Informática e Conhecimentos Específicos, com pesos respectivos 2, 3, 1 e 4. Um
candidato obteve as seguintes notas nas provas de Português, Matemática e Informática:

Disciplina Nota
Português 77
Matemática 62
Informática 72

Se a nota do candidato no concurso foi 80, qual foi a sua nota na prova de Conhecimentos Específicos?
(A) 95
(B) 96
(C) 97
(D) 98
(E) 99

08. (VUNESP – FUNDUNESP – Assistente Administrativo) Um concurso teve duas fases, e, em


cada uma delas, os candidatos foram avaliados com notas que variaram de zero a dez. Para efeito de
classificação, foram consideradas as médias ponderadas de cada candidato, uma vez que os pesos da
1.ª e da 2.ª fases foram 2 e 3, respectivamente. Se um candidato tirou 8 na 1.ª fase e 5 na 2.ª, então é
verdade que sua média ponderada foi
(A) 6,2.
(B) 6,5.
(C) 6,8.
(D) 7,1.
(E) 7,4.

09. (SAAE/SP - Fiscal Leiturista – VUNESP) A tabela mostra os valores de algumas latinhas de
bebidas vendidas em um clube e a quantidade consumida por uma família, em certo dia.

Bebidas (latinha) Valor unitário Quantidade Consumida


Refrigerante R$ 4,00 8
Suco R$ 5,00 6
Cerveja X 4

Considerando-se o número total de latinhas consumidas por essa família nesse dia, na média, o preço
de uma latinha saiu por R$ 5,00. Então, o preço de uma latinha de cerveja era
(A) R$ 5,00.
(B) R$ 5,50.
(C) R$ 6,00.
(D) R$ 6,50.
(E) R$ 7,00.

10. (Instituto de Pesquisas Tecnológicas – Secretária – VUNESP) Em um edifício residencial, 14


unidades pagam uma taxa mensal de condomínio no valor de 930 reais. Para as 28 unidades restantes,
que são menores, a taxa mensal de condomínio também é menor. Sabendo-se que o valor médio da taxa
mensal de condomínio, nesse edifício, é de 750 reais, é correto afirmar que o valor em reais que cada
unidade menor paga mensalmente de condomínio é igual a
(A) 600.
(B) 620.
(C) 660.
(D) 700.
(E) 710.

Comentários

01. Alternativa: C.
3.800+5.900 2400+4500 6900
= = = 862,5
3+5 8 8

16
02. Alternativa: D.
Média aritmética ponderada: multiplicamos o porcentual pelo prazo e dividimos pela soma dos
porcentuais.
15.0+20.30+35.60+20.90+10.120
=
15+20+35+20+10

= 600+2100+1800+1200=
100

= 5700 = 57
100

03. Alternativa: C.
Também média aritmética ponderada.
180.15+150.24+70.30
=
180+150+70

= 2700+3600+2100 =
400

= 8400 = 21
400

04. Alternativa: B.
Na média ponderada multiplicamos o peso da prova pela sua nota e dividimos pela soma de todos os
pesos, assim temos:
8.1 + 6,5.2 + 9.3 8 + 13 + 27 48
𝑀 = = = 8,0
1+2+3 6 6
𝑃
=

05. Alternativa: B.
5.180 + 5.200 + 10.220 + 10. 240 + 4.300 + 6.400 10100
𝑀= = = 252,50
5 + 5 + 10 + 10 + 4 + 6 40

06. Alternativa: C.
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200

𝑀é𝑑𝑖𝑎 =
20
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
1490 =
20

2𝑥 + 13600 + 12000 = 29800


2𝑥 = 4200
𝑥 = 2100
Cada um dos gerentes recebem R$ 2100,00

07. Alternativa: C.

2.77 + 3.62 + 1.72 + 4. = 80


2+3+1+4
412 + 4. 𝑥
= 80
10
4x + 412 = 80 . 10
4x = 800 – 412
x = 388 / 4
x = 97
17
08. Alternativa: A.
2.8 + 3.5 16 + 15 31
𝑀 = = = 6,2
2 +3 5 5
𝑝
=

09. Alternativa: E.
8.4 + 6.5 + 4. 𝑥
=5
8+6+4
62 + 4. 𝑥
=5
18
4.x = 90 – 62
x = 28 / 4
x = R$ 7,00

10. Resposta: C.
𝟏𝟒.𝟗𝟑𝟎 + 𝟐𝟖.𝒙 = 𝟕𝟓𝟎
𝟏𝟒 + 2𝟖
𝟏𝟑𝟎𝟐𝟎 + 𝟐𝟖 . 𝒙

𝟒𝟐 = 𝟕𝟓𝟎

13020 + 28.x = 42 . 750


28.x = 31500 – 13020
x = 18480 / 28
x = R$ 660,00

MEDIANA E MODA

A moda e a mediana são utilizados para resumirem um conjunto de valores dado uma série estatística.
Vamos ver os conceitos de cada uma delas:
A mediana, é uma medida de localização do centro da distribuição dos dados.
A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está
na “moda”.

Exemplo:
Em um time de futebol temos as seguintes altura dos atletas:

(Fonte: http://geniodamatematica.com.br)

Ache o valor da mediana e da moda.


18
Resolução:
Primeiramente precisamos colocar os dados de forma ordenada, ou seja, montar o rol:

Altura Frequência
1,48 1
1,52 1
1,60 1
1,61 1
1,62 1
1,64 1
1,66 3
1,68 1
1,69 1

Para acharmos a mediana precisamos ver se a quantidade de valores, se for ímpar a mediana é o
valor que ocupa a posição central, se for par a mediana corresponde à média aritmética dos dois
valores centrais.
No nosso caso temos que é ímpar:

Altura Frequência
1º 1,48 1
2º 1,52 1
3º 1,60 1
4º 1,61 1
5º 1,62 1
6º 1,64 1
7º 1,66 3
8º 1,68 1
9º 1,69 1

Então a mediana é o valor que está na 5ª linha: 1,62


E a moda é 1,66, que é o valor que aparece com maior frequência.

Questões

01. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática


– FUNCAB) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12).
(A) 8,5
(B) 9
(C) 10,5
(D) 11,5
(E) 10

02. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.
Países IDH
Argentina 0,811
Bolívia 0,645
Brasil 0,730
Chile 0,819
Colômbia 0,719
Cuba 0,780
México 0,775
Uruguai 0,792
Venezuela 0,758

Disponível em: <http://www.abinee.org.br/abinee/decon/decon55a.htm>. Acesso em: 24 fev. 2014. (Adaptado).

19
Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela

03. (Polícia Militar/SP – Aluno – Oficial – VUNESP) Na tabela, as letras q, p e m substituem as


alturas, relacionadas em ordem crescente, de seis alunos do Curso de Formação de Oficiais da Polícia
Militar avaliados em um exame biométrico, sendo que, nessa tabela, letras iguais correspondem a alturas
iguais.
Nome Altura (em centímetros)
Gonçalves q
Camargo q
Pacheco q
Mendes p
Santos m
Ferreira m

Sabendo-se que a moda, a mediana e a média aritmética das alturas desses alunos são,
respectivamente, 173 cm, 174,5 cm e 175,5 cm, pode-se concluir que a altura do aluno Ferreira é igual,
em centímetros, a
(A) 177.
(B) 178.
(C) 179.
(D) 180.
(E) 182.

(SEFAZ/RJ – ANALISTA DE CONTROLE INTERNO – CEPERJ) Observe os números relacionados


a seguir, e responda às questões de números 04 e 05.

4 7 3
9 6 8
8 7 8

04. A mediana desses valores vale:


(A) 6
(B) 6,5
(C) 7
(D) 7,5
(E) 8

05. A moda desses valores vale:


(A) 8
(B) 7
(C) 6
(D) 5
(E) 4

Comentários

01. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12
Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
10 +11 21
𝑀= = = 10,5
2 2
20
02. Resposta: C.
Vamos colocar os números em ordem crescente:
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).

03. Resposta: C.
* Se a moda é 173 cm, então q = 173 cm (Gonçalves, Camargo e Pacheco).
* Se a mediana é 174,5 cm, então (q + p) / 2 = 174,5.
q + p = 174,5 . 2
q + p = 349 cm
* Se a média aritmética é 175,5 cm, então:
3. 𝑞 + 𝑝 + 2. 𝑚
𝑀= = 17
6
2. 𝑞 + 𝑞 + 𝑝 + 2.
= 175,5
6

2.173 + 349 + 2.m = 175,5 . 6


346 + 349 + 2.m = 1053
2.m = 1053 – 695
m = 358 / 2
m = 179 cm

04. Resposta: C.
Colocando em ordem crescente:
3; 4; 6; 7; 7; 8; 8; 8; 9
São 9 elementos, então a mediana é o quinto elemento(9+1/2)
Mediana 7

05. Resposta: A.
Moda é o elemento que aparece com mais frequência: 8

DISTRIBUIÇÃO DE FREQUÊNCIA

Usamos a distribuição de frequência18 para organizarmos os dados estatísticos resultantes de variáveis


quantitativas (as que usam os números para expressar-se) e fazemos a tabulação dos dados, ou seja, a
colocação dos dados de forma ordenada em uma tabela, para assim melhor interpreta-los.

Distribuição de frequência sem intervalo de classe

Quando temos variáveis discretas (possuem número finito de valores entre quaisquer dois valores) a
sua variação é relativamente pequena, cada valor pode ser tomado como um intervalo de classe.
Exemplo:
Uma professora organizou as notas que seus 25 alunos obtiveram em uma de suas provas, da seguinte
forma:

Observe que ela já ordenou os dados brutos (rol) o que ajuda a fazermos a tabulação dos dados.
Tabulando teremos:

18
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002

21
O número de vezes que um dado aparece é chamado de FREQUÊNCIA ABSOLUTA representado
por f ou fi (varia de acordo com a bibliografia estudada). Também podemos representar a frequência em
forma de porcentagem, a esta damos o nome de FREQUÊNCIA RELATIVA (fr). Ela é o quociente entre
a frequência absoluta e o número de elementos da população total.

Podemos ainda através desta tabulação encontrar a FREQUÊNCIA ABSOLUTA ACUMULADA (fa,
Fa ou Fi), na qual é a soma da frequência absoluta com a do anterior.

Observe que a última linha da Frequência Absoluta Acumulada é SEMPRE IGUAL ao somatório total
dos dados. Temos ainda a FREQUÊNCIA RELATIVA ACUMULADA (fra), que é a razão entre a
frequência absoluta acumulada e a frequência absoluta acumulada total de dados, é a forma percentual
de representarmos esses dados.

22
O exemplo acima mostra a distribuição de frequência para dados não agrupados. Quando trabalhamos
com uma quantidade grande de dados, a melhor forma é agrupa-los, afim de ganharmos simplicidade,
mesmo que perdemos os pormenores.

Nota:
Muitas bibliografias tendem a definir os termos de seus elementos estatísticos de formas variadas,
dando nome aos seus elementos de formas diferentes. Porém devemos levar em consideração o princípio
de cada um, o seu uso e relevância dentro do tratamento dos dados.
Colocamos aqui algumas dessas definições para o mesmo elemento para que você possa estar
contextualizado sobre o assunto.

Distribuição de frequência para dados agrupados

Para melhor entendimento vamos acompanhar um exemplo e assim destacaremos os elementos


desse tipo de distribuição e os meios de montarmos sua tabela.

Exemplo:
Uma pesquisa feita com 40 alunos de uma escola C, revelou os seguintes dados sobre a estatura de
seus alunos (estaturas dadas em cm):

Observe que os dados não estão ordenados, então devemos organiza-los para assim conseguirmos
analisarmos, montando assim o nosso Rol:

Com isso já fica evidente qual a menor (150 cm) e a maior (173 cm) estatura deste grupo de alunos, e
sua concentração está entre 160 e 165 cm.

Se montássemos uma tabela semelhante a do exemplo anterior, exigiria muito espaço, mesmo a nossa
amostra tendo uma quantidade de valores razoável (40 alunos). Então convém agruparmos esses valores
em vários intervalos. Com isso teremos a seguinte tabela de distribuição de frequência com intervalo de
classes.
ESTATURADOS 40 ALUNOS
DA ESCOLAC

23
Para montarmos uma tabela com tal agrupamento, precisamos saber algumas definições:

- Classes de frequência ou classes: são intervalos de variação da variável. Elas são simbolicamente
representadas por i, sendo i = 1,2,3, ..., k (onde k é o número total de classes da distribuição).
Por exemplo o intervalo 158 ├- 162 define a 3ª classe (i = 3), de um total de 6 classes, k = 6.

Depois aplicamos a fórmula de Sturges (regra do Logaritmo) dada por:

Aplicando no nosso exemplo temos: k = 1 + 3,3 .log 40 → k = 1 + 3,3 .1,60 → k = 1 + 5,28 → k = 6,28,
arredondando temos k = 6.

Dica

Já sabemos que vamos precisar de 6 classes para agruparmos nossos dados. Agora precisamos
descobrir quantos dados vamos agrupar juntos, ou seja, qual o tamanho ou amplitude do nosso intervalo,
para isso precisaremos de mais algumas informações.

- Amplitude amostral ou total (AA): diferença entre o valor máximo e o valor mínimo da amostra.
AA = x (máx.) – x (min.)

Sabemos que o menor valor da nossa amostra é 150 e o maior 173, aplicando teremos:
AA = 173 – 150 = 23 cm

- Amplitude das classes (h): é a divisão entre a amplitude total e o número de classes. O valor desta
divisão só poderá ser arredondado para mais.
𝑨𝑨
𝒉=
𝒌

24
Para nosso exemplo temos: 23
𝐴 → ℎ= = 3,83 ≅ 4
𝐴 6
ℎ=
𝑘

Assim agruparemos os dados de 4 em 4: 150 ao 154; 154 ao 158, ..., 170 ao 174, completando nossas
6 classes. Lembrando que como utilizamos o símbolo “├- “não estamos considerando o valor final, por
isso o repetimos no intervalo seguinte.
Com isso, conseguimos chegar a nossa tabela inicial.

Tome Nota: Podemos chamar a amplitude de classes também como Amplitude de um intervalo de
classe ou intervalo de classe (hi) que é a medida do intervalo que define a classe. Obtemos ela através
da diferença do limite superior e inferior de cada classe. Uma vez que conhecemos e temos os intervalos
podemos encontra-la facilmente.
hi = Li – li

Outras informações são importantes e relevantes ao nosso estudo, como meio de chegarmos a outras
análises. Vejamos:

- Limite de classe: são os extremos de cada classe. O menor chamamos de limite inferior da classe
(li) e o maior, o limite superior da classe (Li).
Tomando como exemplo a 3ª classe, temos:
l3 = 158 e L3 = 162

Fique por dentro!

O símbolo ├- , indica uma inclusão do valor de li (limite inferior) e exclusão do valor de Li (limite
superior).
O símbolo ├-┤, indica uma inclusão tanto do valor de li (limite inferior) como do valor de Li (limite
superior). O símbolo -┤, , indica uma exclusão do valor de li (limite inferior) e inclusão do valor de

- Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe e o limite
inferior da última classe.
AT = L (máx.) – l (mín.)

Em nosso caso temos: AT = 174 – 150 = 24 cm

Observação: A amplitude total da distribuição (AT) JAMAIS coincide com a amplitude amostral (AA).

- Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes iguais.
É o valor que a representa. Para sua obtenção calculamos a média aritmética entre os limites da classe
(superior e inferior).
𝒍𝒊 + 𝑳𝒊
𝒙𝒊 =
𝟐
Exemplo:
O ponto médio da 4ª classe é:

𝑙4 + 𝐿4
𝑥= 162 + 166 →𝑥 328 →𝑥 = 164 𝑐𝑚
→𝑥 = =
4 2 4 2 4 2 4

Questões
01. (ESA – Combatente/Logística – EXÉRCITO BRASILEIRO) Identifique a alternativa que apresenta
a frequência absoluta (fi) de um elemento (xi) cuja frequência relativa (fr) é igual a 25 % e cujo total de
elementos (N) da amostra é igual a 72.
(A) 18.
(B) 36.
(C) 9.
(D) 54.
(E) 45.
25
02. (BNDES – Técnico Administrativo – CESGRANRIO) Em uma faculdade, uma amostra de 120
alunos foi coletada, tendo-se verificado a idade e o sexo desses alunos. Na amostra, apurou-se que 45
estão na faixa de 16 a 20 anos, 60, na faixa de 21 a 25 anos, e 15 na faixa de 26 a 30 anos. Os resultados
obtidos encontram-se na Tabela abaixo.

Quais são, respectivamente, os valores indicados pelas letras P, Q, R e S?


(A) 40; 28; 64 e 0
(B) 50; 28; 64 e 7
(C) 50; 40; 53,3 e 7
(D) 77,8; 28; 53,3 e 7
(E) 77,8; 40; 64 e 0

03. (IMESC – Oficial Administrativo – VUNESP) Na tabela a seguir, constam informações sobre o
número de filhos dos 25 funcionários de uma pequena empresa.

Com base nas informações contidas na tabela, é correto afirmar que o número total de filhos dos
funcionários dessa pequena empresa é necessariamente
(A) menor que 41.
(B) igual a 41.
(C) maior que 41 e menor que 46.
(D) igual a 46.
(E) maior ou igual a 46.

Comentários

01. Resposta: A.
f_r=f_i/N
f_i=0,25∙72=18

02. Resposta: B.
Pela pesquisa 45 alunos estão na faixa de 16 a 20
São 10 do sexo masculino, portanto são 45-10=35 do sexo feminino.
70---100%
35 --- P
P=50%
70---100%
Q -- 40%
Q=28
35+28+S=70
S=7
Pela última coluna(% de sexo masculino):
20+R+16=100
R=64
26
P=50; Q=28; R=64; S=7

03. Resposta: E.
1 filho: 7 pessoas -7 filhos
2 filhos: 5 pessoas – 5.2=10 filhos
3 filhos: 3 pessoas – 3.3=9
Já são 26 filhos.
Temos mais 5 pessoas que tem mais de 3 filhos, o número mínimo são 4 filhos.
5.4=20
26+20=46 filhos no mínimo.

TABELAS E GRÁFICOS

O nosso cotidiano é permeado das mais diversas informações, sendo muito delas expressas em formas
de tabelas e gráficos19, as quais constatamos através do noticiários televisivos, jornais, revistas, entre
outros. Os gráficos e tabelas fazem parte da linguagem universal da Matemática, e compreensão desses
elementos é fundamental para a leitura de informações e análise de dados.
A parte da Matemática que organiza e apresenta dados numéricos e a partir deles fornecer conclusões
é chamada de Estatística.

Tabelas: as informações nela são apresentadas em linhas e colunas, possibilitando uma melhor
leitura e interpretação. Exemplo:

Fonte: SEBRAE

Observação: nas tabelas e nos gráficos podemos notar que a um título e uma fonte. O título é utilizado
para evidenciar a principal informação apresentada, e a fonte identifica de onde os dados foram obtidos.

Tipos de Gráficos

Gráfico de linhas: são utilizados, em geral, para representar a variação de uma grandeza em certo
período de tempo.
Marcamos os pontos determinados pelos pares ordenados (classe, frequência) e os ligados por
segmentos de reta. Nesse tipo de gráfico, apenas os extremos dos segmentos de reta que compõem a
linha oferecem informações sobre o comportamento da amostra. Exemplo:

19
https://www.infoenem.com.br
http://mundoeducacao.bol.uol.com.br

27
Gráfico de barras: também conhecido como gráficos de colunas, são utilizados, em geral, quando há
uma grande quantidade de dados. Para facilitar a leitura, em alguns casos, os dados numéricos podem
ser colocados acima das colunas correspondentes. Eles podem ser de dois tipos: barras verticais e
horizontais.

Gráfico de barras verticais: as frequências são indicadas em um eixo vertical. Marcamos os pontos
determinados pelos pares ordenados (classe, frequência) e os ligamos ao eixo das classes por meio de
barras verticais. Exemplo:

Gráfico de barras horizontais: as frequências são indicadas em um eixo horizontal. Marcamos os


pontos determinados pelos pares ordenados (frequência, classe) e os ligamos ao eixo das classes por
meio de barras horizontais. Exemplo:

Observação: em um gráfico de colunas, cada barra deve ser proporcional à informação por ela
representada.

Gráfico de setores: são utilizados, em geral, para visualizar a relação entre as partes e o todo.
Dividimos um círculo em setores, com ângulos de medidas diretamente proporcionais às frequências
de classes. A medida α, em grau, do ângulo central que corresponde a uma classe de frequência F é
dada por:
360°
𝛼= .𝐹
𝐹𝑡
Onde:
Ft = frequência total

Exemplo

28
Para acharmos a frequência relativa, podemos fazer uma regra de três simples:
400 --- 100%
160 --- x
x = 160 .100/ 400 = 40%, e assim sucessivamente.

Aplicando a fórmula teremos:


360° 360°
−𝐹𝑢𝑡𝑒𝑏𝑜𝑙 : 𝛼 = 𝐹𝑡 .𝐹 → 𝛼 = . 160 → 𝛼 = 144°
400
360° 360°

−𝑉ô𝑙𝑒𝑖 : 𝛼 = 𝐹𝑡 .𝐹 → 𝛼 = . 120 → 𝛼 = 108°


400
360° 360°

−𝐵𝑎𝑠𝑞𝑢𝑒𝑡𝑒: 𝛼 = . 60 → 𝛼 = 54°
𝐹𝑡 . 𝐹 →𝛼 = 400
360° 360°
−𝑁𝑎𝑡𝑎çã𝑜: 𝛼 = .𝐹 → 𝛼 = . 20 → 𝛼 = 18°
𝐹𝑡 400

Como o gráfico é de setores, os dados percentuais serão distribuídos levando-se em conta a proporção
da área a ser representada relacionada aos valores das porcentagens. A área representativa no gráfico
será demarcada da seguinte maneira:

Com as informações, traçamos os ângulos da circunferência e assim montamos o gráfico:

Pictograma ou gráficos pictóricos: em alguns casos, certos gráficos, encontrados em jornais,


revistas e outros meios de comunicação, apresentam imagens relacionadas ao contexto. Eles são
desenhos ilustrativos. Exemplo:
29
Histograma: o consiste em retângulos contíguos com base nas faixas de valores da variável e com
área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada
densidade de frequência ou simplesmente densidade definida pelo quociente da área pela amplitude da
faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do histograma, o
que pode ocasionar distorções (e, consequentemente, más interpretações) quando amplitudes diferentes
são utilizadas nas faixas. Exemplo:

Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das
classes. Exemplo:

Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal
ascendente utilizando os pontos extremos.

Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando o
objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

30
Interpretação de tabelas e gráficos

Para uma melhor interpretação de tabelas e gráficos devemos ter em mente algumas considerações:
- Observar primeiramente quais informações/dados estão presentes nos eixos vertical e horizontal,
para então fazer a leitura adequada do gráfico;
- Fazer a leitura isolada dos pontos.
- Leia com atenção o enunciado e esteja atento ao que pede o enunciado.

Exemplos

(Enem) O termo agronegócio não se refere apenas à agricultura e à pecuária, pois as atividades
ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural,
industrialização e comercialização dos produtos.
O gráfico seguinte mostra a participação percentual do agronegócio no PIB brasileiro:

Centro de Estudos Avançados em Economia Aplicada (CEPEA).


Almanaque abril 2010. São Paulo: Abril, ano 36 (adaptado)

Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma queda da participação do
agronegócio no PIB brasileiro e a posterior recuperação dessa participação, em termos percentuais.
Segundo o gráfico, o período de queda ocorreu entre os anos de
A) 1998 e 2001.
B) 2001 e 2003.
C) 2003 e 2006.
D) 2003 e 2007.
E) 2003 e 2008.

Resolução

Segundo o gráfico apresentado na questão, o período de queda da participação do agronegócio no


PIB brasileiro se deu no período entre 2003 e 2006. Esta informação é extraída através de leitura direta
do gráfico: em 2003 a participação era de 28,28%, caiu para 27,79% em 2004, 25,83% em 2005,
chegando a 23,92% em 2006 – depois deste período, a participação volta a aumentar.

31
Resposta: C

(Enem) O gráfico mostra a variação da extensão média de gelo marítimo, em milhões de quilômetros
quadrados, comparando dados dos anos 1995, 1998, 2000, 2005 e 2007. Os dados correspondem aos
meses de junho a setembro. O Ártico começa a recobrar o gelo quando termina o verão, em meados de
setembro. O gelo do mar atua como o sistema de resfriamento da Terra, refletindo quase toda a luz solar
de volta ao espaço. Águas de oceanos escuros, por sua vez, absorvem a luz solar e reforçam o
aquecimento do Ártico, ocasionando derretimento crescente do gelo.

Com base no gráfico e nas informações do texto, é possível inferir que houve maior aquecimento global
em
(A)1995.
(B)1998.
(C) 2000.
(D)2005.
(E)2007.

Resolução

O enunciado nos traz uma informação bastante importante e interessante, sendo chave para a
resolução da questão. Ele associa a camada de gelo marítimo com a reflexão da luz solar e
consequentemente ao resfriamento da Terra. Logo, quanto menor for a extensão de gelo marítimo, menor
será o resfriamento e portanto maior será o aquecimento global.
O ano que, segundo o gráfico, apresenta a menor extensão de gelo marítimo, é 2007.

Resposta: E

Mais alguns exemplos:

01. Todos os objetos estão cheios de água.

32
Qual deles pode conter exatamente 1 litro de água?
(A) A caneca
(B) A jarra
(C) O garrafão
(D) O tambor

O caminho é identificar grandezas que fazem parte do dia a dia e conhecer unidades de medida, no
caso, o litro. Preste atenção na palavra exatamente, logo a resposta está na alternativa B.

02. No gráfico abaixo, encontra-se representada, em bilhões de reais, a arrecadação de impostos


federais no período de 2003 a 2006. Nesse período, a arrecadação anual de impostos federais:

(A) nunca ultrapassou os 400 bilhões de reais.


(B) sempre foi superior a 300 bilhões de reais.
(C) manteve-se constante nos quatro anos.
(D) foi maior em 2006 que nos outros anos.
(E) chegou a ser inferior a 200 bilhões de reais.
Analisando cada alternativa temos que a única resposta correta é a D.

Questões

01. (Pref. Fortaleza/CE – Pedagogia – Pref. Fortaleza) “Estar alfabetizado, neste final de século,
supõe saber ler e interpretar dados apresentados de maneira organizada e construir representações, para
formular e resolver problemas que impliquem o recolhimento de dados e a análise de informações. Essa
característica da vida contemporânea traz ao currículo de Matemática uma demanda em abordar
elementos da estatística, da combinatória e da probabilidade, desde os ciclos iniciais” (BRASIL, 1997).
Observe os gráficos e analise as informações.

33
A partir das informações contidas nos gráficos, é correto afirmar que:
(A) nos dias 03 e 14 choveu a mesma quantidade em Fortaleza e Florianópolis.
(B) a quantidade de chuva acumulada no mês de março foi maior em Fortaleza.
(C) Fortaleza teve mais dias em que choveu do que Florianópolis.
(D) choveu a mesma quantidade em Fortaleza e Florianópolis.

02. (DEPEN – Agente Penitenciário Federal – CESPE)

Ministério da Justiça — Departamento Penitenciário Nacional


— Sistema Integrado de Informações Penitenciárias – InfoPen,
Relatório Estatístico Sintético do Sistema Prisional Brasileiro,
dez./2013 Internet:<www.justica.gov.br> (com adaptações)

A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região
em 2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no
sistema penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o
Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste. (
)certo ( ) errado

03. (TJ/SP – Estatístico Judiciário – VUNESP) A distribuição de salários de uma empresa com
30 funcionários é dada na tabela seguinte.

Salário (em salários mínimos) Funcionários


1,8 10
2,5 8
3,0 5
5,0 4
8,0 2
15,0 1

34
Pode-se concluir que
(A) o total da folha de pagamentos é de 35,3 salários.
(B) 60% dos trabalhadores ganham mais ou igual a 3 salários.
(C) 10% dos trabalhadores ganham mais de 10 salários.
(D) 20% dos trabalhadores detêm mais de 40% da renda total.
(E) 60% dos trabalhadores detêm menos de 30% da renda total.

04. (TJ/SP – Estatístico Judiciário – VUNESP) Considere a tabela de distribuição de frequência


seguinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados.

xi fi
30-35 4
35-40 12
40-45 10
45-50 8
50-55 6
TOTA 40
L
Assinale a alternativa em que o histograma é o que melhor representa a distribuição de
frequência da tabela.

05. (SEJUS/ES – Agente Penitenciário – VUNESP) Observe os gráficos e analise as afirmações


I, II e III.

35
I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001,
foi maior que 1000%.
II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior.
III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à
distância foi de 2 para 5.
É correto o que se afirma em
(A) I e II, apenas.
(B) II, apenas.
(C) I, apenas.
(D) II e III, apenas.
(E) I, II e III.

06. (DEPEN – Agente Penitenciário Federal – CESPE)

A partir das informações e do gráfico apresentados, julgue o item que se segue.


Se os percentuais forem representados por barras verticais, conforme o gráfico a seguir, então
o resultado será denominado histograma.

( ) Certo ( ) Errado

Comentários

01. Resposta: C.
A única alternativa que contém a informação correta com os gráficos é a C.

02. Resposta: CERTO.


555 ---100%
306 ---x
X=55,13%

03. Resposta: D.
(A) 1,8*10+2,5*8+3,0*5+5,0*4+8,0*2+15,0*1=104 salários
(B) 60% de 30, seriam 18 funcionários, portanto essa alternativa é errada, pois seriam 12.
(C)10% são 3 funcionários
(D) 40% de 104 seria 41,6

36
20% dos funcionários seriam 6, alternativa correta, pois5*3+8*2+15*1=46, que já é maior.
(E) 60% dos trabalhadores: 18
30% da renda: 31,20, errada pois detêm mais.

04. Resposta: A.
A menor deve ser a da primeira 30-35
Em seguida, a de 55
Depois de 45-50 na ordem 40-45 e 35-40

05. Resposta: E.
I- 69,8100%
781,6--- x
X=1119,77

II- 781,6-680,7=100,9

III- 10 = 2
25 5

06. Resposta: ERRADO.


Como foi visto na teoria, há uma faixa de valores no eixo x e não simplesmente um dado.

MEDIDAS DE DISPERSÃO

As medidas de tendência central fornecem informações valiosas mas, em geral, não são suficientes
para descrever e discriminar diferentes conjuntos de dados. As medidas de Dispersão ou variabilidade
permitem visualizar a maneira como os dados espalham-se (ou concentram-se) em torno do valor central.
Para mensurarmos está variabilidade podemos utilizar as seguintes estatísticas: amplitude total; distância
interquartílica; desvio médio; variância; desvio padrão e coeficiente de variação.

- Amplitude Total: é a diferença entre o maior e o menor valor do conjunto de dados.


Ex.: dados: 3, 4, 7, 8 e 8. Amplitude total = 8 – 3 = 5

- Distância Interquartílica: é a diferença entre o terceiro e o primeiro quartil de um conjunto de dados.


O primeiro quartil é o valor que deixa um quarto dos valores abaixo e três quartos acima dele. O terceiro
quartil é o valor que deixa três quartos dos dados abaixo e um quarto acima dele. O segundo quartil é a
mediana. (O primeiro e o terceiro quartis fazem o mesmo que a mediana para as duas metades
demarcadas pela mediana.) Ex.: quando se discutir o boxplot.

- Desvio Médio: é a diferença entre o valor observado e a medida de tendência central do conjunto de
dados.

- Variância: é uma medida que expressa um desvio quadrático médio do conjunto de dados, e sua
unidade é o quadrado da unidade dos dados.

- Desvio Padrão: é raiz quadrada da variância e sua unidade de medida é a mesma que a do conjunto
de dados.

- Coeficiente de variação: é uma medida de variabilidade relativa, definida como a razão percentual
entre o desvio padrão e a média, e assim sendo uma medida adimensional expressa em percentual.

Boxplot: Tanto a média como o desvio padrão podem não ser medidas adequadas para representar
um conjunto de valores, uma vez que são afetados, de forma exagerada, por valores extremos. Além
disso, apenas com estas duas medidas não temos ideia da assimetria da distribuição dos valores. Para
solucionar esses problemas, podemos utilizar o Boxplot. Para construí-lo, desenhamos uma "caixa" com
o nível superior dado pelo terceiro quartil (Q3) e o nível inferior pelo primeiro quartil (Q1). A mediana (Q2)
é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os
valores máximo e mínimo, que não sejam observações discrepantes. O critério para decidir se uma

37
observação é discrepante pode variar; por ora, chamaremos de discrepante os valores maiores do que
Q3+1.5*(Q3-Q1) ou menores do que Q1-1.5*(Q3-Q1).
O Boxplot fornece informações sobre posição, dispersão, assimetria, caudas e valores discrepantes.

O Diagrama de dispersão é adequado para descrever o comportamento conjunto de duas variáveis


quantitativas. Cada ponto do gráfico representa um par de valores observados. Exemplo:

Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da


variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.

Variância: Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações
da amostra menos um.

Desvio-Padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime
não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O
desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será
a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.

Exemplo: Em uma turma de aluno, verificou-se através da análise das notas de 15 alunos, os seguintes
desempenhos:
Conceit
Alunos o na
Prova
1 4,3
2 4,5
3 9
4 6
5 8
6 6,7
7 7,5

38
8 10
9 7,5
10 6,3
11 8
12 5,5
13 9,7
14 9,3
15 7,5
Total 109,8
Média 7,32
Desvio
1,77
Padrão

Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio padrão em 1,77.
Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55.

Vejamos de outra forma:

Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da


variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Repare-se nas duas amostras seguintes, que embora tenham a mesma média, têm uma dispersão bem
diferente:

Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.
Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os
quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número
de observações da amostra menos um:

Se afinal pretendemos medir a dispersão relativamente à média. Por que é que não somamos
simplesmente os desvios em vez de somarmos os seus quadrados?
Experimenta calcular essa soma e verás que (x1-x) + (x2-x) + (x1-x) + ... + (xn – x) ≠ 0. Poderíamos ter
utilizado módulos, para evitar que os desvios negativos, mas é mais fácil trabalhar com quadrados, não
concorda?! E por que é que em vez de dividirmos pó “n”, que é o número de desvios, dividimos por (n-
1)? Na realidade, só aparentemente é que temos “n” desvios independentes, isto é, se calcularmos (n-1)
desvios, o restante fica automaticamente calculado, uma vez que a sua soma é igual a zero. Costuma-se
referir este fato dizendo que se perdeu um grau de liberdade.
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma
que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades
que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:

39
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior
será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são:
- o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre
os dados.
- se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.

Exemplo: Na 2ª classe de certa escola o professor deu uma tarefa constituída por um certo número de
contas para os alunos resolverem. Pretendendo determinar a dispersão dos tempos de cálculo, observam-
se 10 alunos durante a realização da tarefa, tendo-se obtido os seguintes valores:

Tempo
Aluno
(minutos)
i xi
1 13 - 3.9 15.21
2 15 - 1.9 3.61
3 14 - 2.9 8.41
4 18 1.1 1.21
5 25 8.1 65.61
6 14 - 2.9 8.41
7 16 -0.9 0.81
8 17 0.1 0.01
9 20 3.1 9.61
10 17 0.1 0.01
169 0.0 112.90

Resolução: Na tabela anterior juntamos duas colunas auxiliares, uma para colocar os desvios das
observações em relação à média e a outra para escrever os quadrados destes desvios. A partir da coluna
das observações calculamos a soma dessas observações, que nos permitiu calcular a média = 16.9. Uma
vez calculada a média foi possível calcular a coluna dos desvios. Repare-se que, como seria de esperar,
a soma dos desvios é igual a zero. A soma dos quadrados dos desvios permite-nos calcular a variância
donde s = 3.54.
s2 = 112.9 = 12.54
9

O tempo médio de realização da tarefa foi de aproximadamente 17 minutos com uma variabilidade
medida pelo desvio padrão de aproximadamente 3.5 minutos. Na representação gráfica ao lado
visualizamos os desvios das observações relativamente à média (valores do exemplo anterior):

Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é
influenciado por valores ou muito grandes ou muito pequenos (o que seria de esperar já que na sua
definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada,
não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de
variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da
distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente
simétricas.
Propriedades para dados com distribuição aproximadamente normal: Uma propriedade que se verifica
se os dados se distribuem de forma aproximadamente normal, ou seja, quando o histograma apresenta

40
uma forma característica com uma classe média predominante e as outras classes se distribuem à volta
desta de forma aproximadamente simétrica e com frequências a decrescer à medida que se afastam da
classe média, é a seguinte:
Aproximadamente 68% dos dados estão no intervalo .

Desvio Padrão: Propriedades para dados com distribuição aproximadamente normal:

- Aproximadamente 68% dos dados estão no intervalo


- Aproximadamente 95% dos dados estão no intervalo
- Aproximadamente 100% dos dados estão no intervalo

Como se depreende do que atrás foi dito, se os dados se distribuem de forma aproximadamente
normal, então estão praticamente todos concentrados num intervalo de amplitude igual a 6 vezes o desvio
padrão.
A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade
que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade
dos dados, uns relativamente aos outros.
A partir da definição de variância, pode-se deduzir sem dificuldade uma expressão mais simples, sob
o ponto de vista computacional, para calcular ou a variância ou o desvio padrão e que é a seguinte:

É a medida de variabilidade que em geral é expressa em porcentagem, e tem por função determinar o
grau de concentração dos dados em torno da média, geralmente utilizada para se fazer a comparação
entre dois conjuntos de dados em termos percentuais, esta comparação revelará o quanto os dados estão
próximos ou distantes da média do conjunto de dados.

41
Exemplo
Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de indivíduos:
Média Desvio-padrão
Estaturas 175 cm 5 cm
Pesos 68 kg 2 kg
Pergunta: Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

Como não é possível responder a essa pergunta utilizando o desvio-padrão, pois é uma medida de
dispersão absoluta, teremos que calcular o CVP da Estatura e o CVP do Peso. A série que apresentar a
menor variação, ou seja, o menor valor do coeficiente CVP, será a série de maior homogeneidade.
Seguindo a fórmula do coeficiente CVP, temos:
CVP Estatura

CVP Peso

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.

Amplitude: Uma medida de dispersão que se utiliza por vezes, é a amplitude amostral r, definida como
sendo a diferença entre a maior e a menor das observações: r = xn:n - x1:n, onde representamos por x1:n e
xn:n, respectivamente o menor e o maior valor da amostra (x1, x2, ..., xn), de acordo com a notação
introduzida anteriormente, para a amostra ordenada.

Amplitude Inter-Quartil: A medida anterior tem a grande desvantagem de ser muito sensível à
existência, na amostra, de uma observação muito grande ou muito pequena. Assim, define-se uma outra
medida, a amplitude inter-quartil, que é, em certa medida, uma solução de compromisso, pois não é
afetada, de um modo geral, pela existência de um número pequeno de observações demasiado grandes
ou demasiado pequenas. Esta medida é definida como sendo a diferença entre os 1º e 3º quartis.
Amplitude inter-quartil = Q3/4 - Q1/4
Do modo como se define a amplitude inter-quartil, concluímos que 50% dos elementos do meio da
amostra, estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto
maior quanto maior for a variabilidade nos dados. Mas, ao contrário do que acontece com o desvio padrão,
uma amplitude inter-quartil nula, não significa necessariamente, que os dados não apresentem
variabilidade.

42
Amplitude inter-quartil ou desvio padrão: Do mesmo modo que a questão foi posta relativamente
às duas medidas de localização mais utilizadas - média e mediana, também aqui se pode por o problema
de comparar aquelas duas medidas de dispersão.
- A amplitude inter-quartil é mais robusta, relativamente à presença de "outliers", do que o desvio
padrão, que é mais sensível aos dados.
- Para uma distribuição dos dados aproximadamente normal, verifica-se a seguinte relação. Amplitude
inter-quartil 1.3 x desvio padrão.
- Se a distribuição é enviesada, já não se pode estabelecer uma relação análoga à anterior, mas pode
acontecer que o desvio padrão seja muito superior à amplitude inter-quartil, sobretudo se se verificar a
existência de "outliers".
Questões

01. (AL/GO – Assistente Legislativo – Assistente Administrativo – CS/UFG) Em estatística, a


variância é um número que apresenta a unidade elevada ao quadrado em relação a variável que não
está elevada ao quadrado, o que pode ser um inconveniente para a interpretação do resultado.
Por isso, é mais comumente utilizada na estatística descritiva o desvio-padrão, que é definido como
(A) a raiz quadrada da mediana, representada por "s" ou"μ".
(B) a raiz quadrada da variância, representada por "s" ou"α".
(C) a raiz quadrada da variância, representada por "s" ou"α".
(D) a raiz quadrada da média, representada por "s" ou "α".

02. (ANAC – Analista Administrativo – ESAF) Os valores a seguir representam uma amostra
331546248
Então, a variância dessa amostra é igual a
(A) 4,0
(B) 2,5
(C) 4,5
(D) 5,5
(E) 3,0

03. (MPE/AP – Analista Ministerial – FCC) Ao considerar uma curva de distribuição normal,
com uma média como medida central, temos a variância e o desvio padrão referentes a esta média.
Em relação a estes parâmetros,

(A) a variância é uma medida cujo significado é a metade do desvio padrão.


(B) a variância é calculada com base no dobro do desvio padrão.
(C) o desvio padrão é a raiz quadrada da variância.
(D) a média dividida pelo desvio padrão forma a variância.
(E) a variância elevada ao quadrado indica qual é o desvio padrão.

04. (MEC – Agente Administrativo – CESPE) Os dados abaixo correspondem às quantidades


diárias de merendas escolares demandadas em 10 diferentes escolas:

200, 250, 300, 250, 250, 200, 150, 200, 150, 200.

Com base nessas informações, julgue os próximos itens.

O desvio padrão amostral dos números diários de merendas escolares é superior a 50.
( ) Certo ( ) Errado

Respostas

01. Resposta: C.
Como visto, o desvio padrão é a raiz quadrada da variância.

43
02. Resposta: C.
Tem-se que a amostra contém as seguintes observações: 3 3 1 5 4 6 2 4 8. Para chegar à variância,
nessa questão, encontramos primeiro o valor da média.
A média desses valores é dada por: soma das observações/nº de observações menos 1.
Logo, 3+3+1+5+4+6+2+4+8/ 9 = 4
Após isso, aplicamos a construção: (3-4)²+(3-4)²+(1-4)²+(5-4)²+(4-4)²+(6-4)²+(2-4)²+(4-4)²+(8-4)²/9-1
Calculando: [(-1)²+(-1)²+(-3)²+(1)²+(0)²+(2)²+(-2)²+(0)²+(4)²]/9-1
(1+1+9+1+0+4+4+0+16)/8
36/8 = 4,5

03. Resposta: C.
Conforme visto anteriormente, desvio padrão é a raiz quadrada da variância.

04. Resposta: Errado.


O desvio padrão amostral é dado por:
√∑(Xi – X média)²/(n − 1)
Onde n é o número de elementos (n=10), Xi representa cada elemento da amostra e X a média da
amostra. A média, neste caso, é:
Média (X) = ∑(Xi)/ n = (150 + 150 + 200 + 200 + 200 +200 + 250 + 250 + 250 + 300) /10 = 215
O Desvio Padrão será:
√∑(Xi – X média)²/(n − 1) =
√2 ∗ (150 − 215)² + 4 ∗ (200 − 215)² + 3 ∗ (250 − 215)² + 1 ∗ (300 − 215)² / (10 − 1) =
√8450 + 900 + 3675 + 7225/9 =
√2250
√2500= 50
Logo: √2250< 50

Você também pode gostar