Você está na página 1de 68

Disciplina

Introdução à Estatística

Coordenador da Disciplina

Prof. Arnoldo Nunes da Silva

6ª Edição
Copyright © 2010. Todos os direitos reservados desta edição ao Instituto UFC Virtual. Nenhuma parte deste material poderá ser reproduzida, transmitida e
gravada por qualquer meio eletrônico, por fotocópia e outros, sem a prévia autorização, por escrito, dos autores.

Créditos desta disciplina

Realização

Autor

Prof. Marcos Ferreira de Melo

Colaborador

Prof. José Ailton Forte Feitosa


Sumário
Aula 01: Conceitos Básicos ...................................................................................................................... 01
Tópico 01: Introdução............................................................................................................................ 01
Tópico 02: Variável ............................................................................................................................... 04
Tópico 03: População e Amostra ........................................................................................................... 05

Aula 02: Organização de Dados em Tabelas .......................................................................................... 07


Tópico 01: Tabelas ................................................................................................................................ 07
Tópico 02: Tabela de Distribuição de Frequências ............................................................................... 12

Aula 03: Organização de Dados em Gráficos......................................................................................... 19


Tópico 01: Gráfico de Barras ................................................................................................................. 19
Tópico 02: Gráfico de Linhas ................................................................................................................ 24
Tópico 03: Gráfico de Setores ............................................................................................................... 26
Tópico 04: Distribuição de Frequências ................................................................................................ 27

Aula 04: Medidas de Tendência Central ................................................................................................ 32


Tópico 01: Média ................................................................................................................................... 32
Tópico 02: Moda.................................................................................................................................... 37
Tópico 03: Mediana ............................................................................................................................... 39

Aula 05: Medidas de Dispersão ............................................................................................................... 44


Tópico 01: Introdução............................................................................................................................ 44
Tópico 02: Amplitude ............................................................................................................................ 45
Tópico 03: Variância ............................................................................................................................. 46
Tópico 04: Desvio Padrão ..................................................................................................................... 51
Tópico 05: Coeficiente de Variação Relativo ........................................................................................ 52
Tópico 06: Aplicações do Desvio Padrão .............................................................................................. 54

Aula 06: Índices ........................................................................................................................................ 57


Tópico 01: Percentagem ........................................................................................................................ 57
Tópico 02: Outros Índices ..................................................................................................................... 61
INTRODUÇÃO À ESTATÍSTICA
AULA 01: CONCEITOS BÁSICOS

TÓPICO 01: INTRODUÇÃO

Estatística constitui-se basicamente na:

Coleta,

Processamento,

Interpretação e

Apresentação de dados numéricos

Constatamos sua utilização, por exemplo:

• No cálculo e registro do número de habitantes, número de nascimentos


e mortes por regiões de um país ou estado;

• No estudo dos efeitos de diversos tipos de alimentação e medicamentos;

• Na previsão das taxas de preferência de um produto por parte da


população ou índices de intenção de voto face a uma eleição;

• Na apresentação de índices de repetência e evasão escolar, de índices


relativos a escolaridade da população e na avaliação de técnicas de ensino
e aprendizagem;

• No acompanhamento da evolução dos dados econômicos de um país ou


estado.

Sendo assim o nosso contato com estatística dá-se quase que


diariamente, ao ouvirmos rádio, ao assistirmos televisão, ao lermos jornal ou
revista, ao visitarmos páginas da internet, etc. Necessitamos de suas técnicas
para efetuarmos previsão do tempo, previsão orçamentária, previsão de
investimentos, previsão do número de turmas a serem ofertadas no ano
seguinte, previsão das doses de um determinado remédio a serem prescritas,
etc.

Daremos agora uma breve explicação sobre as quatro etapas que


compõem o levantamento de dados estatísticos e que foram citadas no início
deste capítulo:

1
COLETA
Etapa em que os dados são obtidos através de um levantamento feito
por coletores de informação. Nesta etapa necessitamos do trabalho de um
profissional com conhecimento de técnicas para obtenção de dados.

Citemos o exemplo de uma pesquisa para obter informações sobre o


nível de popularidade de um determinado programa de governo. Neste
exemplo é necessário saber o que perguntar, como perguntar e a quem
perguntar para que o resultado não seja tendencioso.

A pergunta:“Você acha que este dispendioso programa de governo


deve ser encerrado?”é inválida, pois ela já sugere que o programa de
governo é no mínimo muito caro, e tende a induzir uma resposta negativa
do entrevistado.

Um outro exemplo ocorre quando pretende-se obter a reação dos


consumidores sobre determinado alimento de preparo rápido, onde o
entrevistador visita casa por casa, de uma lista pré-determinada, não
havendo, entretanto, previsão de retorno quando não há ninguém em casa.
Com certeza esta pesquisa falhará em obter a resposta daqueles que mais
provavelmente apreciariam o produto: solteiros ou casais nos quais os dois
trabalham fora.

PROCESSAMENTO
Fase em que os dados são organizados através de uma classificação ou
de uma ordenação para permitir sua análise e apresentação posterior.

É comum dizer que nesta fase os dados são compilados.

No exemplo da pesquisa para obter a preferência da população sobre


os candidatos em uma eleição, pode-se aproveitar e fazer perguntas acerca
da idade, escolaridade, profissão e sexo dos entrevistados. Após uma
análise destes dados, pode-se traçar um perfil do eleitor que vota no
candidato A, no candidato B, e assim por diante. Tal análise é impossível
de ser feita a menos que os dados sejam previamente organizados e
classificados.

2
INTERPRETAÇÃO
Fase em que os dados são analisados, previsões anteriores são confir-
madas ou são desfeitas, novas previsões são efetuadas, dados são
confrontados. Nesta fase os dados são analisados e podemos encontrar
justificativas para as medidas encontradas.

Como um exemplo bem simples analise a situação:

Suponha que, após um levantamento, os números

8,9, 9, 8,10, 9,10, 10,9, 8,9, 8, 8,8, 17,10,

sejam as idades de 16 alunos de uma classe de segundo ano do ensino


fundamental.

Temos aí um caso atípico: um aluno com 17 anos entre alunos cujas


idades variam entre 8 e 10 anos. O cálculo da média das idades destes
alunos será, então, bastante influenciado pela idade de 17 anos, o que por
várias razões pode não ser o desejado. Após uma análise podemos
descartar esta idade para obtenção da média.

APRESENTAÇÃO
Esta é a fase em que os dados são mostrados, na maioria das vezes
através de tabelas e gráficos. Veja a tabela 1:

Fonte [1]

Esta tabela é um exemplo do produto final de um levantamento


estatístico. Ela só foi possível de ser confeccionada após a realização das
três tarefas anteriores: coleta, processamento e interpretação das
informações.

Nestas notas será dada atenção somente às fases de processamento,


interpretação e apresentação de dados estatísticos.

FONTES DAS IMAGENS


1. http://datafolha.folha.uol.com.br/
2. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

3
INTRODUÇÃO À ESTATÍSTICA
AULA 01: CONCEITOS BÁSICOS

TÓPICO 02: VARIÁVEL

Toda informação devidamente coletada é um dado estatístico. O


conjunto de valores que um dado estatístico pode assumir é o que nós
chamamos de variável.

EXEMPLO
• Para o dado “sexo” temos dois resultados possíveis: masculino e
feminino. Neste caso a variável correspondente ao sexo de um indivíduo
pode assumir dois valores.

• Para o dado “idade” os resultados possíveis encontram-se no


conjunto dos números naturais {0, 1, 2, 3, 4, 5, 6, 7,... }.

• Para o dado “grau de instrução” temos como resultados possíveis: 1°


Grau, 2° Grau e 3° Grau.

VARIÁVEIS QUANTITATIVAS

Número de filhos; taxa de evasão escolar; nota, idade, altura e peso de


uma pessoa; população de uma cidade, de um estado ou de um país.

VARIÁVEIS QUALITATIVAS

Nome de um estado, de um país ou de uma cidade; nome, cor de pele e


cor de cabelo de uma pessoa situação civil; grau de instrução.

EXERCITANDO
Classifique as variáveis abaixo como qualitativas ou quantitativas:

◾ Renda familiar
◾ Religião
◾ Jornada semanal de trabalho
◾ Livro mais retirado de uma biblioteca
◾ Candidato de sua preferência
◾ Nível de escolaridade
◾ Taxa de evasão escolar de uma escola no ano de 2009
◾ Formação profissional
◾ Velocidade de um carro em uma via pública
◾ Tempo de duração de uma pilha.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

4
INTRODUÇÃO À ESTATÍSTICA
AULA 01: CONCEITOS BÁSICOS

TÓPICO 03: POPULAÇÃO E AMOSTRA

POPULAÇÃO

Entende-se por população um conjunto formado por elementos que têm


em comum uma certa característica ou que satisfazem uma mesma
propriedade.

Como exemplo: o conjunto dos eleitores de um estado, o conjunto dos


alunos de uma universidade, o conjunto dos professores de uma cidade, o
conjunto dos livros de uma biblioteca, etc.

AMOSTRA
Uma amostra é um subconjunto finito da população.

Veja que neste caso o termo população é mais abrangente do que o


usado na linguagem comum, o qual significa o conjunto dos habitantes de
um certo lugar.

Antes de uma eleição, todas as pesquisas de opinião para eleição de um


prefeito são feitas sobre um subconjunto da população. A amostra neste caso
é formada pelos eleitores que foram entrevistados e a população é o conjunto
de todos os eleitores da cidade. A única pesquisa feita sobre a população é a
própria eleição, onde todos os eleitores devem dar a sua opinião (voto) sobre
quem deve ser o prefeito.

No censo demográfico também são consultadas, em princípio, todas as


residências de um país. A coleta dos dados é feita sobre a população. Porém,
mesmo neste caso, como podemos verificar no último recenseamento
brasileiro, existe um conjunto de informações que são coletadas sobre um

5
subconjunto da população, pois de dez em dez casas o número de perguntas
a serem feitas é maior do que o normal. Temos aí duas coletas em uma
mesma pesquisa: uma sobre a população e uma sobre uma amostra.

FÓRUM
Discuta, no Fórum da Aula 1, com os colegas ou com o professor tutor,
as dúvidas sobre os exercícios ou sobre a matéria da Aula 1. Lembre que
sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe o
arquivo EXERCICIOS_AULA_1 (Visite a aula online para realizar
download deste arquivo.) para abrir a Lista de Exercícios desta aula.
Resolva a quantidade máxima de exercícios que puder, individualmente
ou em grupo. Os exercícios 2, 3, 4 e 5 correspondem ao trabalho dessa aula
que deve ser postado no Portfólio Individual no período marcado na
Agenda do ambiente SOLAR, num único documento de texto (doc, docx ou
pdf) ou manuscrito e escaneado.”

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

6
INTRODUÇÃO À ESTATÍSTICA
AULA 02: ORGANIZAÇÃO DE DADOS EM TABELAS

TÓPICO 01: TABELAS

Em geral dados estatísticos não podem ou não devem ser


apresentados da maneira como foram colhidos. É necessário antes
organizá-los como um conjunto de medidas estruturadas que podem ser
usadas para extrair informações rápidas e seguras. Na maioria dos casos
isto se consegue com a confecção de tabelas e gráficos a partir dos dados
obtidos.

Uma tabela é essencialmente um quadro que apresenta um conjunto de


dados dispostos em linhas e colunas.

Uma tabela é constituída pelos seguintes elementos: título, cabeçalho,


corpo, coluna indicadora e fonte. A definição de cada um destes elementos
será dada tomando como exemplo a tabela abaixo:

VERSÃO TEXTUAL

Conceitos

Titulo

Define o tipo de dado que a tabela contém, sua natureza e data


que foram colhidos.

Cabeçalho

Define o tipo de dado contido em cada coluna.

Corpo

É constituído pelos dados dispostos em linhas e colunas.

Coluna Indedificadora

Indeficar a origem das informações que cada linha contém . No


Caso da tabela 2 os dados pentencem aos estados da região Nordeste.

7
Fonte

É a entidade resposável pelo fornecimento dos dados. O dados


apresentados na tabela 2 foram fornecidos Pelo Instituto Brasileiro de
Geografia e Estatistica, IBGE.

Tabela Completa:

1.1 SÉRIES ESTATÍSTICAS

Chamamos de série estatística toda tabela que apresenta os dados


distribuídos em função do tempo, do local ou da categoria a que eles
pertencem.

De acordo com a variação dos dados podemos classificar as séries


estatísticas em quatro tipos: cronológica, geográfica, categórica e mista.

SÉRIE CRONOLÓGICA
Também conhecida como série temporal. Os dados variam em
função do tempo. A tabela abaixo apresenta o número de telefones no
Brasil desde 1997 até 2003.

Tabela 3: Número de linhas telefônicas no Brasil por 100 habitantes.


Previsão até o ano 2003.

8
SÉRIE GEOGRÁfiCA
Também conhecida como série de localização. Os dados são
descritos em função de regiões geográficas. Observe o exemplo dado pela
tabela abaixo, onde o preço da gasolina é relacionado para onze países:

Tabela 4: Preço, em dólares, do litro de gasolina por país.

SÉRIE CATEGÓRICA
Apresenta os dados distribuídos por diferentes categorias em
determinado tempo e local. A tabela abaixo apresenta a distribuição da
população brasileira por cor no ano de 1980:

Tabela 5: População residente no Brasil segundo a cor de acordo com o


censo demográfico Brasileiro de 1980.

SÉRIE MISTA
Podemos, muitas vezes por necessidade, apresentar combinações dos
três tipos de séries. Como exemplo, observe a tabela abaixo:

Tabela 6: Terminais Telefônicos em Serviço.

Na tabela acima vemos a combinação dos tipos geográfica e


cronológica. Os dados são descritos em função da região e do ano.

9
No próximo exemplo temos a combinação dos tipos geográfica e
categórica:

Tabela 7: População residente no Brasil por sexo, segundo a região, de


acordo com o censo demográfico de 1980.

Os dados da tabela 7 são apresentados de acordo com a região do país


e com o sexo.

1.2 DADOS ABSOLUTOS E DADOS RELATIVOS


A tabela abaixo mostra a distribuição dos alunos da Organização
Educacional São Santo Santíssimo pelas séries do ensino médio:

Tabela 8: Contagem das Matrículas da Organização Educacional São


Santo Santíssimo -1999.

Os dados representando o número de alunos por cada série estão em


valores absolutos. Não foi realizada nenhuma operação sobre eles, a não ser
a coleta e contagem desses dados.

Os dados apresentados sem nenhuma operação prévia sobre eles,


exceto a coleta e a contagem, são chamados de DADOS ABSOLUTOS.

Para efeito de comparação é melhor apresentar este dados em termos


relativos. Para isso calculemos agora as percentagens de alunos por cada
série.

Com estes valores podemos formar uma nova tabela:

Tabela 9: Contagem das Matrículas da Organização Educacional São


Santo Santíssimo -1999.

10
A tabela 9 indica que de cada 100 alunos, 52 frequentam a 1ª série, 36
frequentam a 2ª série e 12 frequentam a 3ª série. Desta forma vemos de
maneira direta a contribuição de cada parte no todo. Dados absolutos
expressam os resultados de uma coleta de maneira exata e fiel mas não
conseguem, de maneira imediata, evidenciar as relações de tamanho entre as
grandezas apresentadas. Com este objetivo usamos os dados relativos.

Os DADOS RELATIVOS são obtidos dividindo-se as medidas das


partes pela medida do todo. Temos assim uma forma rápida de fazer
comparações entre as partes.

FONTES DAS IMAGENS


1. http://www.adobe.com/go/getflashplayer
2. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

11
INTRODUÇÃO À ESTATÍSTICA
AULA 02: ORGANIZAÇÃO DE DADOS EM TABELAS

TÓPICO 02: TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS

Nesta seção veremos como organizar dados numéricos provenientes


de uma amostra muito grande ou mesmo de toda uma população, quando
estes se referem a uma única variável quantitativa, tal como: salário dos
funcionários de uma empresa; nota dos alunos de uma escola; idade,
altura ou peso de um grupo de pessoas; tempo de duração de um
conjunto de peças; número de filhos de um grupo de famílias; contagem
diária do número de carros que passam por uma via pública.

Suponha que os dados abaixo se referem às notas de 52 alunos de uma


escola.

Percorrendo o conjunto de valores fica fácil encontrar que a menor nota


é 2, a maior nota é 8 e os valores observados são 2, 3, 4, 5, 6, 7, e 8.
Escrevendo cada valor observado uma única vez segundo uma coluna,
obtemos a tabela abaixo:

Percorrendo novamente a tabela contamos o número de vezes que cada


valor se repete. Chamamos este número de frequência do valor. Deste modo
a frequência do valor 2 é 4, do valor 3 é 8, do valor 4 é 8, do valor 5 é 12, do
valor 6 é 10, do valor 7 é 6 e do valor 8 é 4. Acrescentando, à última tabela,
uma nova coluna contendo as frequências de cada valor obtemos a tabela a
seguir:

TABELA 11: NOTAS DOS ALUNOS.

NOTA DOS FREQUÊNCIA


ALUNOS

2 4
3 8
4 8
5 12
6 10
7 6
8 4

12
A tabela acima apresenta os valores de forma mais organizada e nos
fornece de maneira imediata informações tais como: menor valor (2), maior
valor (8) e o valor que ocorre mais vezes (5). Além disso, ao final da
confecção desta tabela, os valores encontram-se ordenados. Este é um
exemplo de uma tabela de distribuição de frequências.

Em uma tabela de distribuição de frequências cada linha contém um


valor seguido do número de vezes que este valor se repete. A primeira
coluna é chamada coluna dos valores e a segunda coluna das frequências.

Convém observar que em uma tabela de distribuição de frequências a


soma de todas as frequências é necessariamente igual ao número total de
dados (tamanho da amostra). Para o nosso exemplo temos

4 + 8 + 8 + 12 + 10 + 6 + 4 = 52.

2.1 ORGANIZAÇÃO DE DADOS EM CLASSES


No exemplo que acabamos de descrever, as notas variam entre os
números 2 e 8 e assumem somente valores inteiros, isto faz com que a tabela
resultante tenha no máximo sete linhas. Isto nem sempre é o que ocorre.
Suponha que o conjunto de valores dados abaixo são as notas de 52 alunos
de uma classe, cada nota com no máximo uma casa decimal.

Como podemos verificar, estas notas podem assumir qualquer valor


decimal entre 2,0 (menor nota) e 8,9 (maior nota). Se organizarmos estas
notas numa forma semelhante à da tabela 11, poderemos ter de confeccionar
uma tabela com um número razoavelmente grande de linhas, o que pode ser
inconveniente. Neste caso a melhor coisa a fazer é organizar os dados em
intervalos (faixas) de valores. Sendo assim, em vez de contar quantos alunos
tiraram nota 2,0, quantos alunos tiraram nota 2,1, nós contamos quantos
alunos tiraram nota entre 2,0 e 2,9 por exemplo. Agrupando estas notas nos
intervalos

ficaremos com a seguinte distribuição:

TABELA 12

Notas por Intervalo.

13
De posse da tabela acima podemos, caso seja necessário, ordenar as
notas de maneira mais rápida e fácil, bastando ordená-las por cada linha.
Feito isso obtemos

TABELA 13

Notas Ordenadas por Intervalo.

o que nos dá automaticamente a seguinte ordenação para o conjunto de


notas:

Em estatística, os intervalos acima mencionados, recebem


genericamente o nome de classes de frequência ou simplesmente classes.

Classes são intervalos de variação de uma variável. Chamamos de


extremos ou limites da classe os valores que delimitam o intervalo da
classe.

Substituindo na tabela 12 ou tabela 13 a coluna de notas pela coluna


contendo o número de notas em cada classe obtemos a tabela abaixo:

TABELA 14

Distribuição das Notas.

CLASSE FREQUÊNCIA

2,0 Η 2,9 4
3,0 H 3,9 8
4,0 H 4,9 8
5,0 H 5,9 12
6,0 H 6,9 10
7,0 H 7,9 6
8,0 H 8,9 4

Este é um exemplo de uma tabela de distribuição de frequências por


classes.

OBSERVAÇÃO
Em uma tabela de distribuição de FREQUÊNCIAS POR CLASSES cada
linha contém uma classe seguida da frequência desta classe. A

14
FREQUÊNCIA DE UMA CLASSE é o número de valores que pertencem a
esta classe.

Em uma tabela de distribuição de frequências com classes ganhamos em


concisão e simplicidade mas perdemos em detalhes, por exemplo: de posse
somente da tabela 14 nós sabemos que 10 alunos tiraram notas entre 6,0 e
6,9, mas não sabemos de fato quais são estas notas; não sabemos nem
responder se algum aluno tirou nota 6,5.

2.2 LIMITES DE CLASSE


No que diz respeito aos limites de uma classe, o símbolo indica que
os limites direito e esquerdo pertencem à classe. Entretanto, o símbolo
indica que somente o limite esquerdo pertence à classe, o limite direito
pertence somente à classe seguinte. Já o símbolo indica que o limite direito
pertence mas o limite esquerdo não pertence à classe em questão. Considere,
por exemplo, as tabelas abaixo:

TABELA 15

Altura (em cm) dos Alunos da 8a Série do Ensino Fundamental do


Colégio 6 de Agosto.

CLASSE FREQUÊNCIA

156 Ⱶ 160 2
160 Ⱶ 164 7
164 Ⱶ 168 6
168 Ⱶ 172 11
172 Ⱶ 176 8
176 Ⱶ 180 6
180 Ⱶ 184 1

Esta tabela nos diz que 6 alunos têm altura entre 164 cm e 168 cm,
podendo algum destes alunos medir 164 cm mas nenhum desses alunos
mede 168 cm. Se algum dos alunos da classe mede 168 cm, então ele faz
parte do grupo de 11 alunos que tem altura entre 168 cm e 172 cm. A
indicação nos informa que um valor igual ao extremo direito de uma
classe, quando existe, entra na contagem da classe seguinte e não da classe
em questão, ao contrário do limite esquerdo.

TABELA 16

Já o símbolo indica que o limite direito pertence mas o limite


esquerdo não pertence à classe em questão.

Observe a tabela abaixo:

PESO (EM QUILOS) DOS ALUNOS DA 8A SÉRIE DO ENSINO


FUNDAMENTAL DO COLÉGIO 6 DE AGOSTO.

CLASSE FREQUÊNCIA

60 Ⱶ 64 2
64 Ⱶ 68 7
68 Ⱶ 72 6

15
72 Ⱶ 76 11
76 Ⱶ 80 8
80 Ⱶ 84 6
84 Ⱶ 88 1

Esta tabela nos diz que se um aluno pesa 76 Kg então ele faz parte do
grupo dos 11 alunos que pertencem à classe 72 76, e se algum aluno pesa 72
Kg então ele faz parte do grupo de 6 alunos que pertencem à classe 68 72.
Mas um aluno que pesa 72,09Kg (72 quilos e 90 gramas) faz parte dos 11
alunos que pertencem à classe 72 76.

2.3 FREQUÊNCIA RELATIVA


As tabelas de distribuição de frequências podem conter além das
frequências, as frequências relativas.

Calculamos as FREQUÊNCIAS RELATIVAS dividindo a frequência de


cada valor ou a frequência de cada classe pelo tamanho total da amostra.

Vamos calcular agora as frequências relativas para os dados da tabela 11:


Como o total é 52, a

Obtemos então a seguinte tabela:

TABELA 17

Notas dos Alunos.

NOTA DE FREQUÊNCIA FREQUÊNCIA


ALUNOS RELATIVA

2 4 7,69%
3 8 15,38%
4 8 15,38%
5 12 23,08%
6 10 19,23%
7 6 11,54%
8 4 7,69%

16
2.4 FREQUÊNCIA ACUMULADA
Observe a tabela 15. O tamanho da amostra para esta tabela é

2 + 7 + 6 + 11 + 8 + 6 + 1 = 41.

Se quisermos saber quantos desses 41 alunos medem menos de 164 cm


basta somar o número de alunos que medem entre 156 cm e 160 cm com o
número de alunos que medem 160 cm e 164 cm. Neste caso temos que 9
alunos do grupo medem menos de 164 cm. Em estatística dizemos que 9 é a
frequência acumulada da segunda classe 160 164.

A frequência acumulada de uma classe é a soma da


frequência dessa classe com as frequências das classes anteriores.

Para a tabela 15 a frequência acumulada da terceira classe é

2 + 7 + 6 = 15;

A frequência acumulada da quarta classe é

2 + 7 + 6 + 11 = 26;

e assim por diante.

Convém ressaltar que a frequência acumulada da primeira classe é a


frequência dessa classe pois não existem classes anteriores à primeira. Por
outro lado a frequência da última classe é igual ao tamanho total da amostra,
pois para obtê-la somamos todas as frequências.

Acrescentando à tabela 15 uma nova coluna com as frequências


acumuladas obtemos a seguinte tabela:

TABELA 18

Altura (em cm) dos Alunos da 8a Série do Ensino Fundamental do


Colégio 6 de Agosto.

CLASSE FREQUÊNCIA FREQUÊNCIA


ACUMULADA

156 Ⱶ 160 2 2
160 Ⱶ 164 7 9
164 Ⱶ 168 6 15
168 Ⱶ 172 11 26
172 Ⱶ 176 8 34
176 Ⱶ 180 6 40
180 Ⱶ 184 1 41

Esta tabela nos diz, por exemplo, que 34 alunos medem menos de 176
cm.

EXERCITANDO
(a) Identifique e destaque o título, o cabeçalho, o corpo, a coluna
indicadora e a fonte da tabela abaixo:

17
TABELA 19

Matrícula do ensino superior nos cursos de graduação, por área de


conhecimento, do Estado de Ceará 1995/1996.

(b) Esta tabela é uma série estatística de que tipo?

(c) Quais cursos apresentaram maior e menor número de matrículas


em 1995? E em 1996?

FÓRUM
Discuta, no Fórum da Aula 2, com os colegas ou com o professor
tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 2. Lembre
que sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe o
arquivo exercícios-1 (Visite a aula online para realizar download deste
arquivo.) e exercícios-2 (Visite a aula online para realizar download deste
arquivo.) da aula 2 para abrir a Lista de Exercícios desta aula. Resolva a
quantidade máxima de exercícios que puder, individualmente ou em
grupo. Os arquivo exercícios-1 (questões: 1, 2 e 6) (Visite a aula online
para realizar download deste arquivo.) e exercícios 2 (questões: 1 e 3)
(Visite a aula online para realizar download deste arquivo.) da aula 2
correspondem ao trabalho dessa aula que deve ser postado no Portfólio
Individual no período marcado na Agenda do ambiente SOLAR, num
único documento de texto (doc, docx ou pdf) ou manuscrito e escaneado.”

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

18
INTRODUÇÃO À ESTATÍSTICA
AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS

TÓPICO 01: GRÁfiCOO DE BARRAS

Neste capítulo veremos como expor em gráficos os dados


apresentados em tabelas. A diferença entre as duas apresentações reside
no fato de que enquanto as tabelas apresentam os dados de forma mais
precisa e abrangente, os gráficos dão uma visão mais direta e resumida dos
dados numéricos coletados e das razões de tamanho entre eles.

O gráfico de barras é usado para representar séries cronológicas,


geográficas e categóricas.

Confeccionaremos a seguir alguns gráficos de barras referentes aos


dados da tabela abaixo.

TABELA 20

Número de Instituições de Ensino Superior no Brasil por Região e


Dependência Administrativa -1996.

MEC/INEP/SEEC.

Como exemplo, o primeiro gráfico de barras descreverá a distribuição do


total de instituições de ensino superior por região. Neste caso escrevemos ao
longo de um eixo horizontal os valores que se encontram na coluna
indicadora, como no gráfico 1.

Como estamos querendo representar o número total de instituições por


região, construímos barras verticais cujas alturas são determinadas pelos
valores 34, 97, 575, 122 e 94. Para ajudar na confecção do gráfico é melhor
começar desenhando a barra correspondente ao maior valor, no caso 575 que
é o número total de instituições da região Sudeste. Escolhida a altura da
maior barra, para manter a proporção, usamos regra de três simples para
determinar a altura correta das outras barras: se a altura da maior barra é 10
cm então a altura x da barra da região Norte é encontrada por

Calculando desta forma, as alturas das regiões Nordeste, Sul e Cento-


Oeste serão respectivamente1,68 cm ≈ 17 mm, 2,12 cm ≈ 21 mm e 1,63 cm ≈

19
16 mm. “ no primeiro quadro,deixando no segundo quadro apenas a
expressão “Colocando título obtemos a figura abaixo:
GRÁFICO 2: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES DE ENSINO SUPERIOR NO BRASIL POR REGIÃO -
1996

Todas as barras devem ter a mesma largura e ficar afastadas umas das
outras. Neste exemplo colocamos o valor correspondente à cada região no
topo de sua barra, mas isto não é obrigatório.” no segundo quadro, deixando
no terceiro apenas “Podemos, ao invés disso, usar um eixo vertical
numerado, como no gráfico 3, onde os valores de cada região podem ser
extraídos a partir da altura das barras. Note que neste caso o valor
encontrado para a altura é um valor aproximado, mas isto não é problema
desde que o objetivo do gráfico seja dar uma visão global e resumida dos
valores observados e da relação de grandeza entre eles.
GRÁFICO 3: DISTRIBUIÇÃO DO NÚMERO DE INTITUIÇÕES DE ENSINO SUPERIOR NO BRASIL POR REGIÃO -
1996.

Podemos ainda fazer como no gráfico abaixo, onde o eixo vertical é


substituído por linhas horizontais, cada uma com um valor de altura
associado.
GRÁfiCO 4: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES DE ENSINO SUPERIOR NO BRASIL POR REGIÃO
-1996.

A tabela 20 contém outras informações além do número total de


instituições por região. Ela também apresenta o número de instituições por
dependência administrativa. Mas não é necessário um novo gráfico para cada

20
conjunto de valores. Se quisermos podemos apresentar estes valores
simultaneamente como no gráfico a seguir. Faz-se necessário uma cor de
barra para cada conjunto de valores. No nosso exemplo as barras
correspondentes ao número de instituições públicas são mais claras do que
as barras que indicam o número de instituições privadas. Esta junção de
barras é útil quando se deseja fazer comparação entre os dados obtidos.
Gráficos deste tipo são chamados de gráficos de barras múltiplas.
GRÁFICO 5: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES POR DE-PENDÊNCIA ADMINISTRATIVA,
SEGUNDO AS REGIÕES - 1996

O gráfico 6 apresenta um outro exemplo de gráfico de barras múltiplas.


Neste caso utilizamos a sobreposição de barras para mostrar num mesmo
gráfico três conjuntos de dados: os valores das escolas municipais,
particulares e estaduais. A expressão mil alunos significa que em 1987
haviam aproximadamente 1.300 ×1.000 = 1.300.000 alunos matriculados na
pré-escola em colégios municipais.
GRÁFICO 6: MATRICULA INICIAL POR DEPENDÊNCIA ADMINISTRATIVA NA PRÉ-ESCOLA (MIL ALUNOS)-
BRASIL - 1987 / 1998.

Os gráficos mostrados até agora recebem o nome de gráficos de barras


verticais. Podemos também apresentar gráficos de barras horizontais, como
mostra o gráfico 7 a seguir.

GRÁFICO 7: PERCENTUAL DE CRIANÇAS, ENTRE 4 E 6


ANOS,MATRICULADAS NA PRÉ - ESCOLA 1998.

Ano Percentual

Recife 77

Fortaleza 76

Salvador 72

Rio de Janeiro 71

21
São Paulo 57

Belo Horizonte 56

Curitiba 42

Porto Alegre 41

Neste caso colocamos os dados referentes à coluna indicadora dispostos


segundo um eixo vertical, e as barras são desenhadas na posição horizontal.
Apenas para efeito de comparação entre os dois tipos gráficos ( barra
horizontal e vertical ) vamos construí-los para os dados percentuais da tabela
21 abaixo.

TABELA 21

Pessoas Analfabetas na População de 15 anos ou mais.Números


absolutos e Números relativos - 1920/1996.

IBGE

Os dois gráficos a seguir apresentam os números percentuais (terceira


coluna) em função dos anos (série cronológica). No gráfico 8 usamos barras
verticais e no gráfico 9 usamos barras horizontais. É mais comum o uso de
barras verticais, no entanto quando a coluna indicadora tem muitos nomes e
estes são longos, é preferível o uso de barras horizontais, pois assim
podemos escrevê-los em posição horizontal e sem o uso de abreviações,
como é o caso do gráfico 7 (série geográfica).

22
FONTES DAS IMAGENS
1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

23
INTRODUÇÃO À ESTATÍSTICA
AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS

TÓPICO 02: GRÁfiCOO DE LINHAS

O gráfico de linhas é usado para representar séries cronológicas. Usamos


uma linha poligonal para mostrar a evolução da série. Como um exemplo
considere os dados percentuais da tabela 21 ilustrada no tópico anterior.

VERSÃO TEXTUAL

1-Usamos dois eixos perpendiculares

2-No eixo horizontal colocamos as datas e no eixo vertical


numeramos de acordo com as medições, no nosso caso as
percentagens

3-Para cada ano construa um ponto no plano cuja altura


corresponda ao valor da percentagem deste ano. A altura dos pontos
devem estar em proporção com as medições, como no gráfico de
barras. Neste caso se 70 corresponde a 7 cm então a altura x do
primeiro ponto (ano 1920) é 6,49 cm ≈6,5 cm, a altura do segundo
ponto (1940) é 5,6 cm, a altura do terceiro ponto é 5,05 cm ≈5,1 cm, e
assim por diante.

4-Unimos os pontos por segmentos de retas

5-Obtemos o seguinte gráfico de linhas

GRÁFICO 10: PERCENTUAL DE PESSOAS ANALFABETAS NA


POPULAÇÃO DO BRASIL COM 15 ANOS OU MAIS - 1920 A 1996.

É comum também o não uso do eixo vertical auxiliar. Sendo assim as


medições correspondentes as datas são colocadas ao longo da linha
poligonal, como no gráfico a seguir. Neste caso é aconselhável, para facilitar
a visualização, o uso de linhas verticais ligando o ano ao ponto
correspondente na linha poligonal.

24
Podemos também usar um mesmo gráfico de linhas para representar a
evolução de duas variáveis ao longo do tempo. O gráfico seguinte mostra a
evolução do número de matrículas por dependência administrativa ao longo
dos anos. Vemos rapidamente que o número de matrículas nas escolas
municipais vem tendo um aumento considerável em relação ao número de
matrícula na rede particular e na rede estadual, onde observamos uma
estabilização e uma queda respectivamente.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

25
INTRODUÇÃO À ESTATÍSTICA
AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS

TÓPICO 03: GRÁfiCOO DE SETORES

Usamos gráfico de setores para representar dados relativos. O total é


representado pelo círculo (100%) e os setores representam as partes.
Considere a tabela abaixo.

MEC, INEP, SEEC


Podemos obter a medida do ângulo em graus de cada setor por meio de
uma regra de três simples e direta. Vejamos o valor das matrículas em
instituições federais.

Portanto o número de matrículas nas instituições federais será


representado por um setor que mede aproximadamente 76º. Descobrindo o
ângulo dos setores para os demais valores podemos construir o gráfico de
setores abaixo. Para uma maior clareza colocamos as taxas (percentagens) de
matrículas de cada instituição nos setores correspondentes (gráfico 13). Se o
objetivo é fazer apenas um comparação entre os valores obtidos isto não é
necessário e podemos apresentar simplesmente o gráfico 14.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

26
INTRODUÇÃO À ESTATÍSTICA
AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS

TÓPICO 04: DISTRIBUIÇÃO DE FREQUÊNCIAS

Os dados organizados em tabelas de distribuição de frequências


também podem ser apresentados em gráfico de barras (histograma) ou
gráfico de linhas (polígono de frequências).

Para distribuição de frequências os gráficos de barras são chamados


histogramas e os gráficos de linhas são chamados polígonos de
frequências.

4.1 HISTOGRAMAS
A tabela a seguir representa uma distribuição de frequências sem
intervalos de classes.

TABELA 23: DISTRIBUIÇÃO DO NÚMERO DE FILHOS POR FAMÍLIA DE


32 FAMÍLIAS.

NÚMERO DE FREQUÊNCIA
FILHOS

0 2
1 4
2 8
3 10
4 5
5 2
6 1

Para construir o histograma desta tabela...

• Dispomos os valores (número de filhos) segundo um eixo horizontal e


usamos barras (retângulos) com bases neste eixo para representar as
frequências.

• As barras devem estar afastadas umas das outras e devem possuir a


mesma largura.

• Os pontos médios das suas bases devem corresponder aos valores e suas
alturas devem ser proporcionais aos valores das frequências
correspondentes.

Procedendo desta forma obtemos o seguinte histograma para a tabela


23.

27
Para uma distribuição de frequências com INTERVALOS DE CLASSES
procedemos de maneira semelhante, mas neste caso as barras ficam juntas.
Além disso a largura de cada barra deve ser igual a largura da classe. Isto faz
com que o ponto médio da classe coincida com o ponto médio da base da
barra.

Veja por exemplo a tabela abaixo.

TABELA 24: NOTAS DOS 30 ALUNOS DA 8ª SÉRIE.

NOTAS FREQUÊNCIA

0Ⱶ2 3
2Ⱶ4 6
4Ⱶ6 10
6Ⱶ8 7
8 Ⱶ 10 4

Construindo o histograma para esta tabela obtemos o gráfico 16.

Na tabela acima as classes têm o mesmo comprimento.

COMO PROCEDER ENTÃO NO CASO EM QUE AS CLASSES NÃO


POSSUEM UM MESMO COMPRIMENTO?

A tabela 25 exemplifica este caso. Na construção do histograma desta


tabela as áreas das barras é que devem ser proporcionais às frequências das
classes correspondentes. Portanto a altura de cada barra será proporcional
ao quociente entre a frequência e o comprimento da classe, que é o que
chamamos de densidade de frequência.

28
A densidade de frequência da classe é obtida dividindo-se a frequência
da classe pelo comprimento da classe.

Por exemplo, a densidade de frequência da primeira e da segunda classe


são

respectivamente. A densidade de frequência das demais classes nós


calculamos de modo análogo.

TABELA 25: SALÁRIOS DA EMPRESA GUIMARÃES & FILHOS.

SALÁRIO FREQUÊNCIA DENSIDADE DE


FREQUÊNCIA X
200

0,00 Ⱶ 200,00 10 10,000


200,00 Ⱶ 25 12,500
600,00 30 15,000
600,00 Ⱶ 10 2,500
1000,00 8 2,667
1000,00 Ⱶ 4 1,143
1800,00
1800,00 Ⱶ
2400,00
2400,00 Ⱶ
3100,00

Como as alturas devem ser proporcionais às densidades de frequências,


nós colocamos na terceira coluna os valores das densidades multiplicados
por 200.

Por que 200? Apenas para facilitar a marcação das alturas das barras.

Nós podíamos ter multiplicado por 100, ou por 300, ou por 150. Veja
que com a multiplicação por 200, a altura da primeira barra pode ser 10 cm,
a da segunda barra 12,5 cm, a da terceira barra 15,0 cm, e assim por diante.
Observamos mais uma vez que o objetivo principal de um gráfico não é
descrever os dados de forma precisa, mas apresentá-los de uma maneira tal
que possamos ter uma visão geral destes e que sejamos capazes de fazer
comparações diretas e rapidas.

O gráfico a seguir mostra o histograma para a tabela 25.

GRÁFICO 17

29
OBSERVAÇÃO
Observe mais uma vez que, num gráfico como este, a frequência de
cada classe deve ser proporcional a área da barra e não à altura
da mesma. É com este objetivo que ele é confeccionado.

POLÍGONO DE FREQUÊNCIAS
O polígono de frequências é utilizado para representar graficamente
uma distribuição de frequências com classes. Não faz sentido falar em
polígono de frequências para uma distribuição de frequências sem classes.

Um polígono de frequências de uma distribuição com classes


é um gráfico de linhas no qual as frequências devem ser marcadas
sobre perpendiculares ao eixo horizontal, traçadas a partir do
ponto médio da classe e com comprimento proporcional à
frequência desta classe.

O gráfico 18 mostra esta marcação para a tabela 24. Observe por este
gráfico que se faz necessário a marcação de dois pontos auxiliares:

◾ O ponto médio de uma classe imaginária anterior à primeira classe


◾ O ponto médio de outra classe imaginária posterior à última classe.

Isto é obrigatório para que o gráfico seja uma poligonal fechada. Em


seguida unimos estes pontos e obtemos então o polígono de frequências
como mostrado no gráfico 19. Veja que não devemos colocar, no eixo
horizontal do gráfico final, o valor do ponto médio das classes imaginárias.

30
EXERCITANDO
Jogue um dado 30 vezes e anote a ocorrência dos números. Repita a
experiência mais duas vezes. Faça então um gráfico de barras para mostrar
o resultado nas três experiências. Faça o mesmo com uma moeda.

FÓRUM
Discuta, no Fórum da Aula 3, com os colegas ou com o professor
tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 3. Lembre
que sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe para
abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de
exercícios que puder, individualmente ou em grupo. Os exercícios 2, 3, 6,
8 e 9 (Visite a aula online para realizar download deste arquivo.)
correspondem ao trabalho desa aula que deve ser postado no Portfólio
Individual no período marcado na Agenda do ambiente SOLAR, num
único documento de texto (doc, docx ou pdf) ou manuscrito e escaneado.”

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

31
INTRODUÇÃO À ESTATÍSTICA
AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL

TÓPICO 01: MÉDIA

A descrição e a apresentação de um conjunto de dados numéricos


podem ser feita desde uma forma muito completa e elaborada até uma
forma bastante concisa e resumida, dependendo do objetivo a que estes
dados se propõem. Podemos apresentar os dados de maneira crua, isto é,
da forma como eles foram colhidos, ou utilizando tabelas e gráficos ou
mesmo usando um simples número que seja até certo ponto um
representante do conjunto de dados em questão.

Muitas vezes se faz necessário a apresentação resumida de um


conjunto de dados numéricos através de um único número que possa, em
um certo sentido, descrever o conjunto inteiro. O tipo de número a ser
escolhido depende do tipo de característica do conjunto que nós desejamos
descrever.

MÉDIA

A média ou média aritmética é a medida de tendência central mais


utilizada. Suponha, por exemplo, que os números abaixo

8, 48, 87, 56, 59, 28, 26, 57, 3

sejam as notas em matemática de um aluno durante um semestre letivo.


Usamos como nota semestral desse aluno o número obtido pela divisão por 8
da soma de todas as notas, ou seja,

O número 7,8 é o que chamamos de média do aluno no semestre. É o


número a ser utilizado para representar todas as 8 notas durante o semestre
e dirá se o aluno está ou não aprovado.

De maneira geral temos a seguinte definição:

A média de um conjunto com n números é a soma dos números


dividida por n

EXEMPLO
Vejamos um outro exemplo:

Em 12 meses de 2000, o departamento de polícia de uma certa cidade


obteve os seguintes números de roubos à mão armada

20 27 35 33 28 26 29 32 34 26 27 31.

Assim a média do número de roubos à mão armada durante o ano foi

32
Portanto ocorreram, à cada mês, em média, 29 roubos à mão armada
durante esse ano.

De maneira geral, para n números quaisquer

a média, comumente indicada por será

1.1 MÉDIA E DISTRIBUIÇÃO DE FREQUÊNCIAS


A tabela abaixo apresenta a distribuição dos pesos de 50 alunos de uma
classe.

TABELA 26: PESOS DOS 50 ALUNOS.

PESO FREQUÊNCIA

55 2
57 4
60 7
62 9
65 11
68 8
71 6
75 3

Como nos demais casos, a média dos pesos será a divisão por 50 da
soma de todos os pesos.

OBSERVAÇÃO
Observe que a soma dos pesos NÃO É

55 + 57 + 60 + 62 + 65 + 68 + 71 + 75.

É um erro comum, observando a tabela, achar que tal soma é a soma de


todos os pesos. Veja que temos que somar 50 pesos e não 8 como acima. Na
soma temos que colocar o peso 55 como parcela 2 vezes, o peso 57 como
parcela 4 vezes, o peso 60 como parcela 7 vezes e assim por diante, obtendo
assim a soma dos 50 pesos (50 = 2 + 4 + 7 + 9 + 11 + 8 + 6 + 3). Sendo assim
a média dos pesos para a tabela 26 é

O peso médio dos 50 alunos é então 64,52 Kg.

EXEMPLO
Vejamos um outro exemplo:

33
A tabela abaixo apresenta a nota de 100 alunos que prestaram um
certo exame.

TABELA 27: NOTAS DE 100 ALUNOS.

NOTAS FREQUÊNCIA

2,0 2
3,5 4
4,5 8
5,0 10
5,5 20
6,0 30
7,5 16
8,0 6
9,0 4

A média das notas dos 100 alunos é então

De maneira geral, para uma tabela de distribuição de frequências como


a tabela 28, a média é calculada pela fórmula

ou seja, a média é a divisão, pela soma das frequências, da soma dos


produtos de cada valor por sua respectiva frequência.

É comum, no cálculo da média, estender a tabela original colocando


uma terceira coluna onde aparecem os produtos de cada valor por sua
respectiva frequência. Colocamos então, abaixo da segunda coluna, a soma
das frequências e, abaixo da terceira coluna, a soma dos produtos de cada
valor por sua frequência, originando assim a tabela a seguir.

34
A extensão da tabela 27 é dada pela tabela

TABELA 30

1.2 MÉDIA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES


Em uma tabela de distribuição de frequências com classes substituímos
cada classe pelo seu ponto médio, o qual é a média aritmética dos extremos
da classe, e então procedemos como na secção anterior, como se os valores
fossem de fato os pontos médios das classes.

OBSERVAÇÃO
Observe que é impossível calcular o valor exato da média dos valores a
partir de uma tabela de distribuição de frequências com classes. Olhando
para a tabela 31 sabemos que temos, por exemplo, 7 alturas entre 160 cm e
164 cm, mas não podemos dizer precisamente quais são os valores dessas
alturas. O que fazemos sempre é assumir que todos os valores em uma

35
classe sejam iguais ao ponto médio da classe (o que não é necessariamente
verdade) e assim estipulamos a média usando os pontos médios de todas
as classes.

EXEMPLO
Vejamos um outro exemplo:

A tabela a seguir apresenta as notas de 40 alunos de uma turma


distribuídas em 5 classes.

TABELA 33: NOTAS DOS ALUNOS.

CLASSE FREQUÊNCIA

0Ⱶ2 3
2Ⱶ4 7
4Ⱶ6 12
6Ⱶ8 11
8 Ⱶ 10 7

Acrescentando a coluna contendo o ponto médio das classes e a


coluna contendo o produto dos pontos médios das classes pelas
respectivas frequências, obtemos a tabela

TABELA 34: NOTAS DOS ALUNOS.

A média da turma é então

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

36
INTRODUÇÃO À ESTATÍSTICA
AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL

TÓPICO 02: MODA

Uma outra medida que é usada para descrever o centro de um conjunto


de dados numéricos é a moda.

A moda de um conjunto de dados numéricos é o valor que ocorre o


maior número de vezes.

Fonte [1]
26 25 28 23 25 24 24 21 23 26 28 26 24 32 25 27 24 23 24 22

Para calcular a moda desses valores é aconselhável ordená-los antes.


Feito isso obtemos:

21 22 23 23 23 24 24 24 24 24 25 25 25 26 26 26 27 28 28 32.

PORTANTO A MODA É 24, O VALOR OCORRE MAIS VEZES (5).

2.1 MODA E DISTRIBUIÇÃO DE FREQUÊNCIAS


Em uma tabela de distribuição de frequências, a frequência de cada
valor é o número de vezes que tal valor ocorre no conjunto. Portanto, para
encontrar a moda, basta verificar qual a maior frequência. Sendo assim a
moda para a tabela 26 é 65, que é o peso com maior frequência (11). A moda
para a tabela 27 é 6,0, que é a nota com maior frequência (30).

No caso em que a maior frequência ocorre em dois valores distintos,


dizemos que não existe moda. Sendo assim, o conjunto de dados abaixo não
possui moda.

OBSERVAÇÃO
Os valores 23 e 24 são os que ocorrem mais vezes e com a mesma
frequência (4). Portanto tal conjunto não tem moda.

2.2 MODA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES


No caso de uma distribuição de frequências com classes, como não é
possível exibir os valores exatos que ocorrem em cada classe, dizemos
simplesmente que a classe que possui o maior número de valores é a CLASSE
MODAL.

De fato existe uma fórmula matemática para estipular a moda neste


caso, mas esta não será deduzida e nem mostrada neste texto.

Para a tabela 31 a classe modal é 168 172, que possui a maior


frequência (11).

Para a tabela 33 a classe modal é 4 6, a qual possui o maior número de


notas (12). No caso da maior frequência ocorrer em duas classes distintas,
dizemos que o conjunto de dados não possui classe modal.

37
FONTES DAS IMAGENS
1. http://1.bp.blogspot.com/_8zi9Gqb33bU/SHJ9FlI-
V6I/AAAAAAAAAdA/oNO0XNB6yT0/S220/lupa.jpg
2. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

38
INTRODUÇÃO À ESTATÍSTICA
AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL

TÓPICO 03: MEDIANA

Estando o conjunto de dados numéricos ordenados, a mediana é o valor


que se encontra no centro.

A mediana de um conjunto de valores numéricos ordenados é o valor


que separa o conjunto em dois outros com o mesmo número de elementos,
segundo a ordenação.

EXEMPLO 1
Considere o conjunto com 9 valores abaixo

14 24 10 19 24 10 5 12 8.

Após ordená-lo obtemos

5 8 10 10 12 14 19 24 24.

Vemos que o valor 12 encontra-se no centro do conjunto ordenado


pois o divide em dois subconjuntos com 4 elementos cada, a saber:

5 8 10 10 e 14 19 24 24.

A mediana então é o valor 12 e sua ordem é 5 =(9 + 1) ÷ 2. Veja que


neste caso o conjunto possui um valor que se encontra no meio do conjunto
apenas por que seu número de elementos é ímpar (9). Se um conjunto
ordenado tiver 27 elementos a mediana será o valor de ordem 14 =(27 + 1)
÷ 2, se um conjunto ordenado tiver 35 elementos a mediana será o valor de
ordem 18 =(35 + 1) ÷ 2.

De modo geral quando um conjunto ordenado tem n elementos e n


é ímpar, a sua mediana é o termo de ordem (n + 1) ÷2.

EXEMPLO 2
Vejamos agora o conjunto de dados com 12 valores

13 21 17 12 13 21 3 13 21 19 24 7.

Ordenando-o obtemos

3 7 12 13 13 13 17 19 21 21 21 24.

Como o número de elementos é par (12) o conjunto não possui um


valor que se encontra na posição central. Existem dois valores centrais: 13
que é o termo de ordem 6 = 12 ÷2 e 17 que é o termo de ordem 7 = 12 ÷2 +
1. Neste caso dizemos que a mediana é a média aritmética dos dois valores
centrais. Assim a mediana deste conjunto será

39
Perceba que 15, sendo um valor entre 13 e 17, separa o conjunto de 12
valores em dois conjuntos com 6 elementos cada, a saber:

3 7 12 13 13 13 e 17 19 21 21 21 24.

O primeiro contendo os 6 valores menores ou iguais a 15 e o segundo


contendo os 6 valores maiores ou iguais a 15. Se um conjunto ordenado
tiver 26 elementos a sua mediana é a media aritmética dos 2 valores
centrais, que são os termos de ordem 13 = 26 ÷2e 14 = 26 ÷2 + 1. Se um
conjunto ordenado tiver 68 elementos a sua mediana é a media aritmética
dos termos de ordem 34 = 68 ÷2 e 35 = 68 ÷2 + 1.

De modo geral quando um conjunto ordenado tem n elementos e n


é par, a sua mediana é a média aritmética dos dois termos centrais, que
são os termos de ordem n ÷2 e ordem n ÷2 + 1 respectivamente.

EXEMPLO 3
Para o conjunto ordenado com 11 valores

12 15 15 16 17 17 17 19 21 22 22,

a sua mediana é 17, o termo de ordem 6 =(11 + 1) ÷2. Para o conjunto


ordenado com 14 valores

5 6 12 15 15 17 17 17 18 23 25 25 28 29,

a sua mediana é

a média aritmética dos termos de ordem 7 = 14 ÷2 e ordem 8 = 14 ÷2


+ 1. Neste último caso, como os dois termos centrais são iguais, a mediana
pertence ao conjunto.

OLHANDO DE PERTO
Quando o número de elementos do conjunto é ímpar, a mediana é um
dos valores do conjunto. Quando o número de elementos do conjunto é
par, a mediana será um valor do conjunto se e somente se os dois termos
centrais forem iguais.

Perceba a distinção enfatizada no texto e existente entre a mediana e a


ordem da mediana.

3.1 MEDIANA E DISTRIBUIÇÃO DE FREQUÊNCIAS


Para achar a mediana de um conjunto de valores descritos por uma
distribuição de frequências precisamos, como nos demais casos, encontrar a
ordem do termo central (número de elementos ímpar) ou a ordem dos dois
termos centrais (número de elementos par) como explicado anteriormente.

Vejamos agora alguns exemplos.

EXEMPLO 1

40
A tabela 26 apresenta a distribuição de 50 pesos.

Portanto o peso mediano é a média aritmética dos valores centrais de


ordem 25 =(50÷2) e ordem 26 =(50 ÷2+1). Uma boa forma de encontrar
esses valores centrais é formar a tabela estendida contendo uma terceira
coluna, com as frequências acumuladas, como a seguir.

TABELA 35: PESOS DOS 50 ALUNOS.

PESO FREQUÊNCIA FREQUÊNCIA


ACUMULADA

55 2 2
57 4 6
60 7 13
62 9 22
65 11 33
68 8 41
71 6 47
75 3 50

Vemos assim que o 25º termo é 65 e o 26º termo é também 65.


Portanto o peso mediano é

EXEMPLO 2
A tabela abaixo apresenta a distribuição dos números de filhos de 64
famílias.

TABELA 36: NÚMERO DE FILHOS DE 64 FAMÍLIAS.

Nº FREQUÊNCIA FREQUÊNCIA
DE ACUMULADA
FILHOS

0 4 4
1 11 15
2 17 32
3 16 48
4 8 56
5 3 59
6 3 62
7 2 64

Para esta distribuição os termos de ordem 32 =(64 ÷2) e 33 =(64 ÷2 +


1) são os centrais. Olhando para a frequência acumulada concluímos que o
32º termo é 2 e o 33° termo é 3. Sendo assim a mediana do número de
filhos é

EXEMPLO 3
A tabela a seguir apresenta a distribuição das notas de 91 alunos.
41
A mediana das notas é o termo de ordem 46 =(91 + 1)/2. Olhando a
coluna das freqüências acumuladas vemos que o termo de ordem 46 é 7.
Portanto a nota mediana é 7.

Nº FREQUÊNCIA FREQUÊNCIA
DE ACUMULADA
FILHOS

0 2 2
1 4 6
2 5 11
3 6 17
4 6 23
5 9 32
6 12 44
7 24 68
8 11 79
9 7 86
10 5 91

3.2 MEDIANA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM


CLASSES
Em uma distribuição de frequências com classes não é possível exibir os
valores exatos que ocorrem em cada classe. Portanto não podemos calcular a
mediana de forma exata. Existem fórmulas para estipular a mediana nesses
casos mas elas não serão estudadas neste texto.

EXERCITANDO
A tabela abaixo apresenta a distribuição das estaturas de 100 alunos
de uma classe.

Determinar a estatura média, a classe modal e a classe da mediana.

FÓRUM
Discuta, no Fórum da Aula 4, com os colegas ou com o professor
tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 4. Lembre
que sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe o
arquivo dos exercícios exercícios-1 (questões: 3, 4 e 8) (Visite a aula online
para realizar download deste arquivo.) e exercícios 2 (questões: 3 e 6)
42
(Visite a aula online para realizar download deste arquivo.) para abrir a
Lista de Exercícios desse tópico da aula 4. Resolva a quantidade máxima
de exercícios que puder, individualmente ou em grupo. Os exercícios
exercícios-1 (questões: 3, 4 e 8) (Visite a aula online para realizar
download deste arquivo.) e exercícios 2 (questões: 3 e 6) (Visite a aula
online para realizar download deste arquivo.) da aula 4 são as respectivas
questões do trabalho dessa aula a ser postado no Portfólio Individual do
ambiente Solar.”

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

43
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 01: INTRODUÇÃO

Dado um conjunto de valores numéricos, uma medida de tendência


central dá o centro do conjunto, isto é, o número em torno do qual os valores
estão distribuídos. No entanto uma medida de tendência central não fornece
nenhuma informação adicional sobre como os valores encontram-se
distribuídos (dispersos, espalhados) em torno do valor central.

Admita, por exemplo, que os valores abaixo são as notas obtidas por
quatro equipes de oito alunos durante um ano letivo.

A média das quatro equipes é 7.

Entretanto as notas das quatro equipes apresentam variações distintas.

As notas da equipe A não apresentam dispersão.

As notas da equipe B apresentam pouca dispersão.

As notas da equipe C apresentam dispersão maior que as anteriores.

As notas da equipe D apresentam a maior dispersão.

Vemos claramente neste exemplo que conjuntos com médias idênticas


podem apresentar variações (dispersões) diferente. Apresentaremos neste
capítulo medidas que indicam a dispersão dos valores de um conjunto
numérico.

Estas medidas são: amplitude, variância, desvio padrão e coeficiente


de variação relativo

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

44
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 02: AMPLITUDE

Dado um conjunto de valores, a amplitude é a diferença entre o maior e


o menor valor.

Para o exemplo anterior temos

◾ A amplitude das notas da equipe A é 7−7 = 0.


◾ A amplitude das notas da equipe B é 8−6 = 2.
◾ A amplitude das notas da equipe C é 9−5 = 4.
◾ A amplitude das notas da equipe D é 10−4 = 6.

A amplitude de um conjunto de valores numéricos é a diferença entre


o maior e o menor valor do conjunto.

A amplitude é a medida de variação mais simples pois somente dois


valores do conjunto de dados são necessários para o seu cálculo. Este é,
entretanto, o motivo que limita sua utilidade. Os conjuntos abaixo
apresentam as alturas (em cm) de dois grupos de oito pessoas.

Os dois grupos apresentam a mesma amplitude: 170−160= 10 cm. Mas o


grupo 2 apresenta uma maior dispersão nas alturas. Concentrando-se em
apenas dois valores de uma distribuição, o maior e o menor valor, a
amplitude não dá informação sobre a dispersão dos demais valores.
Precisamos de medidas de dispersão que levem em conta todos os valores do
conjunto em questão.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

45
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 03: VARIÂNCIA

Estando os dados dispersos em torno da média, uma medida que


indique a dispersão deve levar em conta o desvio de cada valor em relação à
média (a diferença entre cada valor e a média).

A variância é uma medida de dispersão que considera este fato.

OBSERVAÇÃO
Para calcular a variância de um conjunto de valores:

◾ Primeiro calculamos a média desse conjunto.


◾ Então subtraímos a média de cada valor e elevamos cada resultado ao
quadrado.
◾ Finalmente computamos a média desses quadrados e obtemos o que
chamamos de variância do conjunto.

Vejamos como exemplo as notas da equipe B citadas anteriormente:

Equipe B: 6; 7; 8; 6; 7; 7; 8; 7.

A média da equipe B é:

Subtraímos agora a média de cada uma das notas. É conveniente


agrupar esses valores em uma tabela. Os desvios estão dispostos na segunda
coluna da tabela 38. Calculamos agora os quadrados dos desvios e os
colocamos na terceira coluna da tabela 38.

Calculando a média dos valores da terceira coluna (média dos


quadrados) obtemos a variância.

VariânciaB

Confira os resultados da Variância das demais equipes:

Da mesma maneira que para equipe B, e sendo a média da equipe C


igual a 7, obtemos a tabela 39 para equipe C.

46
VariânciaC

A variância da equipe C é então

Para a equipe D, obtemos a tabela 40, cuja média é 7.

VariânciaD

Portanto a variância da equipe D é

Finalmente para equipe A temos a tabela 41 que, como esperado, da


variação nula para as notas da equipe

VariânciaA

Temos então que:

◾ A variância das notas da equipe A é 0.


◾ A variância das notas da equipe B é 0,5.
◾ A variância das notas da equipe C é 3,25.
◾ A variância das notas da equipe D é 7,75.

Portanto, quanto maior a variância maior a dispersão.

Observe, por estes exemplos, que a soma dos desvios é sempre zero. Isto
é um fato e não uma coincidência particular a estes exemplos. Para qualquer
conjunto de dados a soma dos desvios é sempre zero e, assim, não podemos
usá-la para obter a medida da dispersão. Portanto, em vez da soma dos

47
desvios, usamos a soma dos quadrados dos desvios, que é sempre um
número positivo, para obter a variância.

Dado um conjunto com n valores o desvio de cada valor é a diferença


entre o valor e a média do conjunto. A variância do conjunto é a média dos
quadrados dos desvios.

Variância

Vejamos agora a variância para os grupos 1 e 2 de alturas.

GRUPO 01
Para o grupo 1, cuja média é 165, obtemos a tabela 42. Portanto a
variância do grupo 1 é:

Variância 1

TABELA 42: ALTURAS DO GRUPO 1.

GRUPO 02
Para o grupo 2, cuja média também é 165, temos a tabela 43. A
variância deste grupo é então dada por:

Variância 2

TABELA 43: ALTURAS DO GRUPO 2.

Constatamos agora através da variância o que já tínhamos observado:


as idades do segundo grupo têm maior dispersão que as idades do primeiro
grupo.

48
3.1 VARIÂNCIA DE DISTRIBUIÇÃO DE FREQUÊNCIAS
No caso em que os dados estão agrupados devemos levar em
consideração, assim como no cálculo da média, o valor de cada frequência.
Por exemplo, a tabela 44 apresenta a distribuição dos pesos (em Kg) de 40
alunos de uma classe.

TABELA 44: PESOS DE 40 ALUNOS.

PESOS (XI) FREQUÊNCIAS (ƑI)

45 2
46 3
48 6
49 9
50 8
51 6
52 4
53 2

Inicialmente calculamos a média como mostrado no capítulo. Para isso é


conveniente acrescentar outras colunas à tabela 44 para inclusão de valores a
serem utilizados no cálculo da média e da variância. Tais extensões são
apresentadas na tabela 45. Acrescentamos nesta tabela uma terceira coluna
contendo o produto da cada valor por sua respectiva frequência. Portanto a
média para esta distribuição é:

Acrescentamos uma quarta coluna contendo os desvios e uma quinta


coluna contendo os quadrados dos desvios.

Observe que no cálculo da variância precisamos da soma de todos os


quadrados dos desvios, que neste caso são 40 quadrados e não 8. Portanto
NÃO BASTA SOMAR OS VALORES DA QUARTA COLUNA. Acrescentamos
uma sexta coluna contendo o produto de cada quadrado pela respectiva
frequência. A soma dos valores desta coluna é que será usada no cálculo da
variância.

Portanto a variância para esta distribuição de pesos é dada por

Variância

49
EXEMPLO
CONFIRA MAIS UM EXEMPLO DE DISTRIBUIÇÕES DE FREQUÊNCIA

A tabela 46 apresenta a distribuição de frequências em classes das


notas de 70 alunos. Novamente convém estender esta tabela
acrescentando novas colunas com valores a serem utilizados para cálculo
da média e da variância. Obtemos a tabela 47 onde a terceira coluna
contém os pontos médios das classes e a quarta coluna contém os
produtos de cada ponto médio por sua respectiva frequência. A média
para a distribuição da tabela 46 é então

TABELA 46: NOTAS DE 70 ALUNOS.

A quinta coluna da tabela 47 contém o desvio de cada ponto médio e


a sexta coluna contém o quadrado de cada desvio.

TABELA 47: NOTAS DE 70 ALUNOS (TABELA ESTENDIDA).

Finalmente acrescentamos uma sétima coluna contendo o produto


do quadrado de cada desvio por sua respectiva frequência. A variância
para a distribuição da tabela 46 será então dada por

Variância

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

50
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 04: DESVIO PADRÃO

O fato de trabalharmos com os quadrados dos desvios, no cálculo da


variância, cria um descompasso entre a medida obtida (variância) e as
unidades de medida do conjunto. Por exemplo: se as medidas do conjunto
são alturas e estão em centímetro (cm), então a unidade de medida da
variância é centímetro ao quadrado (cm2). Para correção deste fato
introduzimos o desvio padrão, que é definido como a raiz quadrada da
variância. Desta forma a unidade de medida do desvio padrão é a mesma
unidade de medida dos valores do conjunto.

O desvio padrão (DP) é a raiz quadrada da variância.

Desta forma temos:

O desvio padrão das notas da equipe A é DP = √0 = 0

O desvio padrão das notas da equipe B é DP = √ 0,5 = 0,707

O desvio padrão das notas da equipe C é DP = √ 3,25 = 1,803

O desvio padrão das notas da equipe D é DP = √ 7,75= 2,784

O desvio padrão das alturas do Grupo 1 é DP = √ 7,75 = 2,784

O desvio padrão das alturas do Grupo 2 é DP = √ 14,75 = 3, 841

O desvio padrão para os pesos dos 40 alunos da tabela 44 é DP = √ 3,94 =


1,985

O desvio padrão para os pesos dos 70 alunos da tabela 46 é DP = √ 4,99 =


2,234

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

51
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 05: COEFICIENTE DE VARIAÇÃO RELATIVO

Os dois conjuntos abaixo contêm as idades de dois grupos de pessoas

Grupo de Crianças: 4; 5; 6; 6; 6; 7; 8.
Grupo de Adultos: 53; 54; 55; 55; 55; 56; 57.

A média de idade do grupo de crianças é 6


anos e a média de idade do grupo de adultos é

55 anos.

Portanto a variância e o desvio padrão das idades do grupo de crianças


são respectivamente

Variância 1,43 e DP 1,195, e a

variância e o desvio padrão das idades do grupo de adultos são


respectivamente

Variância 1,43 e DP 1,195.

Portanto temos dois grupos distintos com a mesma variância e


consequentemente mesmo desvio padrão, ou seja, os dois grupos têm a
mesma dispersão. Mas, observando a natureza dos grupos podemos ver que
uma diferença de 4 anos no grupo de crianças tem muito mais relevância do
que uma diferença de 4 anos nas idades do grupo de adultos. As diferenças
físicas entre duas crianças de 4 e 8 anos são muito mais visíveis do que as
diferenças físicas entre dois adultos de 53 e 57 anos. Estes detalhes não são
capitados pela variância, pois esta medida leva em conta apenas os desvios
dos conjuntos de dados, e não leva em conta as dimensões das grandezas
envolvidas. Para corrigir este fato definimos o coeficiente de variação
relativo (CVR) como sendo a razão entre o desvio padrão e a média. O
coeficiente de variação relativo para as idades do grupo de crianças é

CVR 0,199 = 19,9%.

O coeficiente de variação relativo para as idades do grupo de adultos é


CVR 0,021 = 2,1%.

Como efetuamos uma divisão do desvio padrão pela média, o coeficiente


de variação relativo reflete a relação entre a variação nos dados de um
conjunto e as dimensões das grandezas envolvidas e, escrevendo em forma
de percentagem, o temos como uma percentagem da média: no grupo das
crianças é 19,9% da média e no grupo dos adultos é 2,1% da média. Isto nos
diz que a dispersão relativa no grupo de crianças é maior que a dispersão
relativa no grupo de adulto, o que já era esperado por causa das observações
anteriores. Quando as dimensões dos dados envolvidos são relevantes,

52
principalmente para efeito de comparação de variações, a medida de
dispersão a ser utilizada deve ser o coeficiente de variação relativo.

O coeficiente de variação relativo (CVL) e a razão entre o desvio


padrão e a média.

CRV 100%.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

53
INTRODUÇÃO À ESTATÍSTICA
AULA 05: MEDIDAS DE DISPERSÃO

TÓPICO 06: APLICAÇÕES DO DESVIO PADRÃO

Na definição da variância e do desvio padrão, a inspiração foi usar o fato


de que a dispersão de um conjunto de valores é grande quando estes
encontram-se muito espalhados em torno de um valor central e, a dispersão
é pequena, quando todos os valores encontram-se próximos de um valor
central. Podemos dizer agora que, se o desvio padrão de um conjunto de
valores é pequeno então tais valores encontram-se distribuídos muito
próximos da média e, se o desvio padrão é grande, então os valores
encontram-se espalhados com respeito a média, isto é, possivelmente não
todos mas uma boa parte dos valores estão razoavelmente distantes da
média.

As observações anteriores são expressas de forma mais precisa através


do teorema enunciado a seguir e devido ao matemático russo P. L.
Chebyshev (1821-1894).

Para qualquer conjunto de dados numéricos e para qualquer


constante c maior que 1, pelo menos

dos valores do conjunto estão situados entre os valores

onde DP é o desvio padrão do conjunto.

Tal resultado é conhecido como TEOREMA DE CHEBYSHEV.Vejamos


agora uma aplicação.

EXEMPLO
Suponha que um conjunto de valores tem média 42 e desvio padrão
2,5. Então, usando c = 2, concluímos que pelo menos

dos valores do conjunto estão entre os números

Usando agora c = 3, podemos dizer que pelo menos

dos valores do conjunto estão entre os números

42−3×2,5 = 34,5 e 42+3×2,5 = 49,5.

54
O Teorema de Chebyshev nos dá informação sobre a localização dos
valores de um conjunto em torno da média e aplica-se a qualquer coleção de
dados. Ele afirma que pelo menos uma parte dos valores estão situados
dentro de uma região. Na prática percebe-se que, em geral, a quantidade de
valores situados dentro dos limites especificados é bem maior do que a
percentagem estabelecida pelo Teorema de Chebyshev. De fato, podemos
afirmar em geral que, dado um conjunto.

• cerca de 68% dos seus valores estão entre os números

• cerca de 95% dos seus valores estão entre os números

• cerca de 99,7% dos seus valores estão entre os números

Tais resultados são empíricos pois são verificados na prática, ao


contrário do Teorema de Chebyshev, o qual possui uma demonstração
matemática rigorosa e que não será dada neste texto devido ao nível de
matemática necessário a sua demonstração.

Como aplicação suponha agora que a média das notas de todos os


alunos de uma classe é 6,5 e que o desvio padrão do conjunto de notas foi 2.
Então podemos afirmar, com base nos resultados empíricos, que cerca de
68% dos alunos tiraram nota entre 4,5 e 8,5 e cerca de 95% dos alunos
tiraram nota entre 2,5 e 10,0 (Admitindo que não existe nota superior a 10).

EXERCITANDO
Em 12 dias uma escola registrou o seguinte número de faltas

Manhã: 23; 24; 18; 19; 21; 25; 26; 19; 20; 22; 17; 19.

Tarde: 14; 15; 13; 16; 16; 17; 18; 11; 14; 15; 15; 17.

Qual turno apresenta maior dispersão relativa no número de faltas?

FÓRUM
Discuta, no Fórum da Aula 5, com os colegas ou com o professor
tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 5. Lembre
que sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe o
arquivo dos exercícios-1 (questões: 5, 9 e 10) (Visite a aula online para
realizar download deste arquivo.) e exercícios 2 (questões: 2 e 5) (Visite a
aula online para realizar download deste arquivo.). Resolva a quantidade
máxima de exercícios que puder, individualmente ou em grupo. Os
exercícios exercícios-1 (questões: 5, 9 e 10) (Visite a aula online para
realizar download deste arquivo.) e exercícios 2 (questões: 2 e 5) (Visite a

55
aula online para realizar download deste arquivo.)da aula 5 são as
respectivas questões do trabalho dessa aula a ser postado no Portfólio
Individual do ambiente Solar.”

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

56
INTRODUÇÃO À ESTATÍSTICA
AULA 06: ÍNDICES

TÓPICO 01: PERCENTAGEM

Atualmente é bastante comum o uso de índices (em particular


percentagens) para indicar as características populacionais de uma região,
indicar a evolução dos dados econômicos, entre outras aplicações. Neste
capítulo daremos algumas dicas de como alguns desses índices são
calculados.

Nesta seção faremos uma revisão sobre percentagem, veremos qual o


seu significado, como calcular percentagem de um determinado valor e como
representar um valor como uma percentagem de um outro valor.

Primeiro devemos entender que:

Uma percentagem é nada mais nada menos que uma fração.

Tome por exemplo 25%, que lê-se vinte e cinco por cento e que é a
fração com numerador 25 e denominador 100 (razão por que se diz por
cento), ou seja

e também

Desta forma temos:

CLIQUE AQUI PARA VER ALGUNS EXEMPLOS

Como o cálculo de percentagens é uma multiplicação de frações,


podemos utilizar todas as regras de simplificação que são possíveis para
obter o produto de duas frações.

1.1 VALOR RELATIVO E VALOR ABSOLUTO

57
Uma percentagem, sendo uma fração, é um valor relativo. Quando
dizemos que 75% dos alunos de uma classe tem mais de 15 anos de
idades, não estamos dando o número de alunos com mais de 15 anos (valor
absoluto). Para descobrir o número de alunos com mais de 15 anos
precisamos saber qual o número total de alunos da classe. Supondo que a
classe tem 48 alunos então a quantidade de alunos com idade superior a 15
anos é

Perceba então a distinção entre

Até agora em todos os exemplos citados nos foi dado o valor relativo
(percentagem) e foi calculado o valor absoluto. Veremos agora como fazer o
contrário: calcular o valor relativo a partir do valor absoluto. Primeiro
vejamos como transformar um fração ordinária em uma percentagem,
digamos 2/5. É simples, basta observar que um número não se altera
quando o multiplicamos e o dividimos por 100 (ou por qualquer outro
número).

Sendo assim temos

Analogamente temos:

CLIQUE AQUI PARA VER ALGUNS EXEMPLOS

Refletindo bem a respeito das contas anteriores concluímos que para


transformar qualquer número em percentagem basta multiplicar por 100 e
colocar no final o sinal %.
Assim temos
58
1.2 CÁLCULO DE VALOR RELATIVO

Em muitas ocasiões o valor relativo é mais importante do que o valor


absoluto. Considere um exemplo de duas cidades onde a primeira tem uma
população de 8.000 habitantes, sendo que 4.500 desses estão alfabetizados,
e a segunda tem uma população de 20.000 habitantes, sendo que 7.500
desses estão alfabetizados. Em valores absolutos a segunda cidade tem mais
pessoas alfabetizadas do que a primeira. Entretanto a fração das pessoas
alfabetizadas na primeira cidade é (dividindo a parte pelo todo)

e a fração das pessoas alfabetizadas na segunda cidade é

Portanto na área de educação a primeira cidade tem, em termos


relativos, um desempenho melhor do que a segunda cidade. Mais da metade
da população da primeira cidade está alfabetizada enquanto menos da
metade da população da segunda cidade está alfabetizada.

É um fato que, em termos de indicadores sociais, os valores relativos são


mais importantes do que os valores absolutos.

Vejamos um outro exemplo:

VEJA

Em uma escola com 640 alunos, 224 alunos estudam pela manhã, 240
estudam à tarde e 176 estudam à noite. Portanto a fração dos alunos da
escola que estudam pela manhã é

a fração dos alunos que estudam à tarde é

e a fração dos alunos que estudam à noite é

Portanto 35% dos alunos desta escola estudam pela manhã, 37,5%
estuda à tarde e o estante, 27,5%, estuda à noite.

59
A tabela a seguir apresenta o desempenho de quatro escolas no
vestibular. Qual a percentagem e aprovação de cada escola? Qual escola
obteve melhor desempenho relativo?

Calculando a fração de aprovados para cada escola temos:

• percentagem de aprovados da escola A:

• percentagem de aprovados da escola B:

• percentagem de aprovados da escola C:

• percentagem de aprovados da escola D:

Em valores absolutos a escola que aprovou mais alunos foi a escola A,


mas a que teve melhor desempenho, em valores relativos, foi a escola D.

FONTES DAS IMAGENS


1. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

60
INTRODUÇÃO À ESTATÍSTICA
AULA 06: ÍNDICES

TÓPICO 02: OUTROS ÍNDICES

2.1 ÍNDICE DE EVASÃO ESCOLAR


Um índice bastante importante no âmbito da educação de um
município, estado ou país é o índice de evasão escolar, que é sempre
utilizado como uma das medidas de eficiência de um determinado sistema de
ensino.

Para calcular o índice de evasão escolar em um determinado período,


fazemos a diferença entre o número de estudantes matriculados no início do
período e o número de estudantes que efetivamente estão presentes em sala
de aula no final deste período, isto nos dá o número de estudantes que
abandonaram a escola no período. Dividimos a diferença pelo total de alunos
matriculados no início. O resultado é o índice de evasão escolar.

Vejamos um exemplo.

EXEMPLO
Suponha que um município tem 2435 alunos matriculados no ensino
fundamental no início do ano 2000. No final do ano 2000 verificou-se que
o total de alunos que efetivamente concluíram o período foi de 2138
alunos. O índice de evasão escolar em 2000 será então

Veja que 297 é o número de estudantes que abandonaram a escola.


Este valor corresponde a 12,19% do número de estudantes matriculados
no início do ano.

2.2 ÍNDICE RELATIVO DE PREÇO

O índice relativo de preço de um produto é a razão entre o preço do


produto em determinado instante e o preço do produto em um instante
base. Multiplicando esta razão por 100 temos o índice relativo de preço em
percentagem.

A tabela 48 mostra os preços de um produto fictício no período de 1997


Fonte [1]
a 2001.

61
Tomando como base o ano de 1998 temos que o índice relativo de preços
do produto A

em 1997 é igual a = 99,25%

em 1998 é igual a x 100% = 100%

em 1999 é igual a x 100% = 102,97%

em 2000 é igual a x 100% = 120,14%

em 2001 é igual a x 100% = 153,41%

Podemos assim montar a tabela 49 com os preços e o índice relativo de


preços do produto A.

TABELA 49: PREÇOS E ÍNDICE RELATIVO DE PREÇOS DO PRODUTO


A NO PERÍODO DE 1997 A 2001.

EXERCITANDO
Um produto é vendido por apenas três empresas em um determinado
mercado. Em certo ano, para um total de 18.000 unidades vendidas,
tivemos a seguinte distribuição das vendas.

EMPRESAS A B C

UNIDADES 7.200 4.800 6.000


VENDIDAS

Encontre a distribuição percentual de vendas.

FÓRUM
Discuta, no Fórum da Aula 6, com os colegas ou com o professor
tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 6. Lembre
que sua participação no Fórum vale presença e nota de avaliação.

ATIVIDADE DE PORTFÓLIO
Vá para a seção Material de Apoio do ambiente SOLAR e baixe o
arquivo dos exercícios-1 (questões: 2, 4 e 7) e exercícios 2 (questões: 1 e 2)

62
da aula 6 (Visite a aula online para realizar download deste arquivo.) para
abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de
exercícios que puder, individualmente ou em grupo. . Os exercícios
exercícios-1 (questões: 2, 4 e 7) e exercícios 2 (questões: 1 e 2) da aula 6
(Visite a aula online para realizar download deste arquivo.) correspondem
ao trabalho desa aula que deve ser postado no Portfólio Individual no
período marcado na Agenda do ambiente SOLAR, num único documento
de texto (doc, docx ou pdf) ou manuscrito e escaneado.”

FONTES DAS IMAGENS


1. http://moacirbarros.files.wordpress.com/2010/01/preco_e_valor1.gif
2. http://www.denso-wave.com/en/

Responsável: Prof. Arnoldo Nunes da Silva


Universidade Federal do Ceará - Instituto UFC Virtual

63