Você está na página 1de 97

UNIVERSIDADE COMUNITÁRIA DA REGIÃO DE CHAPECÓ

UNOCHAPECÓ

CURSO DE CIÊNCIA DA COMPUTAÇÃO

DISCIPLINA: ESTATÍSTICA

Prof.:Fernando Tosini

Chapecó - SC
Sumário

1 Conceitos Básicos 1

1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 A incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Estatı́stica Aplicada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Abusos da Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Perfil do Estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5 Divisões da Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.6 Métodos Cientı́ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.7 Bioestatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.8 Definições Básicas da Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.8.1 Fenômeno Estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.8.2 População ou Universo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.8.3 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.8.4 Dados Estatı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.8.5 Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.8.6 Estimativas ou Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.7 Dados Primários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.8 Dados Secundários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.9 Estatı́stica Oficiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.10 Estatı́stica Não oficiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.11 Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.8.12 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.8.13 Atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

i
1.9 Natureza da Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.9.1 Variável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.9.2 Observação Importante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.10 Pesquisa Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.10.1 Fases de uma Pesquisa Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.11 Lista de Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 Normas de Construção de Tabelas e Séries Estatı́sticas 21

2.1 Representação Tabular ou Tabelar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1.1 Tabela ou Tabua de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2 Elementos de uma Tabela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3 Arredondamento de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 Séries Estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4.1 Tipos de Séries Estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.5 Lista de Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Organização de Dados em Tabelas 32

3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2 Distribuição de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Outras Formas de Representação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.3.1 Gráficos Comparativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.3.2 Gráficos Pictogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.3.3 Gráficos Cartogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.3.4 Gráfico Polar ou Radar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4 Elementos para uma Distribuição de Freqüência . . . . . . . . . . . . . . . . . . . . . . . 44

3.4.1 Dados Brutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4.2 Rol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4.3 Amplitude de uma Amostra (Aa ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4.4 Classe ou Classe de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.5 Frequência de uma Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.5 Aplicação Envolvendo Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . 47

3.5.1 1◦ Situação: Distribuição de Frequências em Classes Não-Unitárias ou Dados

Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
ESTATÍSTICA Prof. Fernando Tosini

3.5.2 2◦ Situação: Distribuição de Frequências em Classes Unitárias ou Pontual ou

Dados Não Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.6 Lista de Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4 Medidas Descritivas 54

4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2 Medidas de Posição ou Tendência Central . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2.1 Representativas (Médias) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2.2 Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2.3 Dominantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.2.4 Notas importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.2.5 Comparação das Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.3 Medidas de Variabilidade ou Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.3.1 Medidas de dispersão Absoluta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.3.2 Propriedades da Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.3.3 Medidas de dispersão Relativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.4 Lista de Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5 Comportamento em curva de um Histograma 81

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.2 Interpretação de um Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.3 Curva de Frequência − Curva Polida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.3.1 Curva simétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3.2 Curva Assimétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.4 Medidas de Assimetria e Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

5.4.1 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

5.4.2 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.5 Lista de Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

iii
Capı́tulo 1

Conceitos Básicos

Resumo: O objetivo deste capı́tulo é apresentar importantes conceitos de estatı́stica e trabalhar a intuição do

aluno, para que, este raciocine em cima de problemas que são tipicamente solucionados com o uso de técnicas

estatı́sticas.

1.1 Introdução

Para iniciar toda a discussão, primeiramente é necessário conhecer melhor o conceito de estatı́stica.

Hoje em dia, é comum, a mı́dia divulgar estatı́sticas. Diariamente, são divulgadas informações, tais

como:

• − Índices de inflação; • − Produção agrı́cola anual;

• − Taxa de mortalidade; • − Índice de desenvolvimento humano;

• − Proporção de eleitores; • − Dentre outras.

O primeiro cuidado que devemos tomar é distinguir as estatı́sticas (valores numéricos que resu-

mem informações) da Estatı́stica que ganhou status de ciência. Esta distinção, será feita da seguinte

forma, a Estatı́stica como ciência terá sempre a primeira letra maiúscula, enquanto a estatı́stica que

transmite uma informação numérica, será mencionada com a primeira letra minúscula.

Como a definição de Estatı́stica não é única, a primeira definição de Estatı́stica, segundo o di-

cionário Aurélio é:

1
ESTATÍSTICA Prof. Fernando Tosini

Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre

uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou

predições com base nesses dados.

Nesta definição, a Estatı́stica é definida como parte da matemática. Entretanto, a Estatı́stica já se

desenvolveu o bastante para ocupar um campo no cenário cientı́fico como ciência que possui métodos

e técnicas próprias.

Enquanto, o famoso matemático John Tukey, que muito contribuiu para a Estatı́stica, a caracterizou

como:

“É uma ciência e não apenas um ramo da matemática, embora ferramentas da matemática sejam essenciais”.

Em uma pesquisa rápida, é possı́vel encontrar várias definições para Estatı́stica, das quais citaremos

algumas:

“Ciência que procura estabelecer os limites da incerteza”.

“Ciência que coleta, classifica e avalia numericamente fatos que servirão de base para inferência”.

“Ciência da Incerteza”.

Outras definições de conteúdo metafórico são:

“...é a arte de torturar os dados até que eles confessem a verdade”.

“...nada mais é do que o bom senso expresso em números”.

Embora todas as definições apresentadas contenham elementos importantes, a definição de Es-

tatı́stica a ser apresentada neste material é:

Estatı́stica é a ciência que tem por objetivo planejar, coletar, tabular, analisar e interpretar informações e

delas extrair conclusões que permitam a tomada de decisões certas mediante incertezas.

Estatı́stica é um campo dedicado à coleta, ao processamento e à análise de dados, com objetivo de reduzir as

incertezas sobre o que está em avaliação e apresentar os resultados com a menor margem de erro possı́vel.

Na maioria das definições apresentadas, verificamos a presença da palavra incerteza. De fato, o

conceito de incerteza está vinculado à aplicação dos métodos e técnicas de análise estatı́stica.

1.1.1 A incerteza

A incerteza permea várias áreas do conhecimento: fı́sica, ciências sociais, comportamento humano,

economia e ciências naturais. O tratamento quantitativo adequado a incerteza é obtido por meio do

estudo da Teoria das Probabilidades.

A incerteza é consequência da variabilidade de um fenômeno e dificulta a tomada de decisões.

2
ESTATÍSTICA Prof. Fernando Tosini

Considere um simples exemplo da vida cotidiana:

A ida de uma pessoa a uma agência bancária.

Em torno deste fenômeno há uma série de incertezas, por exemplo: a quantidade de pessoas na

fila, o número de atendentes, o tempo de atendimento, as condições do tempo, a cotação da moeda,

etc.

Mesmo que um indivı́duo procure informações prévias sobre todos estes elementos, sob os quais

paira a incerteza, ainda assim não será possı́vel predizer o desfecho. Podemos, por exemplo, analisar

as condições do tempo, obter informações sobre o tráfego, ligar para a agência bancária e, ainda assim,

não conseguimos precisar o horário em que receberemos o desejado atendimento bancário.

1.2 Estatı́stica Aplicada

As aplicações da estatı́stica se desenvolveram de tal forma que, hoje, praticamente todo o campo

de estudo se beneficia da utilização de métodos estatı́sticos. Por exemplo:

• Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de

qualidade;

• Controlam-se doenças com o auxı́lio de análises estátisticas que antecipam epidemias;

• Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatı́sticas

de modificação de tamanho da população;

• Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativas para leis, como

as que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de segurança,

etc.

De acordo com o campo de aplicação, a estatı́stica recebe uma terminologia especializada dentro

dos cursos. Por exemplo.

◦ Biometria ou Bioestatı́stica ◦ Psicometria ◦ Sociometria

◦ Controle de qualidade ◦ Ecomometria ◦ Demografia

◦ Contabilometria ◦ Geoestatı́stica ◦ Estatı́stica engenharia

3
ESTATÍSTICA Prof. Fernando Tosini

1.3 Abusos da Estatı́stica

Não é de hoje que ocorrem abusos com a estatı́stica. Assim é que , há cerca de um século, o estadista

Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatı́sticas”.

Já se disse também que “os números não mentem, mas os mentirosos forjam os números” (Figures

don’t lie; liars figure) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir

qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a estatı́stica “como

um bêbado utiliza um poste de iluminação, para servir de apoio e não para iluminar”. Todas essa

afirmações se referem aos abusos da estatı́stica quando os dados são apresentados de forma enganosa.

Eis alguns exemplos das diversas maneiras como os dados podem ser distorcidos.

◦ Pequenas amostras ◦ Distorções deliberadas

◦ Números imprecisos ◦ Perguntas tendenciosas

◦ Estimativas por suposição ◦ Gráficos enganosos

◦ Porcentagens distorcidas ◦ Pressão do pesquisador

◦ Cifras parciais ◦ Más amostras

1.4 Perfil do Estatı́stico

A formação acadêmica do estatı́stico está fundamentada em conhecimentos de Matemática, Cálculo

e Teoria das Probabilidades, Técnicas e Métodos Estatı́sticos, Computação, Métodos de Análise Estatı́stica e

Disciplinas Prolissionalizantes.

Essa formação acadêmica básica permite ao estatı́stico utilizar técnicas para:

• Efetuar levantamentos e análises de informações;

• Planejar e realizar experimentos e pesquisas em várias áreas cientı́ficas;

• Formular a solução para os mais variados e complexos problemas concernentes à melhoria e

otimização dos mais variados processos.

A exploração das diversas bases de dados estatı́sticos, hoje existentes, requer um profissio-

nal capaz de extrair relevantes informações através do uso de modernas técnicas de amostragem,

modelagem e inferência da Estatı́stica.

4
ESTATÍSTICA Prof. Fernando Tosini

A formação do estatı́stico desenvolve aptidões que lhe permitam solucionar problemas atuando

como um detetive em busca de evidências quantitativas sobre determinados fenômenos.

É preciso, pois:

• Construir uma sólida base de conhecimentos em matemática;

• Incorporar habilidades no uso de computadores;

• Desenvolver uma boa comunicação oral e escrita;

• Estar permanentemente aberto ao aprendizado de novas técnicas e métodos de trabalho;

• Aprender a trabalhar em conjunto com profissionais de diferentes áreas do conhecimento.

1.5 Divisões da Estatı́stica

De modo geral, constuma-se dividir a Estatı́stica em três partes:

• Estatı́stica Dedutiva ou Descritiva: Em geral, se encarrega de descrever o conjunto de dados

desde a elaboração da pesquisa até o cálculo de determinada medida. Pode ser definda, como

um conjunto de técnicas, destinadas para descrever e resumir as principais caracterı́sticas de

um conjunto de dados, afim de que possamos, tirar conclusões a respeito das caracterı́sticas de

interesse.

As principais técnicas de análise da Estatı́stica descritiva são:

i) Tabelas de frequência: Ao dispor de uma lista volumosa de dados, as tabelas de

frequência servem para agrupar informações de modo que estas possam ser analisadas.

As tabelas podem ser de frequência simples(classe unitária) ou de frequência em faixa de

valores (classe não unitária).

ii) Gráficos: O objetivo da representação gráfica é dirigir a atenção do analista para alguns

aspectos de um conjunto de dados. Alguns exemplos de gráficos são: diagrama de barras,

diagrama em setores, histograma, boxplot, ramo-e-folhas, diagrama de dispersão, gráfico

sequencial.

iii) Medidas numéricas: Por meio de medidas ou resumos numéricos, podemos levantar

importantes informações, sobre o conjunto de dados, tais como: medidas de posição (média,

5
ESTATÍSTICA Prof. Fernando Tosini

moda e mediana), medidas de dispersão (Desvio padrão e variância), simetria, valores

extremos, valores discrepantes, etc.

• Probabilidade A teoria de probabilidades nos permite descrever os fenômenos aleatórios, ou

seja, aqueles em que está presente a incerteza.

• Estatı́stica Inferencial ou indutiva: Trabalha com os dados de forma a estabelecer hipóteses em

função desses dados, até chegar à conclusões cientı́ficas. O alicerce das técnicas de estatı́stica

inferencial está no cálculo de probabilidades.

As técnicas mais conhecidas da estatı́stica inferencial são:

i) Técnicas de Amostragem: Estuda métodos para levantar amostras que sejam representa-

tivas da população. As técnicas de amostragem que mais se destacam são: Amostragem

Aleatória Simples, Aleatória Estratificada, por Conglomerados, Sistemática, por Cotas, de

Conveniência.

ii) Estimação: A técnica de estimação consiste em utilizar um conjunto de dados incompletos,

ao qual iremos chamar de amostra, e nele calcular estimativas de quantidades de interesse.

Estas estimativas podem ser pontuais (representadas por um único valor) ou intervalares.

iii) Teste de Hipóteses: O fundamento do teste estatı́stico de hipóteses é levantar suposições

acerca de uma quantidade não conhecida e utilizar, também, dados incompletos para criar

uma regra de escolha. Os testes que se destacam são: Teste t-student, Anova e Qui-

quadrado.

Na sequência, será apresentada duas situações reais, que usam a técnicas de resolução da Estatı́stica

inferencial.

Exemplo 1.1 Um instituto de pesquisa deseja estimar a proporção de eleitores do partido de situação no primeiro

turno das eleições presidenciais. Ao coletar uma amostra de 1200 eleitores, a proporção foi estimada em 54%.

No Exemplo 1.1, a quantidade a ser estimada é a proporção de eleitores que votarão no partido

de situação nas eleições presidenciais. Somente a realização das eleições revelará esta quantidade.

Entretanto, estimá-la, com base em uma amostra, auxilia a tomada de decisões tais como a alteração

de uma estratégia de campanha polı́tica.

6
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 1.2 Em uma fábrica de parafusos, a peça é considerada dentro da especificação caso seu comprimento

esteja no intervalo entre 4,8 cm e 5,2 cm. Os técnicos de controle de qualidade selecionam diariamente 100

parafusos fabricados e calculam o comprimento médio. Conhecendo a variabilidade nos tamanhos dos parafusos

fabricados, caso o comprimento médio esteja abaixo de 4,8 cm ou acima de 5,2 cm, o processo será interrompido.

No Exemplo 1.2, espera-se que o comprimento médio de um conjunto de parafusos amostrados

esteja dentro de um intervalo. Caso isto não ocorra, o processo de produção sofre uma interrupção.

Neste caso, a estatı́stica inferencial é utilizada para criar uma regra de decisão com base em observações

de um subconjunto de 100 peças.

1.6 Métodos Cientı́ficos

Desde a antigüidade o homem fez descobertas que o levaram a desenvolver muitos dos conhe-

cimentos que hoje temos. Naquela época, não se aplicavam métodos, as descobertas eram feitas por

acaso ou necessidades práticas. Atualmente, quase todo o acréscimo de conhecimento se dá por

aplicações de métodos de observação e estudo. Mesmo que muito desse conhecimento tenha sido

adquirido por acaso, o seu desenvolvimento se deu com base em métodos muito bem estudados e

caracterizados, denominados métodos cientı́ficos.

Existem dois métodos cientı́ficos a destacar:

• O Experimental: Geralmente ocorre em laboratório, e é o mais usado nas ciências. É um

método, onde o pesquisador mantém as variáveis do estudo constantes, menos uma, sendo esta

modificada para se observar qual o resultado que ela apresenta no estudo. Por exemplo, para

fazer café, você usa 1/2 litro de água, 3 colheres de café, um coador, 4 colheres de açúcar. Se você

repetir esta receita diversas vezes é em provavél que todas as vezes você tenha o mesmo tipo de

resultado. Todavia, se for alterado algum dos fatores, como aumentar quantidade de água por

exemplo o café ficará mais aguado, se aumentar o açúcar, ficará mais doce e assim por diante.

• O Estatı́stico: Esse método é o mais usado pela estatı́stica, nele é impossı́vel manter as causas

ou fatores constantes, neste caso, deve-se admitir todos os valores dessas variáveis e analisá-los,

procurando determinar qual é a influência que cada fator apresenta no resultado final. Por

exemplo, uma empresa teve uma queda nas vendas no mês de julho. Os estudos indicam que

este mês foi férias escolares, aumentou o fluxo de turistas na região, porém foi mais frio, nosso

7
ESTATÍSTICA Prof. Fernando Tosini

concorrente baixou o preço dele, nosso produto perdeu em qualidade. Qual desses fatores

poderia ter feito as vendas dessa empresa cair?

1.7 Bioestatı́stica

Bioestatı́stica é a estatı́stica aplicada nos campos relacionados a saúde. Dentro da medicina,

especificamente, pode ser entendida em dois ambiente:

i) O primeiro referente ao levantamento de informações, como registro de doenças, surtos, epide-

mias, habitação, educação etc. Esse ambiente denomina-se de Ambiente Macro, porque se refere

a execução de ações da Saúde Pública.

ii) O segundo ambiente refere-se à elaboração de experiências e pesquisa cientı́fica, tais como testes

de vacinas, avaliação terapêutica, testes de medicamentos etc. Esse ambiente denomina-se de

Ambiente Micro, porque tem a ver com o pesquisa laboratorial e cientı́fica, relacionada as disciplinas

de Imunologia, Fisiologia e Farmacologia.

1.8 Definições Básicas da Estatı́stica

A seguir, apresentamos algumas definições importante da Estatı́stica.

1.8.1 Fenômeno Estatı́stico

Fenômeno Estatı́stico é qualquer evento ou acontecimento que se pretenda analisar, cujo estudo

seja possı́vel a aplicação do método estatı́stico. São divididos em três grupos:

• Fenômenos de massa ou coletivos: São aqueles que não podem ser definidos por uma simples

observação. Exemplos: A taxa de natalidade em Chapecó.

• Fenômenos individuais: São aqueles que compõe os fenômenos de massa. Exemplo: Cada

nascimento em Chapecó.

• Fenômenos de multidão: Quando as caracterı́sticas observadas para a massa, não se verificam

para o particular.

8
ESTATÍSTICA Prof. Fernando Tosini

1.8.2 População ou Universo

População é o conjunto de elementos (valores, pessoas, medidas etc) que tem pelo menos uma

caracterı́stica em comum. A população pode ser finita ou infinita.

• Finita: Apresenta um número limitado de observações (elementos), que é passı́vel de contagem.

Exemplo: Os acadêmicos que estudam na Unochapecó.

• Infinita: Apresenta um número ilimitado de observações (elementos), que é impossı́vel de

contar. Geralmente está associada a processos. Exemplos: Uma colônia de bactérias; O número

de vezes que se pode jogar um dado.

1.8.3 Amostra

Amostra é um subconjunto de elementos extraı́dos de uma população, apartir de uma série

de critérios que garantam sua representatividade. Por exemplo, se consideremos a população os

acadêmicos da unochapecó, então, os acadêmicos do Curso de Ciência da Computação é uma amostra.

Note:

Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma

irá depender do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor

do que 5% ela é considerada infinita, se a freqüência relativa for maior do 5% ela é considerada

finita.

1.8.4 Dados Estatı́sticos

Dado estatı́stico é qualquer caracterı́stica que possa ser observada ou medida de alguma maneira.

Esses dados são chamados de matérias-primas da estatı́stica, sobre a qual serão aplicados os métodos

estatı́sticos. Por exemplo, o conjunto de notas da primeira avaliação da disciplina de estatı́stica da

terceira fase do curso de de Engenharia X.

1.8.5 Parâmetros

Parâmetro é uma medida numérica que descreve uma caracterı́stica de uma população. Por

exemplo, a média ou desvio padrão do conjunto de todas as notas do curso de Engenharia X.

9
ESTATÍSTICA Prof. Fernando Tosini

1.8.6 Estimativas ou Estimadores

Estimativas é um valor aproximado do parâmetro, que é calculado em cima de uma amostra.

1.8.7 Dados Primários

Dados primários são dados coletados pelo próprio pesquisador e sua equipe.

1.8.8 Dados Secundários

Dados secundários são dados que não foram obtidos pelo pesquisador e sua equipe e sim por

institutos de pesquisa como IBGE (Instituto Brasileiro de Geografia e Estatı́stica), DATASUS (Banco

de dados do Sistema Único de Saúde), ...).

1.8.9 Estatı́stica Oficiais

São estatı́sticas coletadas, tratadas e divulgadas por órgãos do governo (IBGE- Instituto Brasi-

leiro de Geografia e Estatı́stica) que, em princı́pio seguem diretrizes aceitas internacionalmente, a

respeito de padrões de despesas, salários, emprego, importação, exportação, caracterı́sticas sociais,

levantamento demográfico, etc...

1.8.10 Estatı́stica Não oficiais

São organizações semigovernamentais e privadas que ocupam espaço no mercado de informação.

Por exemplo: FGV - Fundação Getúlio Vargas, DIEESE - Departamento Intersindical de Estatı́stica e

Estudos Socioeconômicos, IBOPE - Instituto Brasileiro de Opinião Pública e Estatı́stica.

10
ESTATÍSTICA Prof. Fernando Tosini

1.8.11 Censo

O censo ou recenseamento demográfico é um estudo estatı́stico (ou uma coleção de dados) refe-

rente a todos os elementos de uma populacão, que possibilita o recolhimento de várias informações,

tais como o número de homens, mulheres, crianças e idosos, onde e como vivem as pessoas. Esse

estudo é realizado, normalmente, de dez em dez anos, na maioria dos paı́ses.

1.8.12 Amostragem

Amostragem é o processo de retirada de informações dos “n” elementos amostrais de uma

população, no qual deve seguir um método criterioso e adequado determinado pelo tipos de amos-

tragem.

1.8.13 Atributos

São dados estatı́sticos apresentam um caráter qualitativo, o levantamento e os estudos necessários

ao tratamento desses dados são designados genericamente de estatı́stica de atributo.

1.9 Natureza da Estatı́stica

1.9.1 Variável

Variável é a caracterı́stica de interesse que é medida em cada indivı́duo da amostra ou população,

podendo ter resultados numéricos ou não. Seus valores variam de indivı́duo a indivı́duo. Por

exemplo, a idade, a cor, o sexo, o tipo sanguı́neo, o nı́vel de hemoglobina no sangue, etc.

As variáveis podem ser classificadas em quantitativas e qualitativas.

• Variável Quantitativa: São aquelas que são numericamente mensuráveis. Por exemplo, a idade,

a altura, o peso.

Estas ainda se subdividem em:

– Variável Quantitativa Contı́nua: São aquelas que assumem valores dentro de um conjunto

contı́nuo, tipicamente os números reais. Geralmente são resultados de medidas.

Exemplos: o peso, a altura, o tempo, a pressão arterial, idade.

11
ESTATÍSTICA Prof. Fernando Tosini

– Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito

ou enumerável, tipicamente números inteiros. Geralmente são resultados de contagens.

Exemplos: o número de filhos de uma pessoa, o número de cigarros fumados por dia.

• Variável Qualitativa: São aquelas que se baseiam em qualidades ou atributos e não podem ser

mensuráveis numericamente.

Estas ainda se subdividem em:

– Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem.

Exemplos: a escolaridade (1◦ , 2◦ , 3◦ grau), o estágio da doença (inicial, intermediário, termi-

nal), mês de observação (janeiro, fevereiro,..., dezembro), o peso (pouco pesados, pesados,

muito pesados).

– Variável Qualitativa Nominal: São aquelas que não podem ser ordenadas.

Exemplos: a cor dos olhos, o local de nascimento, o sexo, fumante/não fumante, do-

ente/sadio.

Esquematizando:

 

 


 


 
 Contı́nua

 





 Quantitativa 


 


 


 

 Discreta






Variável 







 

 


 


 
 Ordinal

 





 Qualitativa 



 


 

 
Nominal

1.9.2 Observação Importante

Destacamos duas importantes observação.

1. Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.

Exemplos:

12
ESTATÍSTICA Prof. Fernando Tosini

• A variável idade, medida em anos completos, é quantitativa contı́nua; mas, se for informada

apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), torna-se qualitativa ordinal.

• O peso dos lutadores de boxe, uma variável quantitativa contı́nua, se trabalhamos com o

valor obtido na balança, mas torna-se qualitativa ordinal se o classificarmos nas categorias

do boxe (peso-pena, peso-leve, peso-pesado, etc.).

2. Outro ponto importante é que nem sempre uma variável representada por números é quantita-

tiva.

Exemplos:

• O número do telefone de uma pessoa, o número da casa, o número de sua identidade.

• Às vezes o sexo do indivı́duo é registrado na planilha de dados, como 1 se macho e 2 se

fêmea, isto não significa que a variável sexo passou a ser quantitativa.

Exemplo 1.3 Classifique as variáveis apresentadas na tabela:

Tabela 1.1: Classificação de variáveis

Idade Sexo Hemoglobina Tipo de Urticária Duração

34 Masculino 14.2 Fı́sica Curta

58 Masculino 14.4 Fı́sica Longa

31 Femenino 15.1 Idiopática Média

49 Masculino 10.9 Idiopática Média

39 Femenino 14.4 Fı́sica Longa

33 Masculino 14.1 Fı́sica Curta

35 Femenino 14.0 Idiopática Longa


Fonte: Internet

A idade e a quantidade de hemoglobina são variáveis quantitativas contı́nuas, enquanto o sexo

e o tipo de urticária pertencem ao grupo das variáveis qualitativas nominais, e por fim o tempo de

duração pertence ao grupo de variáveis qualitativas ordinais.

13
ESTATÍSTICA Prof. Fernando Tosini

1.10 Pesquisa Estatı́stica

É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou

Amostragem.

1.10.1 Fases de uma Pesquisa Estatı́stica

Uma pesquisa estatı́stica abrange as seguintes fases:

1◦ Definição do Problema: Definir ou formular corretamente o objeto de pesquisa, ou seja, saber

extamente o que se pretende pesquisar.

2◦ Planejamento: Determinar o procedimento necessário para resolver o problema e em especial,

como levantar informações sobre o assunto de estudo. (Elaboração do questionário, tipo de levanta-

mento (censo ou amostra), cronograma de execução, exame das informações disponı́veis, orçamento,

etc).

3◦ Coleta dos Dados: É uma fase operacional. Trata da coleta e registro sistemático de dados, com

um objetivo determinado. Nesta fase, define-se o tipo de coleta:

• Coleta Direta : Quando a coleta é realizada diretamente da fonte. Exemplos, registros de

nascimentos, casamentos, óbitos, importação, exportação, produção agrı́cola, etc. A coleta

direta é classificada de acordo com a forma em que os dados formaram coletados; em:

i) Coleta contı́nua: Os dados são coletados ininterruptamente, automaticamente e na

vigência de um determinado perı́odo. Exemplos, registros de nascimento, óbitos, casa-

mentos, etc.

ii) Coleta periódica: Quando é realizada em perı́odos curtos, determinados de tempo em

tempo. Exemplos, censo demográfico, pesquisa anual do comércio, pesquisa agrı́cola

municipal, censo escolar, etc.

iii) Coleta ocasional: Realizada para atender uma situação ou uma emergência. Exemplos,

casos fatais em um surto epidêmico (febre amarela, dengue, gripe H1N1).

• Coleta Indireta : É feita por deduções a partir dos elementos conseguidos pela coleta direta,

por analogia, por avaliação, indı́cios ou proporcionalização, ou seja, feita através de outras

fontes. Exemplos: Balança comercial, Produtividade, Taxa de mortalidade infantil, etc.

14
ESTATÍSTICA Prof. Fernando Tosini

Os dados podem ser obtidos pela própria pessoa(primários) ou se baseia no registro de tercei-

ros(secundários).

4◦ Crı́tica dos Dados: Objetiva identificar possı́veis falhas, no levantamento dos dados, a fim de

não cometer erros grosseiros no resultado que possam influenciar os resultados.

5◦ Apuração dos Dados ou Sumarização: Significa fazer a contagem e agrupamento dos dados

em tabelas, mediante os critérios de classificação adotados.

6◦ Apresentação dos Dados: É a fase no qual mostra-se os resultados obtidos na coleta e na

organização. Há duas formas de apresentação: A apresentação tabular, ou seja, é uma apresentação

numérica dos dados em linhas e colunas distribuı́das de modo ordenado, segundo regras práticas

fixadas pelo Conselho Nacional de Estatı́stica. A apresentação gráfica dos dados numéricos, constitui

uma apresentação geométrica, permitindo uma visão rápida e clara do fenômeno.

7◦ Análise e Interpretação dos Dados: A última fase do trabalho estatı́stico é a mais importante e

delicada. A análise das informações é feita por meio de comparações percentuais, gráficos ou ainda

por cálculo de medidas, coeficientes, ou testes estatı́sticos.

Exemplo 1.4

Esta questão tem por objetivo conhecer o perfil dos acadêmicos do Curso de Ciência da Computação.

Cabeçalho: Genero: ( ) Masculino ( ) Feminino

Idade: ( ) menor que 20 anos ( ) 20 anos ou mais

6.1) Porque optou pela Uno?

a) Localização c) Qualidade de ensino e) Outro motivo

b) Pouca concorrência d) Status da universidade

6.2) Porque optou por Ciência da computação?

a) Afinidade com o curso c) Baixo custo e) Outro motivo

b) Campo de trabalho d) Falta de opção

6.3) Já atua no campo da Computação?

a) Sim b) Não

15
ESTATÍSTICA Prof. Fernando Tosini

Tabela 1.2: Resultados

Perg. Resp. Masculino Feminino Total

-20 +20 Total -20 +20 Total -20 +20 Total

6.1) b

6.2) b

6.3) a

Fonte: Autor

16
ESTATÍSTICA Prof. Fernando Tosini

1.11 Lista de Exercı́cios

1. O que é, e para que serve a Estatı́tica?

2. Explique o princı́pio da incerteza, e dentro de que teoria é bastante estudada?

3. Cite exemplos alguns práticos, onde podemos aplicar os métodos estatı́sticos?

4. Defina a onde a estatı́stica é aplicada de acordo com a terminologia.

(a) Biometria (c) Psicometria

(b) Contabilometria (d) Demografia

5. Cite as três divisões da Estatı́stica e explique-as?

6. Cite os dois métodos estatı́sticos cientı́ficos e explique-os?

7. O que é um fenômeno estatı́stico?

8. Qual a diferença entre população e amostra?

9. Qual a diferença entre parâmetro e estimativa?

10. Qual a diferença entre dados primários e secundários?

11. Dê o significado das siglas IBGE, DATASUS e IBOPE? Qual a função de cada um?

12. Qual a diferença entre censo e amostragem?

13. O que é atributo?

14. Qual a diferença entre dados estatı́sticos e variável?

15. Explique a diferença entre variável quantativa contı́nua de variável quantativa discreta?

16. Explique a diferença entre variável qualitativa ordinal de variável qualitativa nominal?

17. Classifique os dados, quanto a tempo em contı́nua ou periódica ou ocasional.

(a) Inflação e desemprego.

(b) Censo.

(c) Pesquisa de mercado ou eleitoral.

17
ESTATÍSTICA Prof. Fernando Tosini

18. População ou Universo é:

(a) Um conjunto de pessoas

(b) Um conjunto de elementos quaisquer

(c) Um conjunto de pessoas com uma caracterı́stica comum

(d) Um conjunto de elementos com pelo menos uma caracterı́stica em comum

(e) Um conjunto de indivı́duo de um mesmo municı́pio, estado ou paı́s

19. Uma parte da população retirada para analisá-la denomina-se:

(a) Universo

(b) Parte

(c) Pedaço

(d) Dados Brutos

(e) Amostra

20. A parte da estatı́stica que se preocupa somente com a descrição de determinadas caracterı́sticas

de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:

(a) Estatı́stica de População

(b) Estatı́stica de Amostra

(c) Estatı́stica Inferecial

(d) Estatı́stica Descritiva

(e) Estatı́stica Grupal

21. Parâmetro é:

(a) Um conjunto numérico

(b) Uma medida numérica que descreve uma caracterı́stica de uma população

(c) Um conjunto de dados coletados pelo pesquisador e sua equipe

(d) Um conjunto de dados que não são coletados pelo pesquisador e sua equipe

(e) É uma medida numérica que descreve várias caracterı́stica de uma popu- lação

18
ESTATÍSTICA Prof. Fernando Tosini

22. Classifique as seguintes variáveis.

I) Cor dos olhos. V) Tipo sanguı́neo.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

II) Peso de um indivı́duo. VI) Fator RH.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

III) Nı́veis de peso de um lutador. VII) Nı́vel social de famı́lias.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

IV) Raça. VIII) Religião.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

19
ESTATÍSTICA Prof. Fernando Tosini

IX) Estado civil. XII) Causa de morte.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

X) Grau de escolaridade. XIII) Quantidade de álcool engerido.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

XI) Dias da semana. XIV) Número de mortos no trânsito.

(a) Qualitativa ordinal (a) Qualitativa ordinal

(b) Qualitativa nominal (b) Qualitativa nominal

(c) Quantitativa contı́nua (c) Quantitativa contı́nua

(d) Quantitativa discreta (d) Quantitativa discreta

(e) Qualitativa contı́nua (e) Qualitativa contı́nua

23. Classifique em verdadeiro ou falso as seguintes afirmações:

(a) ( ) Estatı́stica é um conjunto de técnicas destinadas a organizar um conjunto de valores

numéricos.

(b) ( ) Sempre que estivermos trabalhando com números, deveremos utilizar a Inferência

Estatı́stica.

(c) ( ) A Estatı́stica Descritiva fornece uma maneira adequada de tratar um conjunto de

valores, numéricos ou não, com a finalidade de conhecermos o fenômeno de interesse.

(d) ( ) Qualquer amostra representa, de forma adequada, uma população.

20
Capı́tulo 2

Normas de Construção de Tabelas e

Séries Estatı́sticas

Resumo: O objetivo deste capı́tulo é apresentar as normas para construção de uma tabela, os critérios de

arredondamentos de dados e a definição e classificação de séries estatı́sticas.

2.1 Representação Tabular ou Tabelar

Consiste em dispor os dados em linhas e colunas, distribuı́das de modo ordenado, segundo

algumas regras práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho

Nacional de Estatı́stica. As normas de apresentação são editadas pelo Intituto Brasileira de Geografia

e Estatı́stica (IBGE).

2.1.1 Tabela ou Tabua de Dados

Tabela é uma forma resumida de apresentar um conjunto de dados. Geralmente, uma tabela

apresenta a seguinte representação esquemática.

Tabela 2.1: Tı́tulo


Cabeçalho

corpo

Rodapé:

21
ESTATÍSTICA Prof. Fernando Tosini

2.2 Elementos de uma Tabela

Uma tabela deve conter:

• Tı́tulo: O tı́tulo deve responder as seguintes questões:

− O que? (Assunto a ser representado (Fato));

− Onde? (O lugar onde ocorreu o fenômeno (local));

− Quando? (A época em que se verificou o fenômeno (tempo)).

• Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna.

• Corpo: parte da tabela composta por linhas e colunas.

• Linhas: parte do corpo que contém uma seqüência horizontal de informações.

• Colunas: parte do corpo que contém uma seqüência vertical de informações.

• Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores dis-

tribuı́dos pelas colunas numéricas.

• Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna.

• Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de

natureza informativa (fonte, notas e chamadas).

• Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.

Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral e chamada -

esclarecer minúcias em relação a uma célula).

Notação Convencional

A substituição de uma informação da tabela, poderá ser feita pelos sinais abaixo:

i) − Dado numérico igual a zero; iii) ? Quando temos dúvida na informação;

ii) ... Quando não temos os dados; iv) 0 Quando o valor for muito pequeno.

22
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 2.1 A tabela apresenta o esqueleto estrutural e seus elementos.

2.3 Arredondamento de Dados

Segunda a portaria 36 de 06/07/1965 - INPM - Instituto Nacional de Pesos e Medidas, o arredon-

damento segue as seguintes critérios:

1◦ ) Se o primeiro algarismo, após aquele que queremos arredondar for de 0 a 4, conservamos o

algarismo a ser arredondado e desprezamos os seguintes.

Exemplo: 7,34856 (para décimos) → 7,3

2◦ ) Se o primeiro algarismo, após aquele que queremos arredondar for de 6 a 9, acrescenta-se uma

unidade no algarismo a ser arredondado e desprezamos os seguintes.

Exemplo: 1,2734 (para décimos) → 1,3

3◦ ) Se o primeiro algarismo, após aquele que queremos arredondar for 5, seguido apenas de ze-

ros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ı́mpar,

desprezando os seguintes.

Exemplos: 6,2500 (para décimos) → 6,2 12,350 (para décimos) → 12,4

Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumen-

tamos uma unidade no algarismo e desprezamos os seguintes.

Exemplos: 8,2502 (para décimos) → 8,3 8,4503 (para décimos) → 8,5

4◦ ) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo

arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma

fique inalterada.

23
ESTATÍSTICA Prof. Fernando Tosini

Exemplo: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%

Arredondando para inteiro:

17% + 18% + 12% + 30% + 22% = 99%

17% + 18% + 12% + 31% + 22% = 100%

2.4 Séries Estatı́sticas

Uma série estatı́stica, define-se, como toda e qualquer coleção de dados estatı́sticos referidos a

uma mesma ordem de classificação quantitativa. Em um sentido mais restrito, diz-se que uma série

estatı́stica é uma sucessão de dados estatı́sticos referidos a caracteres quantitativos.

Para diferenciar uma série estatı́stica de outra, temos que levar em consideração três fatores:

• A ÉPOCA (fator temporal ou cronológico) a que se refere o fenômeno analisado;

• O LOCAL (fator espacial ou geográfico) onde o fenômeno acontece;

• O FENÔMENO (espécie do fato ou fator especı́fico) que é descrito.

2.4.1 Tipos de Séries Estatı́sticas

São quatro os tipos de séries estatı́sticas, conforme a variação de um dos fatores:

Série Temporal ou Cronológica

Também pode ser chamada série histórica, evolutiva ou marcha. É a série cujos dados estão

dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o

local.

Tabela 2.2: Produção de Petróleo no Brasil de 2013 a 2017 (mil barris/dia)

Anos Produção
2013 2110
2014 2341
2015 2525
2016 2608
2017 2734
Total 12318
Fonte: Anuário Estatı́stico - 2018

24
ESTATÍSTICA Prof. Fernando Tosini

Série Geográfica ou Territorial

Também pode ser chamada série espaciais ou de localização. É a série cujos dados estão

dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o

fato.

Tabela 2.3: População do Brasil em 2017

Região População
Norte 17.936.201
Nordeste 57.254.159
Sudeste 86.949.714
Sul 29.644.948
Centro-Oeste 15.875.907
Total 207.660.929
Fonte: IBGE

Série Especı́fica ou Qualitativa

Também pode ser chamada série categórica. É a série cujos dados estão dispostos em corres-

pondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o

local.

Tabela 2.4: População Urbana e Rural do Brasil (Censo 2010)

Localização População
Urbana 160.879.708
Rural 29.852.986
Total 190.732.694
Fonte: IBGE

Série Mista ou Composta

A combinação entre duas ou mais séries constituem novas séries denominadas compostas e

apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação

de pelo menos dois elementos:

Local + Época = Série Geográfica Temporal

25
ESTATÍSTICA Prof. Fernando Tosini

Tabela 2.5: População do Brasil por Região de 2013 a 2017

Regiões
Anos N NE SE S CO
2013 16 983 484 55 794 707 84 465 570 28 795 762 14 993 191
2014 17 231 027 56 186 190 85 115 623 29 016 114 15 219 608
2015 17 472 636 56 560 081 85 745 520 29 230 180 15 442 232
2016 17 707 783 56 915 936 86 356 952 29 439 773 15 660 988
2017 17 936 201 57 254 159 86 949 714 29 644 948 15 875 907
Fonte: IBGE

Exemplo 2.2 Faça o arredondamento na segunda casa decimal, segundo os critérios do Instituto Nacional de

Pesos e Medidas.

a) 7, 46882 c) 7, 47500 e) 7, 41582

b) 7, 43222 d) 5, 48500 e) 7, 47551

Exemplo 2.3 Classifique as séries estatı́sticas.

a) Série 1.

Tabela 2.6: Produção de Borracha Natural de 1991 a 1993

Anos Toneladas
1991 29.543
1992 30.712
1993 40.663
Fonte: IBGE

b) Série 2.

Tabela 2.7: Vacinação Contra a Poliometite - 1993

Regiões Quantidade
Norte 211.209
Nordeste 631.040
Sudeste 1.119.708
Sul 418.785
Centro-Oeste 185.823
Fonte: IBGE

26
ESTATÍSTICA Prof. Fernando Tosini

2.5 Lista de Exercı́cios

1. Assinale a alternativa verdadeira.

(a) Tanto a nota quanto a chamada são usadas para esclarecimento geral sobre um quadro e

uma tabela.

(b) Tanto a nota quanto a chamada são usadas para esclarecer detalhes em relação à casa, linhas

ou colunas de um quadro ou uma tabela.

(c) A nota é usada para esclarecer detalhes em relação a casas, linhas ou colunas enquanto a

chamada é usada para um esclarecimento geral sobre um quadro ou uma tabela.

(d) A nota é usada para esclarecimento geral sobre um quadro ou tabela enquanto a chamada

é usada para esclarecer detalhes em relação a casas, linhas ou colunas.

(e) Todas as afirmativas anteriores são falsas.

2. A representação tabular de dados no Brasil obedece às normas

(a) Da SUNAB; (d) Do Governo Federal;

(b) Da Receita Federal; (e) Da Secretaria Municipal de Estatı́stica.

(c) Do IBGE;

3. De acordo com as normas para representação tabular de dados, quando o valor de um dado é

zero, deve-se colocar na célula correspondente:

(a) Zero (0). (d) Um ponto de interrogação (?).

(b) Três pontos (...). (e) Um ponto de exclamação (!).

(c) Um traço horizontal (−).

4. De acordo com as normas para representação tabular de dados, quando o valor de um dado é

não está disponı́vel, deve-se colocar na célula correspondente.

(a) Zero (0). (d) Um ponto de interrogação (?).

(b) Três pontos (...). (e) Um ponto de exclamação (!).

(c) Um traço horizontal (−).

27
ESTATÍSTICA Prof. Fernando Tosini

5. De acordo com as normas para representação tabular de dados, quando o valor de um dado é

muito pequeno, para ser expresso com o número de casa decimais utilizadas ou com a unidade

de medida utilizada, deve-se colocar na célula correspondente.

(a) Zero (0). (d) Um ponto de interrogação (?).

(b) Três pontos (...). (e) Um ponto de exclamação (!).

(c) Um traço horizontal (−).

6. De acordo com as normas para representação tabular de dados, quando há dúvida, na exatidão

do valor de um dado, deve-se colocar na célula correspondente.

(a) Zero (0). (d) Um ponto de interrogação (?).

(b) Três pontos (...). (e) Um ponto de exclamação (!).

(c) Um traço horizontal (−).

7. Uma série estatı́stica é denominada evolutiva quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

8. Uma série estatı́stica é denominada espacial quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

9. Uma série estatı́stica é denominada cronológica quando?

(a) O elemento variável é o tempo;

28
ESTATÍSTICA Prof. Fernando Tosini

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

10. Uma série estatı́stica é denominada categórica quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

11. Uma série estatı́stica é denominada marcha quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

12. Uma série estatı́stica é denominada geográfica quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

13. Uma série estatı́stica é denominada composta quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

29
ESTATÍSTICA Prof. Fernando Tosini

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

14. Uma série estatı́stica é denominada qualitativa quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

15. Uma série estatı́stica é denominada especı́fica quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

16. Uma série estatı́stica é denominada mista quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

17. Uma série estatı́stica é denominada temporal quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

30
ESTATÍSTICA Prof. Fernando Tosini

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

18. Uma série estatı́stica é denominada evolutiva quando?

(a) O elemento variável é o tempo;

(b) O elemento variável é o local;

(c) O elemento variável é a espécie;

(d) É o resultado da combinação de séries estatı́sticas de tipos diferentes;

(e) Os dados são agrupados em subintervalos do intervalo observado.

19. Classifique as séries estatı́sticas.

(a) Série 1.

Tabela 2.8: Avicultura Brasileira - 1992


Espécies Números de cabeças (x 1000)
Galinhas 204.160
Galos 435.465
Codornas 2.488
Fonte: IBGE

(b) Série 2.

Tabela 2.9: Exportação Brasileira 1985-1990-1995

Importadores 1991 1992 1993


América Latina 13,0 13,4 25,6
EUA e Canadá 28,2 26,3 22,2
Europa 33,9 35,2 20,7
Ásia e Oceania 10,9 17,7 15,4
África e Oriente Médio 14,0 8,8 5,5
Fonte: IBGE

31
Capı́tulo 3

Organização de Dados em Tabelas

Resumo: O objetivo deste capı́tulo é apresentar as formas de como, compactar ou resumir, amostras de dados

numéricos em tabelas de frequência ou gráficos.

3.1 Introdução

Atualmente é muito comum organizar os dados de uma pesquisa estatı́stica em tabelas de

frequência ou gráficos(diagramas). Essas tabelas aparecem com muita frequência em jornais

informativos (Zero Hora, Correio do Povo, etc.), relatórios técnicos, monografias, dissertações, teses e

revistas cientı́ficas. São tabelas que apresentam de forma concisa o número de ocorrências (absoluta

e relativa) dos valores de uma variável.

A organização dos dados é realizada através da distribuição de frequência, no qual, consiste

dispor os dados em linhas e colunas distribuı́dos de modo ordenado.

Exemplo 3.1 Consideremos uma amostra de dados que representa a massa em kg de 20 acadêmicos.

50 65 70 80 50 72 72 80 65 72

70 70 50 72 65 65 72 70 70 70

Faça a distribuição de frequência dos dados e suas representações gráficas.

Exemplo 3.2 Consideremos uma amostra de dados que representa a altura em cm de 20 acadêmicos.

160 160 162 163 163 165 167 168 170 170

171 172 174 174 175 177 178 178 178 180

Faça a distribuição de frequência dos dados e suas representações gráficas.

32
ESTATÍSTICA Prof. Fernando Tosini

3.2 Distribuição de Frequência

É o tipo de série estatı́stica na qual permanece constante o fato, o local e a época. Os dados

são colocados em classes preestabelecidas, registrando a freqüência de ocorrência. Uma distribuição de

freqüência pode ser classificada em classe discreta(pontual,unitária) e classe intervalar(não unitária).

• Distribuição de Frequência em Classe Discreta ou Pontual ou Unitária: É uma série

de dados agrupados na qual, o número de observações(frequência) está relacionado com um

ponto real, ou seja, as classes são unitárias.

A representação gráfica desse tipo de distribuição, é feita em gráfico de linha, ou barras verticais,

ou barras horizontais e gráficos de setores.

Exemplos:

i) Tabela de distribuição de frequência em classes unitárias:

Tabela 3.1: Produção de Petróleo Bruto no Brasil de 1976 a 1980 (× 1000 m3 )

Anos Produção
1976 9702
1977 9332
1978 9304
1979 9608
1980 10562
Σ 485908
Fonte: Conjuntura Econômica (fevereiro 1983)

ii) Gráfico de Linha de distribuição de frequência em classes unitárias:

Figura 3.1: Produção de Petróleo Bruto no Brasil de 1976 a 1980 (×1000 m3 )

Fonte: Conjuntura Econômica (Fev. 1983)

33
ESTATÍSTICA Prof. Fernando Tosini

iii) Gráfico de barras verticais de distribuição de frequência em classes unitárias: Este gráfico é

utilizado para variáveis nominais e ordinais.

Figura 3.2: População Urbana do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

Caracterı́sticas:

- Todas as barras devem ter a mesma largura;

- Devem existir espaços entre as barras;

Observações: As larguras das barras que deverão ser todas iguais podendo ser adotado

qualquer dimensão, desde que seja conveniente e desde que não se superponham. O

número no topo de cada barra pode ou não omitido, se forem conservados, a escala vertical

pode ser omitida.

iv) As regras usadas para o gráfico de barras veticais são iguais as usadas para o gráfico de

barras horizontais.

Figura 3.3: População Urbana do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

34
ESTATÍSTICA Prof. Fernando Tosini

v) Gráfico de Setores de distribuição de frequência em classes unitárias: Este gráfico é utilizado

para variáveis nominais e ordinais. É um gráfico usado para dar ênfase à comparação das

percentagens de cada categoria. A construção do gráfico de setores segue uma regra de

três simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja

representar em relação a freqüência total que representa o total de 360°.

Figura 3.4: População Urbana e Rural do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

Caracterı́sticas:

- A área do gráfico equivale à totalidade de casos (360° = 100%);

- Cada “fatia” representa a percentagem de cada categoria.

• Tabela de Distribuição de Freqüências em Classe Intervalar ou Não-unitária: É uma

série de dados agrupados na qual o número de observações(frequência) está relacionado com

um intervalo, ou seja, as classes são não-unitárias. O intervalo de classe mais usado, é do tipo

fechado a esquerda e aberto a direita, representado pelo sı́mbolo: |−.

A representação gráfica desse tipo de distribuição é feita em histogramas ou polı́gonos de frequências

ou ogivas.

Exemplos:

i) Tabela de distribuição de frequência em classes não-unitárias:

Tabela 3.2: Altura em centı́metros de 160 alunos


Altura (cm) xi fi
150 |− 158 154 18
158 |− 166 162 25
166 |− 174 170 20
174 |− 182 178 52
182 |− 190 186 30
190 |− 198 194 15
Σ — 160
Fonte: Autor

35
ESTATÍSTICA Prof. Fernando Tosini

ii) Histograma de uma distribuição de frequência em classes não-unitárias: Este gráfico é

utilizado para variáveis contı́nuas. As classes sempre estão representadas no eixo horizontal

e as frequência no eixo vertical.

Figura 3.5: Altura em centı́metros de 160 alunos

Fonte: Autor

O histograma é o gráfico que aparece com maior frequência na representação de dados

agrupados em classes não-unitárias.

Caracterı́sticas:

- Cada barra representa a frequência do intervalo respectivo;

- Os intervalos devem ter a mesma amplitude;

- As barras devem estar todas juntas.

iii) Polı́gono de Freqüências de uma distribuição de frequência em classes intervalares: No eixo

horizontal são representadas os pontos médios das classes intervalares e no vertical a frequência.

Figura 3.6: Altura em centı́metros de 160 alunos

Fonte: Autor

36
ESTATÍSTICA Prof. Fernando Tosini

iv) Ogivas de uma distribuição de frequência em classes não-unitárias: No eixo horizontal são

representadas as classes intervalares e no vertical a frequência acumulada.

Figura 3.7: Altura em centı́metros de 160 alunos

Fonte: Autor

Resumindo:

 

 


 


 
 Gráfico de linha

 


 


 
 Gráfico de barras verticais

 

 Classe Pontual 


 


 
 Gráfico de barras horizontais

 


 


  Gráfico de setores

Distribuição de frequência: 






 

 

 


 
 Histograma

 


 

 Classe Intervalar 


 

Polı́gono de frequência

 


 
 Ogivas

37
ESTATÍSTICA Prof. Fernando Tosini

3.3 Outras Formas de Representação Gráfica

Na sequência é apresentado outras formas de representação gráfica de uma série de dados. Essas

representações são bastante usadas pelo IBGE, para compactar e representar algumas série de dados.

3.3.1 Gráficos Comparativos

São gráficos usados para representar uma série mista(local + época). A representação é feita por

meio de gráfico de linhas comparativas ou colunas justapostas ou colunas sobrepostas.

Exemplo:

Considere a série mista representada na tabela abaixo.

Tabela 3.3: População Urbana do Brasil por Região de 1940 a 1980 (×1000)

Regiões
Anos N NE SE S CO
1940 406 3 381 7 232 1 591 271
1950 581 4 745 10 721 2 313 424
1960 958 7 517 17 461 4 361 1 007
1970 1 624 11 753 28 965 7 303 2 437
1980 3 037 11 567 42 810 11 878 5 115
Fonte: IBGE

A representação da série em gráfico de linhas comparativas é:

Figura 3.8: População Urbana do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

38
ESTATÍSTICA Prof. Fernando Tosini

A representação da série em gráfico de colunas juntapostas é:

Figura 3.9: População Urbana do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

A representação da série em gráfico de colunas sobrepostas é:

Figura 3.10: População Urbana do Brasil em 1980 (×1000)

Fonte: Anuário Estatı́stico (1984)

3.3.2 Gráficos Pictogramas

Pictogramas são gráficos semelhantes aos gráficos de barras, onde se utilizam sı́mbolos ou

imagens apelativos em substituição das barras. Esse tipo de gráfico tem por objetivo chamar atenção

do publico em geral, e, seu uso geralmente está associado à sinalização pública, instruções, orientações

e qualquer outro meio para transmitir informações. É muito comum, encontrar o uso de pictogramas

em diversos contextos cotidianos, como placas em shoppings, aeroportos, guias, manuais, mapas,

infográficos, etc.

Exemplos:

39
ESTATÍSTICA Prof. Fernando Tosini

Figura 3.11: Evolução da Frota Nacional de Carros à Álcool de 1979 à 1987

Fonte: Anuário Estatı́stico (1984)

Figura 3.12: Comparação do Crescimento Populacional do BrasiL e o Estado do RS em 2014 - 2015

Fonte:IBGE

3.3.3 Gráficos Cartogramas

Cartograma é a representação sobre uma carta geográfica, ou seja, é um mapa que mostra

informação quantitativa, com um certo grau de precisão geográfica das unidades espaciais mapea-

das. Geralmente, é empregado, quando o objetivo é o de figurar os dados estatı́sticos diretamente

relacionados com as áreas geográficas ou polı́ticas.

40
ESTATÍSTICA Prof. Fernando Tosini

◦ Dados absolutos (população): Usa-se pontos proporcionais aos dados.

Figura 3.13: Matriz de Pequenos Múltiplos com os mapas univariados representando casos totais, por

quilômetro quadrado e por 100 mil habitantes, para as ocorrências de Dengue, Chikungunya e Zika

no Brasil em 2016

Fonte: IBGE

41
ESTATÍSTICA Prof. Fernando Tosini

◦ Dados relativos (densidade): Usa-se hachaduras.

Figura 3.14: Mapa coroplético e de sı́mbolos proporcionais e com as ocorrências de Dengue, Chikun-

gunya e Zika no Brasil em 2016 e Mapa de hachuras bivariado sobre mapa coroplético representando

os casos de Dengue, Chikungunya e Zika por 100 mil habitantes no Brasil, em 2016.

Fonte: IBGE

3.3.4 Gráfico Polar ou Radar

É o tipo de gráfico em forma de uma polı́gono, ideal para representar séries temporais cı́clicas,

ou seja, toda a série que apresenta uma determinada periodicidade.

Passo de construção de um gráfico polar

1) Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio de comprimento

proporcional a média dos valores da série);

2) Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e com uma

escala (eixo polar);

3) Divide-se a circunferência em tantos arcos forem as unidades temporais;

4) Traça -se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;

42
ESTATÍSTICA Prof. Fernando Tosini

5) Marca-se os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo polar);

6) Ligam-se os pontos encontrados com segmentos de reta;

7) Para fechar o polı́gono obtido, emprega-se uma linha interrompida.

Exemplo: Considere a precipitação pluviométrica do Municı́pio de Chapecó no ano de 2017.

Tabela 3.4: Precipitação Pluviométrica do Municı́pio de Chapecó - SC - 2017

Meses Precipitação (mm)


Janeiro 170
Fevereiro 174
Março 129
Abril 167
Maio 184
Junho 156
Julho 153
Agosto 155
Setembro 174
Outubro 198
Novembro 176
Dezembro 161
Total 2 181
Fonte: Climate-data.org

A representação em gráfico polar é:

Figura 3.15: Precipitação Pluviométrica do Municı́pio de Chapecó - SC - 2017

Fonte: Autor

43
ESTATÍSTICA Prof. Fernando Tosini

3.4 Elementos para uma Distribuição de Freqüência

Para organizar dos dados em tabelas de frequência, é necessário conhecer alguns elementos

importantes, que destacamos a seguir.

3.4.1 Dados Brutos

Dados brutos é a massa de dados resultante da coleta ou experimento.

3.4.2 Rol

Chama-se rol toda sequência a1 , a2 , a3 , ..., an de dados numéricos tal que:

• Cada termo, apartir do segundo, é maior ou igual ao seu antecessor;

• Ou cada termo, apartir do segundo, menor ou igual ao seu antecessor.

Exemplo 3.3 Para uma amostragem de nota bimestral da disciplina de estatı́stica, foram escolhidos aleatóriamente

sete acedêmicos com as seguintes notas: 6, 6, 5, 3, 8, 7, 8. Apresente essa amostra de dados em rol?

Em rol, temos:

(3, 5, 6 , 6, 7, 8, 8) ou (8, 8, 7, 6, 6, 5, 3)

3.4.3 Amplitude de uma Amostra (Aa )

A amplitude de uma amostra de dados numéricos, é dada pela diferença, entre o maior e o menor

valor dessa amostra.

Exemplo 3.4 Considere a altura em metros de 12 jogadores de futebol: 1.59, 1.60, 1.65, 1.72, 1.58, 1.50, 1.43,

1.62, 1.65, 1.70, 1.58, 1.63. Determine a amplitude da amostra?

Observe que a maior medida da amostra é 1.72 m e a menor é 1.43 m. Assim, a amplitudade dessa

amostra é:

Aa = 1.72 − 1.43 = 0.29 m

44
ESTATÍSTICA Prof. Fernando Tosini

3.4.4 Classe ou Classe de Frequência

Classe é cada subintervalo (linha) na qual dividimos o fenômeno, ou seja, é qualquer intervalo real

que contenha um rol da amostra.

Uma classe é formada por dois valores extremos, o limite inferior(Li) e o limite superior(Ls), e

pode ser representada da forma:

Li ⊢ − Ls ou Li − ⊣ Ls ou Li ⊢⊣ Ls

Ou

[Li ; Ls[ ou ]Li ; Ls] ou [Li ; Ls]

A diferença entre os valores extremos de cada classe é denominada amplitude da classe (Ac ), e

definida por:

Ac = Ls − Li (3.1)

Geralmente, a amplitude do intervalo de classe deve ser constante em todo a distribuição de

freqüências intervalar.

As classes que possuem a mesma amplitude são denominadas classes homogêneas, caso contrário,

são denominadas classes heterogêneas.

O ponto médio da classe (Xi ) é dado pela média aritmética simples do limite inferior com o limite

superior de uma mesma classe.


Ls + Li
xi = (3.2)
2
ou a partir do xi , os demais pontos médios pode ser determinado por:

xn = xn−1 + Ac , ∀ n = 2, 3, .... (3.3)

Obs: Quando substituirmos os intervalos de classes pelos pontos médios xi , temos uma distribuição

de frequência pontual, conforme mostra o item ii) do polı́gono de frequência a cima graficado.

As classes também podem ser classificadas em:

• Pontual ou Unitárias: Quando são representadas por um único número real.

• Intervalar ou Não-unitárias: Quando são representadas por um intervalo.

Notas Gerais:

Normalmente a determinação do número de classes, bem como, a determinação dos intervalos de

classe e a constituição das classes, é um problema para o qual não existe uma regra cem por eficiente.

Entretanto, é possı́vel adotar algumas orientações de caráter geral.

45
ESTATÍSTICA Prof. Fernando Tosini

I) Quando o problema não especı́fica o número de classe, podemos adotar a fórmula de Sturges para

determinar o número de classes de um conjunto de dados não tabelados.

C = 1 + 3, 33 · log(n) (3.4)

Onde, C é o representa o número de classes e n o número de elementos da amostra ou número de

informações.

Além da Regra de Sturges, existem outras fórmulas empı́ricas para resolver o problema para

determinação do número de classes [C], há quem prefere usar C  n . Entretanto, a verdade é que

essas fórmulas não nos levam a uma decisão final, esta vai depender na realidade de um julgamento

pessoal, que deverá estar ligado a natureza dos dados, procurando, sempre que possı́vel, evitar classes

com freqüências nulas ou freqüências relativas exageradamente grandes.

II) Se a e b são, respectivamente, o menor e o maior elemento da amostra, então, o extremo inferior

da primeira classe deve ser menor ou igual a a e o extremo superior da última classe deve ser maior

ou igual a b;

III) O extremo inferior de cada classe, apartir da segunda, deve ser igual ao extremo superior da

classe imediatamente anterior;

IV) Dependendo da notação utilizada na representação de cada classe os extremos destas pode ou

não participar da amostra.

3.4.5 Frequência de uma Classe

A frequência de uma classe é o número de valores compreendidos em seu intervalo. Para

diferenciá-la de outros tipos de frequência é comum dividı́-la em:

• Freqüência absoluta ( fi ): é a quantidade de valores em cada classe.


X
n
n= fi = f1 + f2 + ... + fn
i=1

• Frequência acumulada (Fai ): é o somatório da freqüência absoluta da i-ésima classe com a

freqüência absoluta das classes anteriores, ou a freqüência acumulada da classe anterior.


X
n
Fan = fi = n
i=1

• Frequência relativa (Fri ): é a divisão de cada frequência pelo total de frequências. Neste caso,

46
ESTATÍSTICA Prof. Fernando Tosini

os valores da frequência relativa, devem ser devidamente arredondados afim de que totalize 1.

fi
Fri =
X
n
fi
i=1

• Frequência percentual (Fpi ): é a multiplicação de cada frequência relativa por 100.

Fpi = Fri · 100

• Frequência percentual acumulada (Fpai ): é o somatório da freqüência percentual da i-ésima

classe com a freqüência percentual das classes anteriores, ou a freqüência percentual acumulada

da classe anterior.
X
n
Fpan = f pi = 100
i=1

3.5 Aplicação Envolvendo Distribuição de Frequências

Naturalmente, a distribuição de frequência é representada em tabelas e gráficos. Dessa forma,

vamos considerar duas situações para a distribuição de frequência, uma para classe unitária e outra

para classe não-unitária.

3.5.1 1◦ Situação: Distribuição de Frequências em Classes Não-Unitárias ou Da-


dos Agrupados

Nesse tipo de apresentação os valores observados não aparecerão individualmente, e sim agrupa-

dos em classes. Quando a variável objeto do estudo for contı́nua, será sempre conveniente agrupar

os valores observados em classes. Se, por outro lado, a variável for discreta e o número de valores

representativos dessa variável for muito grande, recomenda-se o agrupamento dos dados em classes,

evitando com isso grande extensão da tabela, aparecimento de diversos valores com frequência nula

e impossibilidade de visualização do fenômeno como um todo.

Exemplo 3.5

A tabela abaixo mostra a distribuição de freqüência dos dados resultantes das emissões de um determinado gás

em um laboratório.

47
ESTATÍSTICA Prof. Fernando Tosini

Emissão (µg/L) N° de ocorrências F. acum. F. relat. F. perc. F. p. acum.


50 ⊢ 59 8
59 ⊢ 69 10
69 ⊢ 80 16
80 ⊢ 89 14
89 ⊢ 100 10
100 ⊢ 109 5
109 ⊢ 119 2
Total

Determine:

(a) O número de classes. (d) O ponto médio da 3a classe.

(b) O limite inferior da 4a classe. (e) A amplitude das classes.

(c) O limite superior da 5a classe. (f) O intervalo de classe de maior frequência.

(g) A freqüência relativa e percentual acumulada da 1◦ e da 7◦ classe.

(h) A porcentagem de emissões maior ou igual a 100 (µg/L).

(i) A porcentagem de emissões que se mantiveram nos valores aceitáveis, maior igual 69 menor que 100

(µg/L).

Exemplo 3.6

Os dados a seguir, refere-se a altura em centı́metros de uma amostra de 70 alunos.

153 154 155 156 158 160 160 161 161 161 162 162 163 163 164

164 165 166 167 167 172 173 173 174 174 175 175 176 177 178

179 179 180 182 183 184 185 186 186 187 188 188 189 189 190

191 192 192 192 192 193 194 194 195 197 197 199 200 201 205

(a) Qual a variável em estudo?

(b) Separar essa amostra, em classes de mesma amplitude, e construir a tabela de distribuição de frequência.

(c) Construir o histograma, polı́gono de frequência e a ogivas crescente.

48
ESTATÍSTICA Prof. Fernando Tosini

3.5.2 2◦ Situação: Distribuição de Frequências em Classes Unitárias ou Pontual


ou Dados Não Agrupados

Nesse tipo de apresentação os valores observados aparecerão individualmente, e deveram ser

agrupados em classes unitárias.

Exemplo 3.7

Os dados da amostra, representam as notas de 80 acadêmicos.

4 4 5 7 8 7 6 6 8 4 5 5 5 6 6 7 8 7 7 7

7 6 6 6 6 4 4 8 8 5 5 7 7 7 6 6 6 7 8 4

7 5 5 5 5 4 6 8 6 5 5 7 7 7 6 6 6 7 8 6

7 5 5 5 5 4 6 8 6 5 6 7 7 7 6 6 6 8 8 6

Apresentar os dados em tabelas de distribuição de frequência, apresentar essa distribuição em gráficos de

linha, barras verticais e de setores.

49
ESTATÍSTICA Prof. Fernando Tosini

3.6 Lista de Exercı́cios

1. Assinale a afirmativa verdadeira:

(a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão

dispostos horizontalmente.

(b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão

dispostos verticalmente.

(c) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos

verticalmente e um gráfico de colunas, horizontalmente.

(d) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos

horizontalmente e um gráfico de colunas, verticalmente.

(e) Todas as alternativas anteriores são falsas.

2. O gráfico mais comumente utilizado, quando se deseja evidenciar a participação de um dado

em relação ao total é denominado:

(a) Gráfico em barras; (d) Gráfico pictórico ou pictograma;

(b) Gráficos em colunas; (e) Gráfico polar.

(c) Gráfico em setores;

3. Uma representação gráfica, comumente encontrada em jornais e revistas que inclui figuras de

modo a torná-las, mais atraente é denominada:

(a) Gráfico em barras; (d) Gráfico pictórico ou pictograma;

(b) Gráficos em colunas; (e) Gráfico cartograma.

(c) Gráfico em setores;

4. A tabela abaixo, mostra o consumo de determinada bebida durante um baile:

Bebida Consumo
Vodka 100
Suco de Frutas 200
Água Mineral 400
Refrigerante 700
Cerveja 1600

50
ESTATÍSTICA Prof. Fernando Tosini

Foi construı́do um gráfico em setores para melhor representar o fenômeno acima.

(a) Qual o ângulo do setor correspondente ao vodka?

a) 6◦ b) 10◦ c) 12◦ d) 24◦ e) 100◦

(b) Qual o ângulo do setor correspondente ao suco de frutas?

a) 12◦ b) 20◦ c) 24◦ d) 48◦ e) 200◦

(c) Qual o ângulo do setor correspondente à água mineral?

a) 24◦ b) 40◦ c) 48◦ d) 84◦ e) 100◦

(d) Qual o ângulo do setor correspondente aos refrigerantes?

a) 42◦ b) 70◦ c) 84◦ d) 192◦ e) 220◦

(e) Qual o ângulo do setor correspondente ao de cervejas?

a) 12◦ b) 96◦ c) 160◦ d) 192◦ e) 260◦

5. Observe o seguinte pictograma e responde às questões.

(a) Quantos cafés foi vendido na 4ª feira? E na 6ª feira?

(b) Quantos cafés foram vendidos a mais, de 5ª para 6ª feira?

(c) A D. Rosa quer encerrar um dia por semana. Qual dia ela deve escolher? Porquê?

(d) Se um café custar R$ 3,50 qunato recebe a Dona Rosa pela venda de cafés durante um mês?

51
ESTATÍSTICA Prof. Fernando Tosini

6. A tabela mostra a distribuição de frequência de uma amostra, referente ao consumo mensal de

energia elétrica da cidade de Xanxere do ano de 2017.

Consumo (kwh) N° de residências F. acum. F. relat. F. perc. F. p. acum.


0 ⊢ 100 786
100 ⊢ 200 1491
200 ⊢ 300 634
300 ⊢ 400 327
400 ⊢ 500 261
500 ⊢ 600 103
Total

Determine:

(a) Qual é o percentual de residências com consumo inferior a 300 Kwh.

(b) Qual é o percentual de residências com consumo igual ou superior a 200 kwh, mas inferior

a 300 Kwh.

(c) Qual é o percentual de residências com consumo igual ou superior a 400 Kwh.

(d) Qual é o consumo médio por residências?

7. As rendas mensais em reais dos 25 ingressantes, num certo curso de pós-graduação em enge-

nharia de uma universidade foram as seguintes (em mil reais):

2, 90; 2, 90; 2, 95; 2, 95; 3, 10; 3, 10; 3, 15; 3, 20; 3, 20; 3, 25; 3, 30; 3, 40; 3, 45;

3, 45; 3, 50; 3, 65; 3, 65; 3, 80; 3, 90; 3, 90; 4, 00; 5, 00; 5, 20; 5, 50; 6, 40

(a) Qual a variável em estudo?

(b) Separar essa amostra, em classes de mesma amplitude, e construir a tabela de distribuição

de frequência.

(c) Construir o histograma, polı́gono de frequência e ogiva decrescente.

8. Uma pesquisa foi realizada na cidade de Chapecó, com o intúito de saber, qual tipo de carro

que o cidadão, utiliza diariamente, para deslocar-se ao trabalho. Dentre ônibus, carro e moto, o

número de diferentes meios de transporte utilizados foi o seguinte:

2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2,

52
ESTATÍSTICA Prof. Fernando Tosini

3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2, 3

(a) Organize uma tabela de freqüência.

(b) Faça uma representação gráfica de linha e de setores.

(c) Admitindo que essa amostra represente bem o comportamento do cidadão chapecoense,

você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é

grande?

9. O valor médio de comercializaçáo da saca de milho de 60 quilos na Bolsa de Cereais é apresentado

abaixo, em reais, para últimos 40 meses.

6, 1 6, 2 6, 7 6, 5 6, 9 6, 3 7, 4 7, 6 7, 7 7, 6

7, 3 7, 7 7, 6 7, 4 7, 2 7, 2 7, 3 7, 6 7, 5 7, 4

7, 5 7, 7 8, 2 8, 3 8, 1 8, 1 8, 1 7, 9 7, 8 7, 4

7, 5 7, 6 7, 5 7, 6 7, 4 7, 3 7, 4 7, 5 7, 5 7, 4

(a) Organize os dados em faixas de tamanho 0,4 a partir de 6.

(b) Construa o histograma.

10. Os dados a seguir mostram os resultados de 20 exames hematológicos efetuados no Laboratório

de Análises Clı́nicas USP, referentes ao número percentual de linfócitos, em um grupo de

pacientes que apresentam leucemia linfóide.

10, 12, 18, 12, 15, 14, 10, 12, 11, 19, 13, 14, 10, 11, 15, 16, 22, 14, 12, 13

(a) Calcular a amplitude total da amostra.

(b) Estimar usando a fórmula de sturges o número de classes conveniente.

(c) Construir a tabela de distribuição de frequência, usando o critério de valores diferenciados

para limites superiores e inferiores das classes subsequentes.

11. Os conteúdos de vinte caixas de leite longa-vida, apresentaram os seguintes volumes, em litro:

0, 98 1, 00 1, 01 0, 98 0, 99 0, 99 1, 01 1, 01 1, 00 0, 99

1, 00 1, 02 0, 98 0, 99 1, 00 0, 99 1, 00 1, 01 0, 98 0, 99

(a) Organize uma tabela de frequência com classes unitária.

(b) Faça uma representação gráfica de barras e setores.

53
Capı́tulo 4

Medidas Descritivas

Resumo: O objetivo deste capı́tulo, é apresentar as duas principais medidas descritivas, sua diferenciação e as

formas de como determiná-las e aplicá-las.

4.1 Introdução

As medidas descritivas, são medidas numéricas que tem objetivo, descrever um conjunto de dados

de forma organizada e compacta. As medidas descritivas mais importantes são:

• Medidas de posição: Mostra o posicionamento dos elemento da amostra;

• Medidas de dispersão: Mede o afastamento dos elemento da amostra;

4.2 Medidas de Posição ou Tendência Central

São medidas que nos mostram o posicionamento dos elementos de uma amostra de números,

quando esta é dispota em rol. Dentro de uma amostra, essas medidas possuem carater representativo,

separador e dominante, isto é:







 Média Aritmética


• Representativas: Médias: 


 Média Geométrica




Média Harmônica

54
ESTATÍSTICA Prof. Fernando Tosini

 

 


 


 Mediana 
 Moda Bruta

 


 


 Quartis 
 Moda de Czuber
• Separatrizes: 
 • Dominantes: Moda: 


 


 
 Moda de King

 Decis 


 


 

Centis ou Percentis Moda de Pearson

4.2.1 Representativas (Médias)

São medidas descritivas que tem por finalidade representar um conjunto de dados.

a) Média Aritmética

A média aritmética de um conjunto com n dados não tabelados x1 ; x2 ; ...; xn , é representada

por x̄, e definida por:


X
n
xi
x1 + x2 + ... + xn i=1
x̄ = µ = = (4.1)
n n

Onde:

x̄ é a média amostral (dados de uma amostra) e µ é a média populacional (dados de uma

população).

Observação: É comum diferenciar, em termos de notação, a média amostral da média populacional.

Embora, o cálculo de ambas seja feito da mesma forma, geralmente, os valores dessas médias são

próximos.

Propriedades da Média Aritmética

i) A soma algébrica dos desvios de um conjunto X = {x1 ; x2 ; ...; xn } com n números em relação

à média aritimética x̄, é sempre igual a zero, ou seja:

X
n
(xi − x̄) = 0
i=1

Demonstração:
X
n
xi
X
n X
n X
n X
n X
n
i=1
X
n X
n
(xi − x̄) = xi − x̄ = xi − n · x̄ = xi − n · = xi − xi = 0
n
i=1 i=1 i=1 i=1 i=1 i=1 i=1

55
ESTATÍSTICA Prof. Fernando Tosini

ii) A média de um conjunto de números X = {x1 ; x2 ; ...; xn } é também igual à média de cada

um destes números menos uma constante k, somada depois a essa mesma constante k, ou

seja:
X
n X
n
xi (xi − k)
i=1 i=1
x̄ = = +k
n n

Demonstração:

X
n X
n X
n X
n X
n X
n
xi (xi − k + k) (xi − k) k (xi − k) (xi − k)
i=1 i=1 i=1 i=1 i=1 n·k i=1
= = + = + = +k
n n n n n n n

iii) A soma dos quadrados dos desvios de um conjunto X = {x1 ; x2 ; ...; xn } com n números em

relação à qualquer número A, é um mı́nimo quando A = x̄, ou seja:

X
n
(xi − x̄)2 = minimo
i=1

Exemplo 4.1 Calcule:

a) A média aritmética das idades dos acadêmicos que cursam a disciplina de Estatı́stica.

b) Se a média das notas 3; x; 6 e 10 é igual a 7. Qual é o valor de x.

Exemplo 4.2 A altura média de 22 estudantes de uma classe é 170 cm. Em um determinado dia faltaram

dois estudantes, um de altura 190 cm e outro de 170 cm. Determine a altura média dos estudantes

presentes neste dia?

Média Aritmética Ponderada

A média aritmética ponderada de um conjunto de dados x1 ; x2 ; ...; xn , aos quais são atri-

buidos respectivamente, fatores de ponderação (pesos ou frequência) p1 ; p2 ; ...; pn , é representada

por x̄, e definida por:

X
n
xi · pi
x1 · p1 + x2 · p2 + ... + xn · pn i=1
x̄ = = (4.2)
p1 + p2 + ... + pn X
n
pi
i=1

56
ESTATÍSTICA Prof. Fernando Tosini

Observação: Esta fórmula pode ser usada, para calcular a média a aritmética de dados agrupa-

dos em tabelas com classe unitária.

Exemplo 4.3 Um acadêmico realizou seis provas de estatı́stica valendo 10 pontos e tirou 5; 8; 4; 6; 9 e 8.

Porém as provas tinham pesos 2; 1; 2; 3; 1 e 1. Calcule a média das notas desse acadêmico?

Exemplo 4.4 Uma industria produz diariamente três produtos, com respectivos lucros percentuais apre-

sentado na tabela.

X Vendas Lucro
Pregos 2500,00 30%
Parafusos 1500,00 50%
Rebites 750,00 40%

Qual é o lucro médio diario dessa industria?

Média Aritmética de Classe Não-Unitárias

De modo geral, para dados agrupados em classe intervalares, a média aritmética é definida

por:
X
m
xi · fi
x1 · f1 + x2 · f2 + ... + xm · fm i=1
x̄ = = (4.3)
f1 + f2 + ... + fm Xm
fi
i=1

Onde:

xi é o ponto médio da classe i; fi é a freqüência da classe i; m é o número de classes;

Exemplo 4.5 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de

acadêmicos.

Classe (Estaturas em cm) Número de acadêmicos


[150.5 - 156.5[ 4
[156.5 - 160.5[ 5
[160.5 - 168.5[ 8
[168.5 - 178.5] 3

Determine a estatura média dos acadêmicos dessa amostra?

57
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 4.6 O histograma mostra a distribuição das idades de uma amostra de estudantes.

Calcule a idade média desses estudantes?

b) Média Geométrica

A aplicação da média geométrica deve ser feita, quando os valores do conjunto de dados

considerado se comportam segundo uma progressão geométrica (P.G.) ou dela se aproximam.

A média geométrica de um conjunto de dados, formado por n números x1 ; x2 ; ...; xn , com

comportamento de uma progressão geométrica é representada por G, e definida por:

– Para dados não tabelados:

 n 1
Y  n √
G =  xi  = n x1 · x2 · ... · xn (4.4)
i=1

– Para dados tabelados:

n v
X t n X
n
Y q
fi f fi f1 f2 f
G= xi i = x1 · x2 · ... · xnn (4.5)
i=1 i=1
i=1

Onde:

fi é a freqüência da classe i; xi é o ponto médio da classe i em classes intervalares;

Observações:

58
ESTATÍSTICA Prof. Fernando Tosini

– Na área biomédica, a média geométrica é frequentemente empregada para expressar re-

sultados de experiências laboratoriais que se apresentam em escala não-linear geométrica.

Por exemplo, para determinar Concentração Mı́nima Inibitória (CMI) de um determinado

antibiótico.

– A média geométrica de um conjunto é sempre menor ou igual a média aritmética, vários

problemas de desigualdades presentes na geometria são resolvidos através dela.

Exemplo 4.7 Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês,

12% após dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria?

Exemplo 4.8 Prove que a fórmula da média geomética pode ser apresentada na forma:
X
n

n
logb xi
G= (b) i=1

c) Média Harmônica

A média harmônica de um conjunto com n dados numéricos x1 ; x2 ; ...; xn , é representada por

H, e definida por:

– Para dados não tabelados:

 n −1
X 1  n
H = n ·   =
 (4.6)
xi  1 1 1
i=1 + + ... +
x1 x2 xn
– Para dados tabelados:

 n −1
X
n X fi 
H= fi ·   = f1 + f2 + ... + fn
 (4.7)
xi  f1 f2 fn
i=1 i=1 + + ... +
x1 x2 xn

Onde:

fi é a freqüência da classe i;

xi é o ponto médio da classe i em classes intervalares;

Observação: A média harmônica nunca é maior do que a média geométrica ou do que a média

aritmética, é geralmente é utilizada para calcular a média de problemas, que envolvem dados

inversamente proporcionais, como velocidades, vazões, freqüências e taxas.

59
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 4.9 Um ônibus viaja de A para B a 30 km/h, e volta no mesmo caminho B para A a uma

velocidade de 60 km/h. Qual é a velocidade média de todo o percurso?

Exemplo 4.10 Use o exemplo anterior, e comprove a propriedade das médias: H ≤ G ≤ x̄.

Emprego da média

i) Deseja-se obter a medida de posição que possui a maior estabilidade;

ii) Houver necessidade de um tratamento algébrico posterior.

Resumindo:

60
ESTATÍSTICA Prof. Fernando Tosini

4.2.2 Separatrizes

São medidas de posição que divide o conjunto de dados em partes proporcionais, quando os

mesmos são ordenados (colocados em rol). De acordo com a divisão elas são classificadas em:

• Mediana (Md): dividem um conjunto de dados em partes iguais;

• Quartis (Qi ): dividem um conjunto de dados em quatro partes iguais;

• Decis (Di ): dividem os dados em dez partes iguais;

• Percentis (Pi ): dividem os dados em sem partes iguais.

Cálculo das Separatrizes

Para encontrar as separatrizes de um conjunto de dados amostrais, representados em classes

unitárias ou intervalares, devemos:

Primeiramente, dispor a amostra em rol e em seguida, calcular a posição da separatriz.

⊠ Para dados amostrais ou agrupados em classes unitárias:

Se o número de elementos n for par ou ı́mpar, as separatrizes, seguem a seguinte ordem:

i(n + 1)
Posição = S
(4.8)

 

 

 i=1
  1≤i≤9

◦ Se for mediana: 
 ◦ Se for decis: 


 S=2 
 S = 10


 
 1≤i≤3
 

◦ Se for quartis: 

  1 ≤ i ≤ 99

 S=4 ◦ Se for percentis: 


 S = 100

Exemplo 4.11 Considere as seguintes grandezas:

3; 5; 8; 9; 10; 10; 7; 3; 12

Dertemine a Md, Q1 , Q3 , D8 e P80 .

61
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 4.12 A tabela apresenta o número de salários que os funcionários de uma industria recebem

mesalmente.

Número de salários Numero de funcionários


3 192
4 328
5 321
6 180
7 43

Dertemine a Md, Q1 ,Q2 , Q3 , D7 e P60 .

⊠ Para dados agrupados em classes intervalares:

Para os dados agrupados em uma distribuição de classes intervalares, as separatrizes

são calculadas por:

i·n
Posição = S (4.9)

 
Posição − Faant · Ac
Si = lSi + (4.10)
fSi

Onde:

Si = Md, para i = 1.

Si = Qi , para 1 ≤ i ≤ 3.

Si = Di , para 1 ≤ i ≤ 9.

Si = Pi , para 1 ≤ i ≤ 99.

lSi é o limite inferior da classe que contém a separatriz;


i·n
é a posição da classe separatriz;
S
Faant é a freqüência acumulada da classe anterior a que contém a separatriz;

Ac é a amplitude do intervalo da classe;

fSi é a freqüência absoluta da classe que contém a separatriz;

Exemplo 4.13 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160

acadêmicos da Universidade.

62
ESTATÍSTICA Prof. Fernando Tosini

Tabela 4.1: Altura em centı́metros de 160 alunos


Altura (cm) xi fi
150 |− 158 154 18
158 |− 166 162 25
166 |− 174 170 20
174 |− 182 178 52
182 |− 190 186 30
190 |− 198 194 15
Σ — 160
Fonte: Autor

Dertemine a Md, Q1 , Q3 , D6 e P80 .

Emprego da mediana

i) Quando se deseja obter um ponto que divide a distribuição em partes iguais;

ii) Há valores extremos que afetam de uma maneira acentuada a média;

Resumindo:

63
ESTATÍSTICA Prof. Fernando Tosini

4.2.3 Dominantes

São medidas descritivas que tem por finalidade, mostrar o elemente dominante em um conjunto

de dados.

Cálculo das Dominâncias

Podemos encontrar as medidas dominantes de um conjunto de dados amostrais representados

em classes unitarias e intervalares.

⊛ Para dados amostrais ou agrupados em classes unitárias:

Moda

A moda (Mo) é o valor mais frequente em um conjunto de dados. A moda pode não existir,

e, mesmo que exista, pode não ser única. De acordo com o número de moda que o conjunto de

dados possui, ele é classificado em:

– Amodal: Não tem moda;

– Unimodal: tem uma moda;

– Bimodal: tem duas modas;

– Multimodal ou polimodal: tem três ou mais modas.

Exemplo 4.14 Considre o conjunto de dados e determine a moda e classifique-a.

a) 1; 1; 3; 3; 5; 7; 7; 7; 11; 13 c) 3; 5; 5; 5; 6; 6; 7; 7; 7; 11; 12

b) 3; 5; 8; 11; 13; 18 d) 5; 5; 6; 6; 7; 7; 8

Exemplo 4.15 A tabela apresenta o número de salários que os funcionários de uma industria recebem

mesalmente.

Número de salários Numero de funcionários


3 192
4 328
5 321
6 180
7 43

Dertemine a moda.

64
ESTATÍSTICA Prof. Fernando Tosini

⊛ Para dados agrupados em classes intervalares:

Para os dados agrupados em uma distribuição de classes intervalares, as dominâncias

modais são:

Moda Bruta (Mob )

A moda bruta é simplesmente, o ponto médio xi da classe de maior freqüência (classe modal).

Mob = xi (4.11)

Moda de Czuber: (Moc )

O processo para determinar a moda usado por Czuber leva em consideração as freqüências

anteriores e posteriores à classe modal.


 
∆1
Moc = lMo + · Ac (4.12)
∆1 + ∆ 2

Onde:

∆1 = fMo − fant e ∆2 = fMo − fpos .

lMo é o limite inferior da classe modal;

fMo é a freqüência absoluta da classe modal;

Ac é a amplitude do intervalo de classe;

fant é a freqüência absoluta da classe anterior a classe modal;

fpos é a freqüência absoluta da classe posterior a classe modal;

Moda de King: (Mok )

O processo proposto por King considera a influência existente das classes anterior e posterior

sobre a classe modal. A inconveniência deste processo é justamente não levar em consideração

a freqüência máxima.
!
fpos
Mok = lMo + · Ac (4.13)
fpos + fant

Moda de Pearson: (Mop )

O processo usado por Pearson pressupõe que a distribuição seja aproximadamente simétrica,

na qual a média aritmética e a mediana são levadas em consideração.

Mop = 3 · Md − 2 · x̄ (4.14)

65
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 4.16 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160

acadêmicos da Universidade.

Tabela 4.2: Altura em centı́metros de 160 alunos


Altura (cm) xi fi
150 |− 158 154 18
158 |− 166 162 25
166 |− 174 170 20
174 |− 182 178 52
182 |− 190 186 30
190 |− 198 194 15
Σ — 160
Fonte: Autor

Dertemine a Mob , Moc , Mok e Mop .

Emprego da moda

i) Quando se deseja obter uma medida rápida e aproximada de posição;

ii) Quando a medida de posição deve ser o valor mais tı́pico da distribuição.

Resumindo:

66
ESTATÍSTICA Prof. Fernando Tosini

4.2.4 Notas importantes

⋆ A média é a mais utilizada, principalmente quando não há valores aberrantes, sendo a medida

mais conveniente para cálculos posteriores;

⋆ A mediana deve ser usada, sempre que possı́vel, como medida representativa de distribuições

fortemente assimétricas, pois o seu valor não é afetado por valores extremos;

⋆ A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de

distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados,

é fortemente afetado pela maneira como as classes são constituı́das.

4.2.5 Comparação das Medidas de Posição

Medidas Definição Vantagem Desvantagem


Média Centro da Reflete todos os dados É muito afetada por valores

distribuição extremos
Mediana Divide a distribuição Menos sensı́vel a valo- Difı́cil de calcular, quando te-

ao meio res extremos mos, grandes amostras de da-

dos
Moda Valor mais frequentes Valor tı́pico Não é utilisado em analises

matemática

Exemplo 4.17 Considere as notas das provas de estatı́stica realizada por 50 acadêmicos.

22 46 9 40 57 22 22 13 50 42

35 2 15 41 34 52 32 75 69 44

26 42 60 56 30 3 17 79 45 37

12 62 50 35 41 59 11 66 39 1

43 33 70 50 47 20 36 40 37 29

(a) Calcule a média, mediana e moda da amostra de notas;

(b) Monte uma tabela com 7 classes;

(c) Calcule a média, mediana e moda da tabela de notas agrupadas;

(d) O que se pode concluir, quando se compara os valoes obtidos no item a) e c).

67
ESTATÍSTICA Prof. Fernando Tosini

4.3 Medidas de Variabilidade ou Dispersão

São medidas, que visam descrever os dados no sentido de informar o grau de dispersão ou

afastamento dos valores observados em torno de um valor central representativo chamado média.

Com essas medidas é possı́vel, informar se um conjunto de dados é homogêneo (pouca variabilidade)

ou heterogêneo (muita variabilidade).

As medidas de dispersão são:

 

 


 


 
 Desvio extremo ou amplitude de variação

 


 


 
 Desvio médio

 

 Absoluta 


 


 
 Desvio padrão

 

 

Medidas de dispersão: 
  Variância ou desvio quadrático









 

 

 


  Variância Relativa

 


 Relativa 

 Coeficiente de variação de Pearson

Para compreendermos, o porque, devemos estudar as medidas de dispersão. Analisemos o

exemplo prático.

Supondo que uma empresa, esteja realizando uma entrevista e análise curricular, para contratar

um funcionário. Ao final da entrevista, foram classificados apenas dois candidatos, para uma única

vaga. Então, para a escolha final, foi realizado 4 tarefas para cada um, onde, as mesmas tiveram como

registro o tempo (em minutos) de execução.

Tabela 4.3: Tempo de excecução de 4 tarefas

Tarefas 1 2 3 4
Candidato 1 (tempo) 45 55 52 48
Candidato 2 (tempo) 30 70 40 60
Fonte: Autor

Análise gráfica

Graficando as tarefas de cada um dos candidatos, temos:

68
ESTATÍSTICA Prof. Fernando Tosini

Como se pode notar nos gráficos, os candidatos possuem a mesma média, porém, a dispersão

dos dados em torno da média do candidato 1, é menor do que o do candidato 2. Isso quer dizer, que,

durante a execução das tarefas, o canditato 1 obteve, tempos mais próximos da média, isto significa

que, o candidato 1 é mais regular do que o candidato 2.

Observação:

◦ Conjunto de dados são melhor analisado, quando se utiliza medida de tendência central e medida

de dispersão, pois, é comum encontrar-se séries que, apesar de apresentarem a mesma média, são

compostas de maneiras diferentes.

◦ Só as medidas de tendência central, geralmente, são insuficientes para descrever ou analizar

adequadamente um conjunto de dados.

4.3.1 Medidas de dispersão Absoluta

São medidas de dispersão sensı́veis às unidades de medida.

Desvio Extremo ou Amplitude de Variação

É a diferença entre o maior e o menor valor de um conjunto de dados.

H = xmax − xmin (4.15)

Desvio Médio Absoluto

O desvio médio absoluto de uma amostra de dados, com n números, x1 ; x2 ; ...; xn , é representada

por Dma, e definida por:

69
ESTATÍSTICA Prof. Fernando Tosini

• Para dados não tabelados:

X
n
|xi − x̄|
i=1
Dma = (4.16)
n

• Para dados tabelados:

X
n

fi · |xi − x̄|
i=1
Dma = X
n (4.17)
fi
i=1

Onde:

fi é a freqüência da classe i;

xi é o ponto médio da classe i em classes intervalares;

Desvio Padrão

O desvio padrão pode ser amostral s ou populacional σ, e definida por:

• Para dados não tabelados:

v
u
u
u
u
u X
n
t
(xi − x̄)2
i=1
σ= (4.18)
n

v
u
u
u
u
u X
n
t
(xi − x̄)2
i=1
s= (4.19)
n−1

• Para dados tabelados:

v
u
u
u
u
u Xn  
u
u
u
u
u fi · (xi − x̄)2
u
u
u
u i=1
σ= t (4.20)
X n
fi
i=1

70
ESTATÍSTICA Prof. Fernando Tosini

v
u
u
u
u
u Xn  
u
u
u
u
u fi · (xi − x̄)2
u
u
u
s= u
t i=1
Xn (4.21)
fi − 1
i=1

Onde:

fi é a freqüência da classe i;

xi é o ponto médio da classe i em classes intervalares;

Desvio Quadrático ou Variância

O desvio quadrático pode ser amostral s2 ou populacional σ2 , e definida por:

• Para dados não tabelados:

X
n
(xi − x̄)2
i=1
σ2 = (4.22)
n

X
n
(xi − x̄)2
i=1
s2 = (4.23)
n−1

• Para dados tabelados:

X
n  
fi · (xi − x̄)2
i=1
σ2 = X
n (4.24)
fi
i=1

X
n  
fi · (xi − x̄)2
i=1
s2 = X
n (4.25)
fi − 1
i=1

Onde:

fi é a freqüência da classe i;

xi é o ponto médio da classe i em classes intervalares;

71
ESTATÍSTICA Prof. Fernando Tosini

Observação:

◦ (n − 1) é usado como um fator de correção ou grau de liberdade da estimativa, onde deve-

mos considerar a variância amostral como uma estimativa da variância populacional.

◦ A desvantagem em usar a variância como medida de dispersão é que, se os elementos da amostra

apresentam unidade u, a variância vai se apresentar em u2 , o que pode causar dificuldade na

interpretação.

4.3.2 Propriedades da Variância

i) A variância de uma amostra com todos os valores iguais, é zero;

ii) Somando-se ou subtraindo-se uma constante k, a cada valor observado (elementos amostrais),

a variância não será alterada;

iii) Multiplicando-se ou dividindo-se por uma constante k, cada valor observado, a variância ficará

multiplicada ou dividida pelo quadrado dessa constante.

4.3.3 Medidas de dispersão Relativas

São medidas de dispersão que não dependem da unidade de medida. Essas medidas são obtidas,

a partir da variância, da média e o desvio padrão. Em geral, são medidas expressa em porcentagem,

e tem por função determinar o grau de concentração dos dados em torno da média. Geralmente é utilizada

para fazer a comparação entre dois conjuntos de dados em termos percentuais, esta comparação

revelará o quanto os dados estão próximos ou distantes da média do conjunto de dados.

Variância Relativa

É obtida pela divisão entre a variância e o quadrado da média, e é representada por Vr , e definida

por:

• Variância relativa amostral:


s2
Vr = (4.26)
x̄2

• Variância relativa populacional:


σ2
Vr = (4.27)
µ2

72
ESTATÍSTICA Prof. Fernando Tosini

Coeficiente de Variação de Pearson

É obtida pela divisão entre o desvio padrão e a média, e é representada por Cv , e definida por:

• Coeficiente de variação amostral:


s
Cv = · 100 (4.28)

• Coeficiente de variação populacional:

σ
Cv = · 100 (4.29)
µ

Observação:

◦ Se Cv < 15%, temos, pequena dispersão, em caso, 15 ≤ Cv ≤ 30%, temos, média dispersão, e

por fim, se Cv > 30%, temos, alta dispersão.

◦ Se Cv ≤ 50%, significa que a média é representativa.

◦ Se Cv  0, temos a maior representatividade da média (s = 0).

Exemplo 4.18 Ás vésperas de um jogo decisivo, o técnico de uma equipe de basquetebol, deve optar pela

escalação de um dos jogadores, A ou B. As tabelas mostram o desempenho de cada jogador nos últimos cinco

jogos que participaram:

Jogador A Jogador B
Jogo Número de Pontos Jogo Número de Pontos
1 20 1 30
2 22 2 14
3 18 3 20
4 20 4 12
5 20 5 24

(a) Calcular a média e desvio médio absoluto de cada um nesses cinco jogos;

(b) Calcular o desvio padrão de cada um nesses cinco jogos;

(c) Você, sendo técnico desse time, se tivesse que escalar um desses jogadores, num jogo onde a simples vitória

daria o tı́tulo da competição, qual deles escalaria?

73
ESTATÍSTICA Prof. Fernando Tosini

Exemplo 4.19 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160

acadêmicos da Universidade.

Tabela 4.4: Altura em centı́metros de 160 alunos


Altura (cm) xi fi
150 |− 158 154 18
158 |− 166 162 25
166 |− 174 170 20
174 |− 182 178 52
182 |− 190 186 30
190 |− 198 194 15
Σ — 160
Fonte: Autor

(a) Determine a altura média desses acadêmicos;

(b) Determine o desvio médio absoluto das medidas;

(c) Determine o desvio padrão das medidas;

(d) Determine o coeficiente de variação de Pearson;

Média e desvio-padrão em uma calculadora Casio

1) Ligue sua calculadora, aperte Mode e escolha a opção 2 (SD);

2) Agora digite o primeiro dado e aperte M+ (para registrar na memória);

3) Insira o próximo número e aperte M+, siga fazendo isso para cada dado a ser inserido;

4) Após registrar todos os dados na memória de sua calculadora, aperte Shift e o número 2 (S-VAR);

5) Escolha a opção 1 para média, 2 para desvio-padrão populacional e 3 para desvio-padrão

amostral;

6) Aperte o botão de igual (=) e confira o resultado;

7) Se necessário, retorne ao passo 4, escolha outra opção e aperte novamente o botão de igual (=)

para ver o resultado relativo à opção escolhida.

74
ESTATÍSTICA Prof. Fernando Tosini

Resumindo:

75
ESTATÍSTICA Prof. Fernando Tosini

4.4 Lista de Exercı́cios

1. Considere as grandezas:

3 7 8 22 10 17 12 6 13 15 19

17 18 21 4 8 11 13 14 18 25

(a) Determine a média aritmimética.

(b) Dertemine a Md, Q1 , Q3 , D4 e P70 . (c) Determine a moda.

(d) Determine o desvio padrão, a variância e o coeficiente de Pearson.

2. A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 90 pessoas.

Altura (cm) fi
63 15
75 25
84 30
91 20
Σ 90
Fonte: Autor

(a) Determine a média aritmimética e harmônica.

(b) Dertemine a Md, Q1 , Q3 , D4 e P70 . (c) Determine a moda e o desvio padrão.

3. A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 110

crianças.
Altura (cm) fi
61 |− 65 12
65 |− 69 23
69 |− 73 34
73 |− 77 26
77 |− 81 15
Σ 110
Fonte: Autor

(a) Determine a média aritmimética e harmônica.

(b) Dertemine a Md, Q1 , Q3 , D7 e P40 . (c) Dertemine a Mob , Moc , Mok e Mop .

76
ESTATÍSTICA Prof. Fernando Tosini

4. A tabela a seguir, mostra a distribuição salarial de seis funcionários, em três diferentes empresas.

Empresa A Empresa B Empresa C


1000 1000 1000
1000 800 200
1000 1000 300
1000 1200 1000
1000 1300 2100
1000 700 1400

(a) Determine a média, a mediana e a moda.

(b) O que aconteceu com as medidas de tendencia central do item a)?

(c) As três empresas são iguais em relação a distribuição salarial?

(d) O que diferencia uma empresa da outra?

(d) Determine o desvio padrão de cada empresa;

5. O gráfico abaixo, mosta a distribuição de frequência das notas, obtidas pelos acadêmicos do

curso de biomedicina em uma prova de bioestatı́stica.

(a) Determine a nota média aritmimética, geométrica e harmônica.

77
ESTATÍSTICA Prof. Fernando Tosini

(b) Dertemine a Md, Q1 , Q3 , D4 e P55 . (c) Determine a moda.

(d) Determine o desvio médio absoluto, o desvio padrão e a variância.

6. As amostras de exames bioquı́micos de sangue de três diferentes laboratórios apresentaram os

nı́veis de creatinina (mg%) mostrados no quadro abaixo.

Exame 1 2 3 4 5 6 7
Laboratório A 0,6 0,4 0,5 0,8 0,2 0,8 -
Laboratório B 0,7 0,8 0,6 0,9 0,5 1,1 0,3
Laboratório C 0,6 0,7 2,0 0,5 0,8 0,9 0,9

(a) Calcular a média, mediana e a moda para os dados do Laboratório A;

(b) Calcular a média, mediana e a moda para os dados do Laboratório B;

(c) Calcular a média, mediana e a moda para os dados do Laboratório C;

(d) Calcular a média global dos dados;

(e) Calcular a mediana para os dados dos três Laboratórios;

(f) Calcular a moda de todos os nı́veis de creatinina;

(g) Os problemas verificados com a média, no caso dos dados do Laboratório C, continuam no

caso da média de todos os dados?

(i) Qual seria a MTC mais representativa do conjunto de dados dos três Laboratórios?

7. As quantidades de Ácido Ascórbico, em miligramas por 100 mililitros, presentes em 80 exames

quı́micos de plasma humano, estão indicados na tabela abaixo.

Classe fi f rp(%) Fa Fpa(%)


0,0 |− 0,2 3 3,75 3 3,75
0,2 |− 0,4 6 7,50 9 11,25
0,4 |− 0,6 18 22,50 27 33,75
0,6 |− 0,8 35 43,75 62 77,50
0,8 |− 1,0 16 20,00 78 97,50
1,0 |− 1,2 2 2,50 80 100
Total 80 100 - -

Com base nessas informações, determine o que pede os itens abaixo:

78
ESTATÍSTICA Prof. Fernando Tosini

(a) Calcule a taxa média;

(b) Calcule a taxa mediana;

(c) Calcule a taxa modal de ácido ascórbico no plasma.

(d) Calcule o desvio padrão e o coeficiente de variação de Pearson.

8. Os dados agrupados na tabela abaixo referem-se ao número total de óbitos provocados por

epilepsia (CID-BR 225), durante o ano de 1983, no Estado de Minas Gerais, de acordo com a

faixa etária.

Classe fi f rp(%) Fa Fpa(%)


0−9 44 18,72 44 18,72
10 − 19 30 12,77 74 31,49
20 − 29 48 20,43 122 51,92
30 − 39 50 21,28 172 73,20
40 − 49 28 11,91 200 85,11
50 − 59 15 6,38 215 91,49
60 − 69 11 4,68 226 96,17
70 ou + 9 3,83 235 100
Total 235 100 - -

Com base nessas informações, determine o que pede os itens abaixo:

(a) Calcule a idade média;

(b) Calcule a idade mediana;

(c) Calcule a idade modal de óbito por epilepsia.

(d) Calcule o desvio padrão e o coeficiente de variação de Pearson.

9. Os dados representam a altura em cm de uma amostra de 70 alunos de uma universidade.

153 154 155 156 158 160 160 161 161 161 162 162 163 163 164

164 165 166 167 167 172 173 173 174 174 175 175 176 177 178

179 179 180 182 183 184 185 186 186 187 188 188 189 189 190

191 192 192 192 192 193 194 194 195 197 197 199 200 201 205

79
ESTATÍSTICA Prof. Fernando Tosini

(a) Calcular a média, mediana e a moda dessas medidas;

(b) Calcular o desvio médio absoluto, o desvio padrão, a variância e o coeficiente de variação

de Pearson.

(c) Podemos afirmar que a média é representativa ou não?

10. A tabela (10) apresenta os dados obtidos com uma experiência 25 indivı́duos, em relação a

Concentração Inibitória (CI) de determinado antibiótico para um certo tipo de bactéria. Deter-

minar a Concentração Mı́nima Inibitória (CMI) para este tipo de bactéria?

CMI(µg/ml) Número de Indivı́duos

1 1

0.5 2

0.25 6

0.125 4

0.0625 3

0.03125 9

11. Sendo a e b números não negativos. Prove que a média geométrica de a e b é menor ou igual à

média aritmética.

12. Sendo a e b números positivos. Prove que a média harmõnica de a e b é menor ou igual à média

geométrica.

80
Capı́tulo 5

Comportamento em curva de um

Histograma

Resumo: Este capı́tulo tem por objetivo, apresentar a forma de fazer o polimento, cálcular as medidas de

assimetria e curtose de uma distribuição de frequência representada em um histograma.

5.1 Introdução

Por que devemos transformar ou aproximar um histograma por uma curva?

Figura 5.1: Gráfico de Dados Fictı́cios

81
ESTATÍSTICA Prof. Fernando Tosini

A descrição, interpretação e analise de um gráfico apresentado na forma de curva contı́nua,

é mais compreensı́vel e descreve de forma mais realista a tendência da distribuição.

Como se obtém a curva contı́nua de um histograma e quais suas caracterı́sticas?

Através do polimento do histograma de distribuição de frequências, é possı́vel obter a curva

polida em forma contı́nua da distribuição dos dados. Essa curva, apresenta uma forma suave, com

caracterı́sticas de assimetria e curtose, que são medidas essenciais para proporcionar uma descrição

e compreensão mais completa das distribuições de frequências.

A obtenção da curva polida nos da uma ideia de como surge a Curva Normal de Gauss na

distribuição de probabilidade.

Para realizar o polimento e saber a forma de uma distribuição, é necessário saber construir e

interpretar um histograma de distribuição de frequência.

5.2 Interpretação de um Histograma

A interpretação de histogramas é feita com uma simples observação de sua forma. Dessa forma,

vamos interpretar alguns exemplos.

a) A figura (5.2) apresenta um histograma com simetria. A média dos dados está no centro do

desenho. As frequências mais altas também estão no centro da figura. Em processos industriais,

esta é a forma desejável.

Figura 5.2: Histograma com simetria

b) A figura (5.3) apresenta um histograma com assimetria positiva. A média dos dados está

localizada à esquerda do centro da figura e a cauda à direita é alongada. Esta ocorre quando o

limite inferior é controlado ou quando não podem ocorrer valores abaixo de determinado limite.

82
ESTATÍSTICA Prof. Fernando Tosini

Figura 5.3: Histograma com assimetria positiva

c) A figura (5.4) apresenta um histograma com assimetria negativa. A média dos dados está

localizada à direita do centro da figura e a cauda à esquerda é alongada. Esta forma ocorre

quando o limite superior é controlado ou quando não podem ocorrer valores acima de certo

limite.

Figura 5.4: Histograma com assimetria negativa

d) A figura (5.5) mostra um histograma em plateau, isto é, com exceção das primeiras e das últimas

classes, todas as outras têm freqüências quase iguais. Essa forma ocorre quando se misturam

várias distribuições com diferentes médias.

Figura 5.5: Histograma com plateau

e) A figura (5.6) mostra um histograma com dois picos, ou duas modas. As freqüências são baixas

no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas

distribuições com médias bem diferentes se misturam. Podem estar misturados, por exemplo,

os produtos de dois turnos de trabalho.

83
ESTATÍSTICA Prof. Fernando Tosini

Figura 5.6: Histograma com dois picos

f) A figura (5.7) mostra o histograma à esquerda mostra pouca dispersão, mas o histograma à

direita mostra grande dispersão.

Figura 5.7: Histogramas com dispersões diferentes

5.3 Curva de Frequência − Curva Polida

Em geral, os dados coletados pertencem a uma amostra extraı́da de uma população. Essas amostras,

geralmente, são cada vez mais amplas, com amplitude das classes cada vez menor, o que nos permite

concluir, que o contorno do polı́gono de freqüências tende a se transformar numa curva de freqüência,

mostrando, de modo mais evidente, a verdadeira natureza da distribuição da população.

Pode-se dizer, então, que, enquanto que o polı́gono de freqüência nos dá a imagem real do

fenômeno estudado, a curva de freqüência nos dá a imagem tendenciosa.

Assim, após o traçado de um polı́gono de freqüência, é desejável, muitas vezes, que se faça um

polimento, de modo a mostrar o que seria tal polı́gono com um número maior de dados.

Esse procedimento é claro, não nos dará certeza absoluta que a curva polida seja tal qual a curva

resultante de um grande número de dados. Porém, pode-se afirmar que ela assemelha-se mais a curva

de freqüência que o polı́gono de freqüência obtido de uma amostra limitada.

O polimento, geometricamente, corresponde à eliminação dos vértices da linha poligonal. Consegue-

84
ESTATÍSTICA Prof. Fernando Tosini

se isso, com a seguinte fórmula:


fant + 2 · fi + fpost
f ci = (5.1)
4
Onde:

f ci é a frequência calculada da classe considerada;

fi é a frequência absoluta da classe i;

fant é a frequência absoluta da classe anterior a i;

fpost é a freqüência absoluta da classe posterior a i;

Exemplo 5.1

Determine a curva polida da distribuição de frequência relativa as estaturas de 40 acadêmicos.

Tabela 5.1: Altura em centı́metros de 40 alunos


Altura (cm) xi fi f ci
150 |− 154 152 4 (0 + 2 · 4 + 9)/4 = 4, 25
154 |− 158 156 9 (4 + 2 · 9 + 11)/4 = 8, 25
158 |− 162 160 11 (9 + 2 · 11 + 8)/4 = 9, 75
162 |− 166 164 8 (11 + 2 · 8 + 5)/4 = 8, 00
166 |− 170 168 5 (8 + 2 · 5 + 3)/4 = 5, 25
170 |− 174 172 3 (5 + 2 · 3 + 0)/4 = 2, 75
Σ — 40 —
Fonte: Autor

A curva polida da distribuição de frequência no histograma é apresentada na figura (5.8):

Figura 5.8: Histograma com curva polida

Fonte: Autor

85
ESTATÍSTICA Prof. Fernando Tosini

Observação:

Note que, a curva do exemplo a cima, tem forma de sino. Esse tipo de curva se diferencia pela

sua simetria, podendo ser simétrica ou assimétrica

5.3.1 Curva simétrica

É uma curva que se caracteriza por apresentar o valor máximo no ponto central e os pontos

equidistantes desse ponto tem a mesma frequência.

Figura 5.9: Curva simétrica

5.3.2 Curva Assimétrica

Na prática, não se encontram distribuições perfeitamente simétricas. As distribuições obtidas de

medidas reais são mais ou menos assimétricas, em relação à freqüência máxima. Assim, as curvas

correspondentes a tais distribuições apresentam a cauda de um lado da ordenada máxima mais longa

do que o outro, isto é:

◦ Se a cauda mais longa fica a direita, a curva é chamada assimétrica positiva ou enviesada à

direita;

◦ Se a cauda mais longa fica a esquerda, a curva é chamada assimétrica negativa ou enviesada à

esquerda.

Figura 5.10: Curva Assimétrica Positiva Figura 5.11: Curva Assimétrica Negativa

86
ESTATÍSTICA Prof. Fernando Tosini

5.4 Medidas de Assimetria e Curtose

5.4.1 Assimetria

Uma distribuição de valores sempre poderá ser representada por uma curva (gráfico). Essa

curva, conforme a distribuição, pode apresentar várias formas. Se considerarmos o valor da moda

da distribuição como ponto de referência, vemos que esse ponto sempre corresponde ao valor de

ordenada máxima, dando-nos o ponto mais alto da curva representativa da distribuição considerada,

logo a curva será analisada quanto à sua assimetria.

• Distribuição Simétrica: É aquela que apresenta a x̄ = Mo = Md e os quartis Q1 e Q3 eqüidistantes

do Q2 .

Figura 5.12: Distribuição Simétrica

• Distribuição Assimétrica: É aquela onde os valores da moda, da mediana e da média divergem,

sendo que a média sempre estará do mesmo lado em que a cauda é mais longa.

Figura 5.13: Distribuição Assimétrica

Observe que:

– Na distribuição assimétrica negativa, a maioria dos dados estão a esquerda da moda;

– Na distribuição assimétrica positiva, a maioria dos dados estão a direita da moda;

87
ESTATÍSTICA Prof. Fernando Tosini

Como medir a assimetria e a intensidade de assimetria de uma distribuição?

Podemos medir a assimetria e a intensidade de assimetria de uma distribuição, calculando os

coeficientes de assimetria. Temos duas formas de medir:

• O mais utilizado é o Coeficiente de Assimetria de Pearson, que é determinado por:

x̄ − Mo
As = (5.2)
s

De acordo como o Coeficiente de Assimetria de Pearson, a distribuição será:

– Se As < 0, a distribuição será Assimétrica Negativa ou a Esquerda;

– Se As > 0, a distribuição será Assimétrica Positiva ou Direita;

– Se As = 0, a distribuição será Simétrica.

Segundo o Coeficiente de Assimetria de Pearson, a classificação da distribuição, quanto a inten-

sidade de assimetria é:

– Se As ≤ −1, a distribuição será Assimétrica Negativa Forte;

– Se −1 < As < 0, a distribuição será Assimétrica Negativa Fraca;

– Se As = 0, a distribuição será Simétrica;

– Se 0 < As < 1, a distribuição será Assimétrica Positiva Fraca;

– Se As > 1, a distribuição será Assimétrica Positiva Forte.

• Quando não tivermos condições de calcular o desvio padrão, podemos usar o Coeficiente de

Bowley:

Q3 + Q1 − 2 · Md
As = (5.3)
Q3 − Q1

De acordo como o Coeficiente de Assimetria de Bowley, a distribuição será:

– Se As < 0, a distribuição será Assimétrica Negativa ou a Esquerda;

– Se As > 0, a distribuição será Assimétrica Positiva ou Direita;

– Se As = 0, a distribuição será Simétrica.

88
ESTATÍSTICA Prof. Fernando Tosini

Segundo o Coeficiente de Assimetria de Bowley, a classificação da distribuição, quanto a inten-

sidade de assimetria é:

– Se −1 ≤ As ≤ −0.3, a distribuição será Assimétrica Negativa Forte;

– Se −0.3 < As < −0.1, a distribuição será Assimétrica Negativa Moderada;

– Se −0.1 ≤ As < 0, a distribuição será Assimétrica Negativa Fraca;

– Se As = 0, a distribuição será Simétrica;

– Se 0 < As ≤ 0.1, a distribuição será Assimétrica Positiva Fraca;

– Se 0.1 < As < 0.3, a distribuição será Assimétrica Positiva Moderada;

– Se 0.3 ≤ As ≤ 1, a distribuição será Assimétrica Positiva Forte.

Observação:

Teoricamente, o coeficiente de assimetria de pode variar entre -3 e +3. Na prática, porém, raramente

ultrapassará os limites de -1 e +1.

5.4.2 Curtose

Já estudamos as medidas de tendência central, de dispersão e de assimetria. Falta somente

examinarmos mais uma das medidas de uso comum em Estatı́stica, que completa as caracterı́sticas

de uma distribuição de valores. Essas medidas, são as chamadas de Curtose ou de Achatamento,

que nos mostra até que ponto a curva representativa de uma distribuição é a mais aguda ou a mais

achatada do que uma curva normal, de altura média.

Podemos dizer que uma distribuição de freqüências é:

• Curva Mesocúrtica (Normal): É considerada a curva padrão.

• Curva Leptocúrtica: É uma curva mais alta do que a normal. Apresenta o topo relativamente

alto, significando que os valores se acham mais agrupados em torno da moda.

• Curva Platicúrtica: É uma curva mais baixa do que a normal. Apresenta o topo achatado,

significando que várias classes apresentam freqüências quase iguais.

89
ESTATÍSTICA Prof. Fernando Tosini

Graficamente:

Como medir curtose ou grau de achatamento de uma distribuição?

Na prática só é possı́vel medir o grau de achatamento em distribuições simétricas, ou muito próximas

as simétricas. Esse grau de achatamento pode ser obtido por meio do Coeficiente Percentı́lico de Curtose,

que é determinado por:

Q3 − Q1
k= (5.4)
2(P90 − P10 )

De acordo como o Coeficiente de Percentı́lico, a distribuição será classificada em:

• Se k > 0.263, a distribuição será Platicúrtica;

• Se k = 0.263, a distribuição será Mesocúrtica;

• Se k < 0.263, a distribuição será Leptocúrtica.

Exemplo 5.2 A tabela apresenta a distribuição de frequência das estaturas, em cm, de uma amostra de 160

acadêmicos.

Tabela 5.2: Altura em centı́metros de 160 alunos


Altura (cm) xi fi
150 |− 158 154 18
158 |− 166 162 25
166 |− 174 170 20
174 |− 182 178 52
182 |− 190 186 30
190 |− 198 194 15
Σ — 160
Fonte: Autor

90
ESTATÍSTICA Prof. Fernando Tosini

(a) Faça o polimento da distribuição de frequências;

(b) Determine o tipo de assimetria e a intensidade da assimetria da distribuição;

(c) Determine o coeficiente percentı́lico de curtose e sua classificação quanto o grau de achatamento;

(d) Que conclusões você pode tira da distribuição;

91
ESTATÍSTICA Prof. Fernando Tosini

5.5 Lista de Exercı́cios

1. Construa uma tabela de dispersão o suficiente para determinar as medidas de posição (média

aritmética, mediana e moda de czuber), dispersão (desvio padrão e variância, coeficiente de

variação de Pearson), assimetria (coeficiente de assimetria, e coeficiente de curtose). Faça um

relatório referente ao comportamento dos dados em função dos resultados obtidos.

(a) Os dados a seguir, referem-se, as notas de uma prova final de Estatı́stica, aplicado a 48

alunos.

4, 0 4, 2 4, 3 4, 4 4, 5 4, 5 4, 6 5, 0 5, 1 5, 2 5, 3 5, 5 5, 7 5, 8 6, 0 6, 1

6, 3 6, 4 6, 5 6, 7 6, 8 6, 9 7, 0 7, 2 7, 5 7, 6 7, 7 7, 9 8, 0 8, 3 8, 5 8, 6

8, 8 8, 9 9, 0 9, 1 9, 2 9, 3 9, 3 9, 4 9, 4 9, 5 9, 5 9, 6 9, 7 9, 8 9, 9 10, 0

(b) Os dados a seguir, referem-se, aos salários anuais pagos em dólares a 60 funcionários da

Empresa X.

50, 00 52, 50 53, 50 54, 00 54, 20 55, 50 56, 30 56, 50 57, 00 58, 10 58, 50 59, 00

60, 30 61, 50 62, 00 62, 90 63, 50 64, 00 64, 30 65, 00 66, 00 66, 25 67, 50 68, 00

68, 70 69, 50 70, 00 72, 00 75, 00 76, 50 77, 00 78, 00 80, 00 81, 50 82, 50 83, 50

85, 00 87, 30 88, 00 89, 10 90, 00 91, 35 92, 10 93, 20 94, 00 95, 25 96, 00 97, 00

98, 00 99, 80 100, 10 100, 20 101, 00 102, 00 103, 40 104, 30 105, 00 107, 00 108, 00 109, 10

2. A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 40

acadêmicos.

Tabela 5.3: Altura em centı́metros de 40 alunos


Altura (cm) fi
150 |− 154 4
154 |− 158 9
158 |− 162 11
162 |− 166 8
166 |− 170 5
170 |− 174 3
Σ 40
Fonte: Autor

92
ESTATÍSTICA Prof. Fernando Tosini

(a) Determine o tipo de assimetria e a intensidade da assimetria da distribuição;

(b) Determine o coeficiente percentı́lico de curtose e sua classificação quanto o grau de acha-

tamento;

3. Considere as distruições:

Tabela 5.4: Distrib I Tabela 5.5: Distrib II Tabela 5.6: Distrib III

Classes fi Classes fi Classes fi


02 |− 06 6 02 |− 06 6 02 |− 06 6
06 |− 10 12 06 |− 10 12 06 |− 10 30
10 |− 14 24 10 |− 14 24 10 |− 14 24
14 |− 18 12 14 |− 18 30 14 |− 18 12
18 |− 22 6 18 |− 22 6 18 |− 22 6
Σ 60 Σ 78 Σ 78
x̄ = 12, 0 kg x̄ = 12, 9 kg x̄ = 11, 1 kg

Md = 12, 0 kg Md = 13, 5 kg Md = 10, 5 kg

Mo = 12, 0 kg Mo = 16, 0 kg Mo = 8, 00 kg

s = 4.42 kg s = 4, 20 kg s = 4, 20 kg

Verifique o tipo de assimetria e o grau de achatamento de cada distribuição.

4. Trabalho em grupo: - Colete um conjunto de dados; - Construa a distribuição de frequência; -

Faça o seu histograma e a curva polida; - Calcule a sua média, mediana, moda, desvio padrão e

coeficiente de variação de Pearson; - Determine assimetria (coeficiente de assimetria, e coeficiente

de curtose); - Interprete os resultados.

93

Você também pode gostar