Faetec Apostila Estatistica PDF

E.T.E.
República
GOVERNO DO ESTADO DO RIO DE JANEIRO
SECRETARIA DE ESTADO DE CIÊNCIA, TECNOLOGIA E INOVAÇÃO
FUNDAÇÃO DE APOIO À ESCOLA TÉCNICA
ESCOLA TÉCNICA ESTADUAL REPÚBLICA
Curso: Informática
Disciplina: Estatística
Apostila de Estatística
Prof. Cosme Marcelo Furtado Passos da Silva

1
UNIDADE 1 – A NATUREZA DA ESTATÍSTICA
PANORAMA HISTÓRICO
A Estatística, tal como a Matemática, originou-se do convívio social, das trocas, da

contagem, com caráter prático, utilitário e empírico.
Vários povos já registravam o número de habitantes, de nascimentos, de óbitos desde a
Antigüidade. Faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras
ao povo, cobravam impostos e realizavam inquéritos (pesquisas).
As informações com finalidades tributárias ou bélicas já eram colhidas na Idade Média.
As primeiras análises sistemáticas de fatos sociais, como batizados, casamentos e funerais
começaram a surgir a partir do século XVI.
No século XVIII o estudo de tais fatos foi adquirindo um caráter mais científico.
As tabelas tornaram-se mais completas, surgiram os gráficos e o cálculo das probabilidades,
e a Estatística deixou de ser uma simples contagem de dados coletivos para se tornar o estudo de
como chegar a conclusões sobre o todo (população), partindo da observação de parte desse todo
(amostras).
MÉTODO ESTATÍSTICO
Método é um conjunto de meios que se dispõe de forma a se chegar a um objetivo que se

deseja.
O método científico é o desenvolvimento de processos científicos visado o estudo e a
aquisição de conhecimentos. Entre os métodos científicos destacam-se: o método experimental e o
método estatístico.
No método experimental todos os fatores são mantidos constantes, exceto um deles, e
variamos este fator de forma que o pesquisador possa descobrir os efeitos dessa variação, caso eles
existam. Esse método é o utilizado na Química, na Física e etc. Como exemplo, imagine uma
experiência onde todos os fatores (pressão, temperatura e componentes químicos) estão constantes,
exceto um deles, então, observa-se o que resultará a partir da alteração desse fator que não está
constante.
Quando os vários fatores que afetam o fenômeno em estudo não podem permanecer
constantes enquanto fazemos variar um deles que, naquele momento, nos interessa utilizamos outro
método, embora mais difícil e menos preciso, denominado método estatístico.
Como exemplo, imagine os fatores que influenciam o preço de uma mercadoria. Para variar
a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço não temos como
controlar os outros fatores que estão diretamente relacionados como os salários, o gosto dos
consumidores, o nível geral dos preços das outras necessidades etc.
Assim, no método estatístico admiti-se todos os fatores presentes variando, registrando essas
variações e procurando determinar, que influencias cada um deles tem.
A ESTATÍSTICA
A Estatística, ou métodos estatísticos, como é denominada algumas vezes, desempenha

papel crescente e importante em quase todas as fases da pesquisa humana. É a ciência que se
preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Sua
utilização é cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos seus
mais diversificados ramos de atuação, as pessoas estão freqüentemente expostas à Estatística,
2
utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método
estatístico proporciona àqueles de que dele necessitam.
Estatística Descritiva e Estatística Inferencial
A ciência Estatística é, basicamente, dividida em duas partes: a Estatística Descritiva e a

Estatística Inferencial ou Indutiva.
A Estatística Descritiva se preocupa com a organização e descrição dos dados
experimentais. Em um sentido mais amplo, a Estatística Descritiva pode ser interpretada como uma
função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados referentes
a esses fenômenos, a organização e a classificação desses dados observados e a sua apresentação
através de gráficos e tabelas, além do cálculo de coeficientes (estatísticas) que permitem descrever
resumidamente os fenômenos.
A Estatística Inferencial cuida da análise e interpretação. Refere-se a um processo de
generalização, a partir de resultados particulares. Consiste em obter e generalizar conclusões, ou
seja, inferir propriedades para o todo com base na parte, no particular. A inferência estatística
implica, em um raciocínio muito mais complexo do que o que preside a Estatística Descritiva.
Porém, se bem compreendida e utilizada, pode converter-se em instrumento muito importante para
o desenvolvimento de uma disciplina científica.
FASES DO MÉTODO ESTATÍSTICO
Testar sistematicamente algo requer muitas vezes uma pesquisa cuidadosamente planejada e
executada. Sendo assim, distingui-se no método estatístico as seguintes fases:
a) Redução do problema a ser estudado a uma hipótese testável, ou seja, elaboração do

objetivo que o levantamento pretende alcançar, que pergunta(s) ele pretende responder.
b) Elaboração de instrumentos adequados para a coleta de dados.
c) Coleta de dados. O pesquisador pode ir a campo e fazer uma contagem ou um inquérito

(coleta direta - dados primários), ou então utilizar dados já coletados por outros (coleta
indireta - dados secundários).
A coleta direta pode ser: contínua, periódica ou ocasional.
• Contínua: quando é feita de forma contínua, como os registros de nascimentos e
óbitos.
• Periódica: quando é feita em intervalos constantes de tempo, como o Censo
Demográfico do IBGE.
• Ocasional: quando é feita esporadicamente para atender a uma conjuntura ou a uma
emergência como, por exemplo, uma epidemia.
d) Crítica dos dados. Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de
possíveis falhas e imperfeições, a fim de evitar erros grosseiros ou de certo vulto, que
possam influir sensivelmente nos resultados.
A crítica dos dados pode ser externa ou interna.
• Externa: quando procura por erros por parte do informante devido principalmente à
má interpretação das perguntas.
• Interna: quando observa os dados coletados a procura de erros devidos,
principalmente, à digitação.
3
e) Apuração dos dados. É a soma e o processamento dos dados obtidos e a sua disposição
mediante critérios de classificação.
f) Exposição ou apresentação dos dados. Nesta fase os dados devem ser apresentados através
de gráficos, tabelas e coeficientes que permitam descrever resumidamente os fenômenos
observados tornando mais fácil o exame daquilo que é o objeto da pesquisa.
g) Análise e interpretação dos resultados. O objetivo da pesquisa estatística é tirar conclusões

sobre o todo (população) a partir de informações fornecidas por parte representativa do todo
(amostra). Assim, após a realização das fases anteriores (Estatística Descritiva), faz-se uma
análise dos resultados obtidos, de onde são extraídas as conclusões e previsões para o todo.
A ESTATÍSTICA NAS EMPRESAS
Nas empresas a Estatística auxilia o administrador na organização, direção e controle

visando à tomada de decisões.
A Estatística auxiliará também na seleção e organização da estratégia a ser adotada na empresa e,
ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade de seus produtos e/ou
serviços e mesmo dos possíveis lucros e/ou perdas.
4
UNIDADE 2 – POPULAÇÃO E AMOSTRA
VARIÁVEIS
Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
Tipos de Variáveis
  Nominal
Qualitativa 
 Ordinal
Variável
Quantitativa Discreta
 
 Contínua
Variáveis Qualitativas
São variáveis que apresentam como possíveis realizações uma qualidade (ou atributo) do
que se está investigando.
Ex.: População: Moradores de uma cidade.

Variáveis: Sexo, grau de instrução, estado civil, classe social.
Variável Qualitativa Nominal
Variável para a qual não existe nenhuma ordenação nas prováveis realizações.

Variáveis: Sexo e estado civil.
Variável Qualitativa Ordinal
Variável para a qual existe uma certa ordem nos possíveis resultados.

Variáveis: Grau de instrução e classe social.
Variáveis Quantitativas
São variáveis que têm seus valores expressos em números.

Variáveis: Número de filhos, idade, peso, altura.
Variável Quantitativa Discreta
São aquelas cujos possíveis valores formam um conjunto finito ou enumerável de números e
que resultam, freqüentemente, de uma contagem.

Variáveis: Número de filhos.
5
Variável Quantitativa Contínua
São aquelas cujos possíveis valores formam um intervalo de números reais e que resultam,
normalmente, de uma mensuração (medida).

Variáveis: Idade, peso e altura.
POPULAÇÃO E AMOSTRA
Por definição população é o conjunto de indivíduos (ou objetos), que tem pelo menos uma
característica em comum.
Amostra é qualquer subconjunto da população.
As medidas estatísticas utilizadas para descrever uma característica da população são
chamadas de parâmetros.
As medidas estatísticas utilizadas para descrever uma característica da amostra são
chamadas de estatísticas.
TÉCNICAS DE AMOSTRAGEM
Para que possamos inferir sobre as características de uma população é necessário que a
amostra seja representativa da mesma. Através das Técnicas de Amostragem podemos obter
amostras representativas da população.
Amostragem Casual ou Aleatória Simples
Neste tipo de amostragem os elementos são retirados ao acaso da população. Assim, cada
elemento da população tem a mesma probabilidade de fazer parte da amostra.
Para a sua realização, numera-se a população de 1 até n e a partir de um dispositivo aleatório
(como uma tabela de números aleatórios) são sorteados os k elementos que farão parte da amostra.
Exemplo: De uma população de 90 alunos sortear uma amostra de 10% deles (9 alunos).
Primeiramente, numeramos os alunos de 01 até 90. Com o auxílio de uma Tabela de

Números Aleatórios (Apêndice A) e definindo o critério de utilização desta tabela, sorteamos os
elementos que irão fazer parte da amostra.
Se definirmos que o critério de utilização da tabela será da esquerda para a direita,
começando pela primeira linha, teremos que selecionar de dois em dois algarismos, uma vez que o
total da população em estudo tem dois algarismos (90). Assim, os elementos selecionados são:
72 16 59 83 00 04 85 15 91 15 51 42 50
Os números 00 e 91 foram desprezados por não fazerem parte da população, assim como o
segundo número 15. Logo, os alunos que farão parte da amostra são:
72 16 59 83 04 85 15 51 42
6
Amostragem Proporcional Estratificada
A amostragem estratificada é utilizada quando a população se divide em subpopulações

(estratos).
A variável de estudo pode apresentar um comportamento homogêneo dentro de cada estrato
e heterogêneo entre os estratos, assim, torna-se necessário que a composição da amostra leve em
consideração os estratos.
Exemplo: Se no exemplo anterior a população de 90 alunos fosse dividida em 54 meninos e 36

meninas e desejássemos obter uma amostra proporcional estratificada de 10% deles teríamos então
dois estratos (um do sexo masculino e outro do sexo feminino).
Sexo População 10% Tamanho da Amostra

Masculino 54 10 x 54 5
= 5,4
100
Feminino 36 10 x 36 4
= 3,6
100
Total 90 10 x 90 9
= 9,0
100
Primeiramente, numeramos os alunos de 01 até 90, sendo que de 01 até 54 são os meninos e
de 55 até 90 são as meninas. Com o auxílio da Tabela de Números Aleatórios (Apêndice A) e
definindo o critério de utilização desta tabela, sorteamos os elementos que irão fazer parte da
amostra.
Se definirmos que o critério de utilização da tabela será a primeira coluna e a segunda
coluna da esquerda, de cima para baixo. Assim, os elementos selecionados são:
72 25 72 00 64 63 05 99 06
75 06 58 10 70 81 44 60 43
Meninos: 25 05 06 10 44
Meninas: 72 64 63 75
Amostragem Sistemática
A amostragem sistemática é utilizada quando os elementos da população já se encontram

ordenados. São exemplos os prontuários dos pacientes de um médico, os prédios de uma rua, os
elementos de uma linha de produção, etc. Assim, a seleção dos elementos que irão compor a
amostra pode ser feita através de um sistema definido pelo pesquisador.
Exemplo: Suponha um consultório médico com 900 pacientes que se deseja obter uma amostra de
50 pacientes.
Tamanho da população 900
Primeiramente, calculamos a seguinte razão: = = 18 ,
Tamanho da amostra 50
escolhemos por sorteio aleatório um número entre 1 e 18 (inclusive), e a partir daí retira-se
periodicamente de 18 em 18.
Se o número sorteado fosse o 4, selecionaríamos na amostra o 4º prontuário, o 22º
prontuário (4 + 18), o 40º prontuário (22 + 18), o 58º prontuário (40 + 18), etc.
7
UNIDADE 3 – SÉRIES ESTATÍSTICAS
SÉRIES ESTATÍSTICAS
Uma série estatística é definida como toda e qualquer coleção de dados estatísticos. Em uma
série estatística observa-se a existência de três elementos (ou fatores):
a) a época (fator temporal ou cronológico) a que se refere o fenômeno analisado;
b) o local (fator espacial ou geográfico) onde o fenômeno acontece;
c) o fenômeno (espécie do fato ou fator especificativo) que é descrito.
Conforme varie um dos elementos da série, pode-se classificá-la em histórica, geográfica ou

específica.
Séries Históricas, Cronológicas, Temporais ou Marchas
São séries que descrevem os valores da variável, em determinado local, discriminados

segundo intervalos de tempo variáveis. Assim, o elemento variável é a época enquanto o local e o
fenômeno são fixos.
Exemplo:
Distribuição do Número de Internações Hospitalares no Brasil
Segundo Mês de Competência. 2000.
Nº
Mês de Competência
Internações
Janeiro 993.204
Fevereiro 1.006.409
Março 1.013.642
Abril 1.028.015
Maio 1.025.876
Junho 991.928
Julho 996.413
Agosto 1.010.099
Setembro 970.688
Outubro 978.005
Novembro 977.334
Dezembro 945.710
TOTAL 11.937.323
Fonte: SIH/SUS
Séries Geográficas, Espaciais, Territoriais ou de Localização
São séries que descrevem os valores da variável, em determinado instante, discriminados

segundo regiões. Assim, o elemento variável é o local (fator geográfico) enquanto a época e o
fenômeno são fixos.
8
Exemplo:
Distribuição do Número de Internações Hospitalares
Segundo Regiões do Brasil. 2000.
Nº
Região
Internações
Região Norte 914.104
Região Nordeste 3.601.780
Região Sudeste 4.536.395
Região Sul 1.983.313
Região Centro-Oeste 901.731
TOTAL 11.937.323
Fonte: SIH/SUS
Séries Específicas
São séries que descrevem os valores da variável, em determinado tempo e local,

discriminados segundo especificações ou categorias. Assim, o elemento variável é o fenômeno
(fator especificativo) enquanto a época e o local são fixos.
Exemplo:
Distribuição do Número de Internações Hospitalares no Brasil
Segundo Capítulos da CID. 2000.
Capítulos da CID Nº Internações

I. Algumas doenças infecciosas e parasitárias 888.613
II. Neoplasias (tumores) 388.064
III. Doenças sangue órgãos hemat e transt imunitár 71.068
IV. Doenças endócrinas nutricionais e metabólicas 302.888
V. Transtornos mentais e comportamentais 422.836
VI. Doenças do sistema nervoso 212.364
VII. Doenças do olho e anexos 85.400
VIII.Doenças do ouvido e da apófise mastóide 21.228
IX. Doenças do aparelho circulatório 1.134.385
X. Doenças do aparelho respiratório 1.936.444
XI. Doenças do aparelho digestivo 1.013.732
XII. Doenças da pele e do tecido subcutâneo 135.848
XIII.Doenças sist osteomuscular e tec conjuntivo 243.735
XIV. Doenças do aparelho geniturinário 837.978
XV. Gravidez parto e puerpério 2.913.953
XVI. Algumas afec originadas no período perinatal 258.770
XVII.Malf cong deformid e anomalias cromossômicas 84.040
XVIII.Sint sinais e achad anorm ex clín e laborat 146.904
XIX. Lesões enven e alg out conseq causas externas 629.829
XX. Causas externas de morbidade e mortalidade 64.132
XXI. Contatos com serviços de saúde 145.086
CID 10ª Revisão não disponível ou não preenchido 26
TOTAL 11.937.323
Fonte: SIH/SUS
9
REPRESENTAÇÃO TABULAR
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que se tenha uma visão global da variação dessa ou dessas variáveis. Esse objetivo é
inicialmente alcançado através da construção de tabelas e gráficos.
A tabela é utilizada para resumir um conjunto de observações.
Uma tabela é composta de:
a) corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
b) cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
c) coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
d) título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O
quê?, Quando?, Onde?, localizado no topo da tabela;
e) fonte: origem dos dados. A fonte é localizada no rodapé da tabela.
Título Distribuição do Número de Internações Hospitalares

Segundo Regiões do Brasil. 2000.
Cabeçalho Cabeçalho
Região Nº
Coluna Internações
indicadora Região Norte 914.104
Região Nordeste 3.601.780 Corpo
Região Sudeste 4.536.395
Região Sul 1.983.313
Região Centro-Oeste 901.731
TOTAL 11.937.323
Rodapé Fonte: SIH/SUS
TABELA DE DUPLA ENTRADA (SÉRIES CONJUGADAS)
Pode-se apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto
é, a conjugação de duas ou mais séries.
Conjugando duas séries em uma única tabela, obtém-se uma tabela de dupla entrada. Nesse
tipo de tabela ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical
(coluna).
Exemplo:
Distribuição do Número de Internações Hospitalares
Segundo Regiões do Brasil e Ano de Competência. 1998-2000.
Região 1998 1999 2000 Total

Região Norte 849.145 923.542 914.104 2.686.791
Região Nordeste 3.508.468 3.582.825 3.601.780 10.693.073
Região Sudeste 4.550.048 4.573.841 4.536.395 13.660.284
Região Sul 1.958.122 1.990.983 1.983.313 5.932.418
Região Centro-Oeste 848.973 879.606 901.731 2.630.310
TOTAL 11.714.756 11.950.797 11.937.323 35.602.876
Fonte: SIH/SUS
10
No exemplo apresentado houve a conjugação de uma série geográfica com uma série
histórica, originando uma série geográfica-histórica ou histórica-geográfica.
DISTRIBUIÇÃO DE FREQÜÊNCIAS
Freqüência de um dado valor de uma variável (qualitativa ou quantitativa) é o número de

vezes que esse valor foi observado.
Exemplo:
Distribuição por sexo dos adolescentes das Classes Sociais A e B.
Sexo Nº de adolescentes
Masculino 289
Feminino 155
Total 444
Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro.
CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999.
DADOS ABSOLUTOS E DADOS RELATIVOS
Dados absolutos são os dados estatísticos resultantes da coleta direta da fonte sem qualquer
tratamento além da contagem ou medida.
Os dados relativos representam o resultado de comparações por quocientes (razões) entre
dados absolutos, que tem por finalidade facilitar as comparações entre quantidades. As
percentagens, os índices, os coeficientes e as taxas são tipos de dados relativos.
As Percentagens
Considere a tabela a seguir:

Sexo Nº de adolescentes
Masculino 289
Feminino 155
Total 444
Calculando as percentagens dos adolescentes de cada sexo, temos:
289 x 100
Masculino → = 65,09 = 65,1
444
155 x 100
Feminino → = 34,91 = 34,9
444
11
Com a inclusão de uma nova coluna na série, temos:

Sexo Nº de adolescentes %
Masculino 289 65,1
Feminino 155 34,9
Total 444 100,0
Assim, os valores dessa nova coluna nos revelam que de cada 100 adolescentes
entrevistados nas Classes Sociais A e B, aproximadamente, 65 são do sexo masculino e 35 são do
sexo feminino.
A percentagem é muito usada quando desejamos verificar a participação da parte no todo.
Considere a tabela a seguir:
Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).
Nº de adolescentes das Classes Sociais
Sexo AeB C, D e E
Masculino 289 242
Feminino 155 228
Total 444 470
Qual dos grupos de Classes Sociais tem, comparativamente, maior número de adolescentes
em cada sexo?
Como o número total de adolescentes não é o mesmo nos dois grupos, não podemos fazer a
comparação pelo valor absoluto. Assim, devemos usar a percentagem para fazer essa comparação.
Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).
Classes Sociais A e B Classes Sociais C, D e E
Sexo Nº de adolescentes % Nº de adolescentes %
Masculino 289 65,1 242 51,5
Feminino 155 34,9 228 48,5
Total 444 100,0 470 100,0
Observa-se que as Classes Sociais A e B, contam com mais adolescentes do sexo masculino
(65 em cada 100 adolescentes são do sexo masculino nessas Classes Sociais), enquanto nas Classes
Sociais C, D e E essa relação é de, aproximadamente, 52 adolescentes do sexo masculino para cada
100 adolescentes.
12
Os Índices
Os índices representam razões entre duas grandezas, sendo que uma não inclui a outra.
Exemplos:
peso
a) Índice de massa corporal (IMC):
altura 2
população
b) Densidade demográfica:
sup erfície
total da produção
c) Produção per capita:
população
consumo do bem
d) Consumo per capita:
população
renda
e) Renda per capita:
população
receita
f) Receita per capita:
população
Produção per capita, Consumo per capita, Renda per capita e Receita per capita são índices
econômicos.
Os Coeficientes
Os coeficientes representam razões entre o número de ocorrências e o número total. Onde o

número total é o número de ocorrências somado ao número de não ocorrências.
Exemplos:
número de nascimentos
a) Coeficiente de natalidade:
população total
número de óbitos
b) Coeficiente de mortalidade:
população total
número de alunos evadidos

c) Coeficiente de evasão escolar:
número inicial de matrículas
número de alunos aprovados

d) Coeficiente de aproveitamento escolar:
número final de matrículas
13
número de alunos recuperados

e) Coeficiente de recuperação escolar:
número de alunos em recuperação
Coeficiente de evasão escolar, Coeficiente de aproveitamento escolar e Coeficiente de

recuperação escolar são coeficientes educacionais.
As Taxas
As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc).
Exemplos:
a) Taxa de natalidade: Coeficiente de natalidade x 1.000
b) Taxa de mortalidade: Coeficiente de mortalidade x 1.000
c) Taxa de evasão escolar: Coeficiente de evasão escolar x 100
d) Taxa de aproveitamento escolar: Coeficiente de aproveitamento escolar x 100
e) Taxa de recuperação escolar: Coeficiente de recuperação escolar x 100
Exercícios:
Com base nos dados abaixo, divulgados pelo IBGE, para o Município do Rio de Janeiro, em 2001,
calcule:
a) Densidade demográfica;
b) Coeficiente de natalidade;
c) Coeficiente de mortalidade;
d) Taxa de natalidade;
e) Taxa de mortalidade.
Nascidos vivos: 84.865 nascimentos

Óbitos: 53.409 óbitos
População: 5.897.485 habitantes
Área do Município do Rio de Janeiro: 1.182,296 km2
14
UNIDADE 4 – GRÁFICOS ESTATÍSTICOS
GRÁFICO ESTATÍSTICO
O gráfico estatístico é uma forma de apresentação dos resultados que tem a função de
facilitar a compreensão através de seu efeito visual imediato. Essa característica é uma vantagem
que os gráficos têm em relação às tabelas, uma vez que a impressão que eles produzem é mais
rápida.
Os gráficos devem apresentar:
a) Simplicidade: O gráfico não deve conter elementos desnecessários à sua construção que
possam levar a uma análise mais demorada ou até mesmo errônea;
b) Clareza: o gráfico deve apresentar de forma clara os valores observados no fenômeno em
estudo, possibilitando a sua correta interpretação;
c) Veracidade: o gráfico deve representar a verdade sobre o fenômeno em estudo.
DIAGRAMAS
Os diagramas são gráficos geométricos. Entre os diagramas destacam-se:

a) O gráfico em linha ou em curva;
b) O gráfico em colunas ou em barras;
c) O gráfico em colunas ou em barras múltiplas;
d) O gráfico em setores.
O Gráfico em Linha ou em Curva
O gráfico de linha é uma representação em um sistema de coordenadas cartesianas. O

sistema é formado por duas retas perpendiculares que são os eixos das abscissas (eixo dos valores
de x – horizontal) e das ordenadas (eixo dos valores de y – vertical). O ponto de interseção dos
eixos é chamado de origem.
Após a determinação de todos os pares ordenados (x,y) da série, estes são unidos por
segmentos de reta, o que formará o gráfico em linha da série em estudo.
Exemplo:
Produção Brasileira de Trigo
1991-2001
Quantidade
Anos
(em toneladas)
1991 2.916.823
1992 2.795.598
1993 2.197.354
1994 2.096.259
1995 1.533.871
1996 3.292.759
1997 2.489.070
1998 2.269.847
1999 2.461.856
2000 1.725.792
2001 3.366.599
Fonte: IBGE - Produção Agrícola Municipal
15
Produção Brasileira de Trigo

1991-2001
4.000.000
3.000.000
Toneladas
2.000.000
1.000.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Fonte: IBGE - Produção Agrícola Municipal
O Gráfico em Colunas ou em Barras
Estes gráficos representam a série em estudo através de retângulos verticais (gráficos em

colunas) ou horizontais (gráficos em barras).
No gráfico em colunas os retângulos que o formam têm a mesma base enquanto suas alturas
são proporcionais aos dados apresentados.
No gráfico em barras os retângulos que o formam têm a mesma altura enquanto seus
comprimentos são proporcionais aos dados apresentados.
Exemplo:
a) Gráfico em colunas
Produção Brasileira de Carvão Vegetal

1991-2001
Quantidade
Anos
(em toneladas)
1991 2.088.822
1992 1.920.077
1993 2.051.962
1994 2.382.695
1995 2.481.839
1996 2.602.540
1997 3.784.064
1998 3.042.789
1999 2.536.847
2000 2.385.516
2001 2.092.309
Fonte: IBGE - Silvicultura
16
Produção Brasileira de Carvão Vegetal

1991-2001
4.000.000
3.000.000
Toneladas
2.000.000
1.000.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Fonte: IBGE - Silvicultura
b) Gráfico em barras
Número de Nascidos Vivos Segundo

Unidades da Federação da Região Sudeste
2001
Unidades da Número de
Federação Nascidos Vivos
Minas Gerais 275.502
Espírito Santo 71.026
Rio de Janeiro 210.090
São Paulo 627.678
Fonte: IBGE - Estatísticas do Registro Civil
Número de Nascidos Vivos Segundo

Unidades da Federação da Região Sudeste
2001
São Paulo
Rio de Janeiro
Espírito Santo
Minas Gerais
0 100.000 200.000 300.000 400.000 500.000 600.000 700.000

17
O Gráfico em Colunas ou em Barras Múltiplas
Este gráfico é geralmente utilizado quando se deseja representar dois ou mais fenômenos
comparando-os.
Exemplo:
Número de Processos de Divórcio no Brasil

Encerrados em 1ª Instância Segundo Tipo de Processo
1991-2001
Tipo de Processo
Anos
Consensual Não Consensual
1991 59.028 23.464
1992 64.264 24.220
1993 68.094 26.674
1994 68.651 27.163
1995 70.535 29.207
1996 69.789 26.537
1997 76.892 28.680
1998 75.292 29.651
1999 88.330 35.953
2000 87.489 37.116
2001 88.031 36.800
Número de Processos de Divórcio no Brasil

Encerrados em 1ª Instância Segundo Tipo de
Processo 1991-2001
90.000
60.000
30.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Consensual Não consensual
O Gráfico em Setores
O gráfico em setores é construído usando como base um círculo. Os setores representam a

participação de cada uma das categorias observadas no total.
Para calcular cada um dos setores emprega-se uma regra de três simples e direta, onde a
medida total da circunferência (360º) corresponde ao total da série.
18
Exemplo:
Produção de Leite Segundo

Unidades da Federação da Região Sul
2001
Unidades da Produção de leite
Federação (em milhares de litros)
Paraná 1.889.627
Santa Catarina 1.076.084
Rio Grande do Sul 2.222.054
Total 5.187.765
Fonte: IBGE - Pesquisa Pecuária Municipal
Para calcular o setor que irá representar o Paraná:
360 o ______ 5.187.765 1.889.627 x 360 o

X= = 131,1o
X ______ 1.889.627 5.187.765
Para calcular o setor que irá representar Santa Catarina:
360 o ______ 5.187.765 1.076.084 x 360 o

X= = 74,7 o
X ______ 1.076.084 5.187.765
Para calcular o setor que irá representar o Rio Grande do Sul:
360 o ______ 5.187.765 2.222.054 x 360 o

X= = 154,2 o
X ______ 2.222.054 5.187.765
Produção de Leite Segundo Unidades da

Federação da Região Sul
2001
Paraná
Santa Catarina
Rio Grande do Sul
Fonte: IBGE - Pesquisa Pecuária Municipal

19
UNIDADE 5 – DISTRIBUIÇÃO DE FREQÜÊNCIA
TABELA PRIMITIVA E ROL
Chama-se tabela primitiva ao conjunto de valores observados e não organizados

numericamente.
Rol é a tabela que se obtém após a ordenação (crescente ou decrescente) dos dados
observados.
Exemplos:
Considere uma coleta de dados relativos aos pesos de 40 alunos, que compõem uma amostra
de alunos de um colégio.
Tabela Primitiva:
66 59 47 62 60 62 61 54 64 53
58 56 52 58 68 50 57 57 68 53
60 56 62 52 60 54 61 63 69 62
46 57 63 59 61 61 49 63 64 56
Rol:
46 47 49 50 52 52 53 53 54 54
56 56 56 57 57 57 58 58 59 59
60 60 60 61 61 61 61 62 62 62
62 63 63 63 64 64 66 68 68 69
DISTRIBUIÇÃO DE FREQÜÊNCIA
Freqüência de um dado valor de uma variável (qualitativa ou quantitativa) é o número de

vezes que esse valor foi observado. A tabela onde são apresentadas as respostas da variável e suas
respectivas freqüências recebe o nome de distribuição de freqüências.
20
Exemplo:
Pesos de 40 alunos
de um colégio
Peso (em kg) Freqüência
46 1
47 1
49 1
50 1
52 2
53 2
54 2
56 3
57 3
58 2
59 2
60 3
61 4
62 4
63 3
64 2
66 1
68 2
69 1
Total 40
Em algumas situações a construção da distribuição de freqüências para uma certa variável

não resumirá a sua forma de apresentação, pois podem não existir muitas observações semelhantes
nesta variável. A solução é agrupar os dados por faixas (intervalos de classe).
Assim, agrupando os resultados em intervalos, como por exemplo, 46 ├ 50, diremos que
existem 3 alunos com pesos entre 46, inclusive, e 50 kg, ao invés de dizermos que existe 1 aluno
com 46 kg, 1 aluno com 47 kg e 1 aluno com 49 kg.
O símbolo ├ que aparece entre os valores do intervalo indica que o intervalo é fechado à
esquerda e aberto à direita, ou seja, que o valor da esquerda faz parte do intervalo enquanto o valor
da direita não faz parte do intervalo. Assim, em 46 ├ 50, temos que 46 ≤ x < 50.
Exemplo:
Pesos de 40 alunos
de um colégio
Peso (em kg) Freqüência
46 ├ 50 3
50 ├ 54 5
54 ├ 58 8
58 ├ 62 11
62 ├ 66 9
66 ├ 70 4
Total 40
21
A construção dos intervalos de classes tem suas vantagens e desvantagens. A principal

vantagem é que conseguimos uma redução na apresentação da distribuição de freqüências, que
neste caso é uma distribuição de freqüência com intervalos de classe. A principal desvantagem está
na perda do valor original, assim tomando como base o intervalo de classe 50 ├ 54, podemos
afirmar que 5 alunos possuem peso entre 50 (inclusive) e 54 kg, porém não podemos precisar
quantos alunos têm 50 kg, quantos têm 51 kg, quantos têm 52 kg e quantos têm 53 kg.
A construção de intervalos de classes é mais recomendada quando a variável é quantitativa
contínua uma vez que a variação das respostas desse tipo de variável costuma ser maior que a
variação das respostas de uma variável quantitativa discreta.
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
Os elementos que compõem uma distribuição de freqüências são:

a) Classe;
b) Limites de classe;
c) Amplitude de um intervalo de classe;
d) Amplitude total da distribuição;
e) Amplitude amostral;
f) Ponto médio de uma classe;
g) Freqüência simples ou absoluta.
a) Classe
Os intervalos de variação da variável são chamados de classes de freqüências ou classes.

Representamos as classes pela letra “i”, de tal forma que i=1, 2, 3, ..., k, onde k é o número
total de classes da distribuição.
No nosso exemplo, a distribuição possui seis classes (k = 6). O intervalo 58 ├ 62 define a
quarta classe (i = 4).
b) Limites de classe
Limites de classes são os valores que definem cada um dos intervalos de classe.
O menor valor do intervalo de classe i é o limite inferior da classe (li) e o maior valor do
intervalo de classe i é o limite superior da classe (Li).
Na quarta classe (58 ├ 62) do nosso exemplo temos:
l4 = 58 e L4 = 62
22
c) Amplitude de um intervalo de classe
A amplitude de um intervalo de classe (hi) é a distância entre o limite superior da classe e o

limite inferior da classe, ou seja, é a diferença entre o limite superior da classe e o limite inferior da
classe.
h i = Li − li
h 4 = L 4 − l 4 = 62 − 58 = 4 ⇒ h 4 = 4 kg
d) Amplitude total da distribuição
A amplitude total da distribuição (AT) é a distância entre o limite superior da última classe
(limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo), ou seja, é a
diferença entre o limite superior máximo e o limite inferior mínimo.
AT = L(máx.) − l(mín.)
No nosso exemplo temos:
AT = 70 − 46 = 24 ⇒ AT = 24 kg
Obs.: Se todas as classes possuem a mesma amplitude, como no nosso exemplo, verifica-se a
relação:
AT
=k
hi
24
=6
4
e) Amplitude amostral
A amplitude amostral (AA) é a diferença entre o maior valor e o menor valor observado na
amostra.
AA = x (máx.) − x (mín.)
AA = 69 − 46 = 23 ⇒ AA = 23 kg
23
f) Ponto médio de uma classe
O ponto que divide o intervalo de classes em duas partes iguais é chamado de ponto médio
de uma classe, e é representado por xi. O ponto médio de uma classe é o valor que a representa.
O ponto médio de uma classe é obtido somando-se o limite inferior da classe com o limite
superior da classe e dividindo o resultado dessa soma por 2, ou seja através da média aritmética dos
limites da classe.
li + Li
xi =
2
l 4 + L 4 58 + 62 120
x4 = = = = 60 ⇒ x 4 = 60 kg
2 2 2
g) Freqüência simples ou absoluta
Freqüência simples ou freqüência absoluta ou, simplesmente, freqüência de uma classe ou

de um valor individual é o número de observações correspondentes a essa classe ou a esse valor, ou
seja, é o número de vezes que essa classe ou esse valor foi observado.
Representamos a freqüência absoluta por fi (freqüência da i-ésima classe).
f1 = 3, f2 = 5, f3 = 8, f4 = 11, f5 = 9 e f6 = 4
A soma de todas as freqüências absolutas é o número total de elementos observados.
k
∑ fi = n .
i =1
k
∑ f i = 40 ou simplesmente ∑ f i = 40
i =1
Pesos de 40 alunos
de um colégio
i Peso (em kg) fi
1 46 ├ 50 3
2 50 ├ 54 5
3 54 ├ 58 8
4 58 ├ 62 11
5 62 ├ 66 9
6 66 ├ 70 4
Total ∑ f i = 40
24
NÚMERO DE CLASSES DOS INTERVALOS DE CLASSE
A determinação do número de classes, das amplitudes das classes e dos limites dos
intervalos de classe é uma preocupação que o pesquisador deve ter na construção da distribuição de
freqüências.
Usualmente, utilizamos a Regra de Sturges que fornece o número de classes em função do
número de observações da variável e é dada por:
k ≅ 1 + 3,3 log n
onde:
k é o número de classes
n é o número total de observações
Com base na Regra de Sturges tem-se a seguinte tabela:
Número de classes das distribuições

de freqüências aplicando a
Regra de Sturges
n k
3 a 5 3
6 a 11 4
12 a 23 5
24 a 46 6
47 a 93 7
94 a 187 8
188 a 376 9
377 a 756 10
757 a 1519 11
1520 a 3053 12
... ...
Além da Regra de Sturges existem outras fórmulas usadas para a determinação do número
de classes que deve ter a distribuição de freqüências, como por exemplo, k ≅ n , porém o número
de classes depende mais de um julgamento pessoal por parte do pesquisador que deve considerar a
natureza dos dados, sua unidade e o objetivo da pesquisa, evitando classes com freqüência zero e,
também, uma grande concentração de dados em uma única classe.
Para se determinar a amplitude dos intervalos de classe, dividimos a amplitude amostral pelo
número de classes:
AA
h=
k
Quando o resultado não é exato devemos arrendondá-lo para mais.

Para a escolha dos limites dos intervalos devemos ter em mente que os mesmos devem
fornecer como pontos médios, números que facilitem os cálculos.
No nosso exemplo, como n = 40, pela tabela da Regra de Sturges, k = 6.
Assim,
AA 69 − 46 23
h= = = = 3,8 ≅ 4
k 6 6
25
Logo, a amplitude de cada um dos intervalos de classe é 4.
TIPOS DE FREQÜÊNCIAS
Freqüências simples ou absolutas (fi)
As freqüências simples ou absolutas (fi) são os valores que representam o número de

observações de cada classe.
A soma das freqüências absolutas é o número total de observações.
∑ fi = n
Freqüências relativas (fri)
As freqüências relativas são as razões entre as freqüências absolutas e a freqüência total.
fi f
fri = = i
∑ fi n
Logo, a freqüência relativa da segunda classe do nosso exemplo é:
f3 8
fr3 = ⇒ fr3 = = 0,200 ⇒ fr3 = 0,200
∑ fi 40
A soma de todas as freqüências relativas de uma distribuição de freqüências é igual a 1 ou

100%.
∑ fri = 1
Freqüência acumulada (Fi)
A freqüência acumulada é o total de observações até o limite superior do intervalo de uma

dada classe. Serve para indicar quantos elementos estão até um certo limite.
Fi = f1 + f 2 + L + f k ou Fi = ∑ f i , (i = 1, 2, L , k )
A freqüência acumulada até a quarta classe do nosso exemplo é:
4
F4 = ∑ f i = f1 + f 2 + f 3 + f 4 ⇒ F4 = 3 + 5 + 8 + 11 ⇒ F4 = 27
i =1
Esse resultado indica que 27 alunos têm peso inferior a 62 kg (limite superior do intervalo
da quarta classe).
26
Freqüência acumulada relativa (Fri)
A freqüência acumulada relativa de uma classe é a freqüência acumulada da classe dividida

pelo número total de observações (freqüência total). Serve para indicar que proporção dos
elementos está até um certo limite.
Fi
Fri =
∑ fi
A freqüência acumulada relativa até a quarta classe do nosso exemplo é:
F4 27
Fr4 = ⇒ Fr4 = = 0,675 ⇒ Fr4 = 0,675
∑ fi 40
Com as freqüências estudadas podemos montar a seguinte tabela para o nosso exemplo:
Pesos de 40 alunos de um colégio

i Peso (em kg) fi xi fri Fi Fri
1 46 ├ 50 3 48 0,075 3 0,075
2 50 ├ 54 5 52 0,125 8 0,200
3 54 ├ 58 8 56 0,200 16 0,400
4 58 ├ 62 11 60 0,275 27 0,675
5 62 ├ 66 9 64 0,225 36 0,900
6 66 ├ 70 4 68 0,100 40 1,000
∑ = 40 ∑ = 1,000
DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE
Distribuição de freqüência sem intervalos de classe é a distribuição de freqüência usada para

representar a variável quantitativa discreta, uma vez que esse tipo de variável, geralmente,
apresenta pouca variação nos seus valores observados.
Exemplo:
Seja x a variável “número de livros lidos por 20 alunos, de um colégio, no período de um

ano”.
Número de livros lidos por 20 alunos,

de um colégio, no período de um ano
i xi fi
1 2 1
2 3 2
3 4 4
4 5 4
5 6 6
6 7 3
∑ = 20
27
Calculando os vários tipos de freqüências, temos:
Número de livros lidos por 20 alunos,

de um colégio, no período de um ano
i xi fi fri Fi Fri
1 2 1 0,050 1 0,050
2 3 2 0,100 3 0,150
3 4 4 0,200 7 0,350
4 5 4 0,200 11 0,550
5 6 6 0,300 17 0,850
6 7 3 0,150 20 1,000
∑ = 20 ∑ = 1,000
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO
Uma distribuição de freqüência pode ser representada graficamente pelo histograma, pelo
polígono de freqüências e pelo polígono de freqüências acumuladas, que são os gráficos utilizados
para a representação de uma variável quantitativa contínua.
A construção desses gráficos baseia-se no sistema de coordenadas cartesianas. No eixo das
abscissas (horizontal) são colocados os valores da variável e no eixo das ordenadas (vertical) são
colocadas as freqüências.
Histograma
O histograma é um gráfico formado por um conjunto de retângulos justapostos que tem as

bases sobre o eixo das abscissas (eixo dos x), com centro no ponto médio e as larguras iguais as
amplitudes dos intervalos das classes. As áreas de cada um dos retângulos do histograma são
proporcionais as freqüências das classes.
Quando todos os intervalos de classes têm a mesma amplitude, as alturas dos retângulos são
proporcionais às freqüências das classes. Se as amplitudes de todos os intervalos de classes não
forem iguais, as alturas de cada uma das barras do histograma deverão sofrer ajustes de tal forma
que as áreas continuem proporcionais as freqüências das classes.
28
12
6
f
0
44 48 52 56 60 64 68 72
X
Polígono de freqüências
O polígono de freqüências é um gráfico em linha obtido através da união dos pontos médios
dos patamares do histograma. Para completar a figura consideram-se duas classes laterais, uma
imediatamente anterior a primeira e outra imediatamente posterior a ultima, ambas com freqüências
nulas.
12
6
f
0
44 48 52 56 60 64 68 72
X
29
Polígono de freqüências acumuladas
O polígono de freqüências acumuladas é traçado verificando-se as freqüências acumuladas

ao final de cada uma das classes.
40
30
20
F
10
0
46 50 54 58 62 66 70
X
Exercícios:
Os dados abaixo são relativos às idades de 20 alunos de um colégio.
10 17 9 15 13
11 9 12 14 14
15 12 11 13 9
8 6 11 19 5
Com base nessas informações, construa uma distribuição de freqüências para essa variável e
calcule:
a) a freqüência relativa;
b) a freqüência acumulada;
c) a freqüência acumulada relativa;
d) a amplitude dos intervalos de classes;
e) os pontos médios das classes;
f) a amplitude total da distribuição.
Faça um esboço do histograma, do polígono de freqüências e do polígono de freqüências

acumuladas.
30
UNIDADE 6 – MEDIDAS DE POSIÇÃO
INTRODUÇÃO
As medidas de posição são usadas para resumir os dados apresentando um ou alguns valores
para representar a série toda.
Entre as medidas de posição destacam-se: a média aritmética, a moda e a mediana, que
também são chamadas de medidas de tendência central uma vez que os dados observados,
geralmente, se agrupam em torno de valores centrais.
MÉDIA ARITMÉTICA (X )
A média aritmética de um conjunto de “n” números x1, x2, ..., xn, é representada por X (leia-
se “X barra”) e definida pela soma das observações dividida pelo número total delas, ou seja, é o
quociente da divisão da soma de todos os valores da variável pelo número deles.
x 1 + x 2 + ... + x n ∑ x i
X= =
n n
onde:
X = a média aritmética;
x i = os valores da variável;
n = o número de observações.
Média aritmética para dados não-agrupados
Exemplo: A média aritmética dos números 2, 8, 3, 6, 11 é:
2 + 8 + 3 + 6 + 11 30
X= = =6
5 5
Média aritmética para dados agrupados
a) Sem intervalos de classe
Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem
com as freqüências f1, f2, ..., fk) a média aritmética será definida por:
f x + f 2 x 2 + ... + f k x k ∑ f i x i ∑ f i x i
X= 1 1 = =
f1 + f 2 + ... + f k ∑ fi n
31
Exemplo: Calcule a média aritmética para a distribuição do número de viagens realizadas por 20
famílias no período de um ano.
Número de viagens realizadas por

20 famílias no período de um ano
xi fi f ix i
0 3 0
1 4 4
2 7 14
3 6 18
∑ = 20 ∑ = 36
X=
∑ f i x i = 36 = 1,8 ⇒ X = 1,8 viagens
n 20
b) Com intervalos de classe
Quando os dados são apresentados em uma distribuição de freqüências com intervalos de

classe, todos os valores incluídos em um certo intervalo de classes são considerados coincidentes
com o ponto médio do intervalo (xi) e a média aritmética é dada por:
X=
∑ fi xi
n
Exemplo: Calcule a média aritmética para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi xi f ix i
1 46 ├ 50 3 48 144
2 50 ├ 54 5 52 260
3 54 ├ 58 8 56 448
4 58 ├ 62 11 60 660
5 62 ├ 66 9 64 576
6 66 ├ 70 4 68 272
∑ = 40 ∑ =2360
X=
∑ fi x i = 2360 = 59 ⇒ X = 59 kg
n 40
32
MODA (Mo)
A moda de um conjunto de números é o valor que ocorre com maior freqüência, isto é, é o
valor mais comum. A moda pode não existir, e mesmo que ela exista, pode não ser única.
Moda para dados não-agrupados
Quando os valores não estão agrupados, para se calcular a moda basta procurar o valor que
aparece o maior número de vezes.
Exemplos:
a) O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18, tem moda 9.
b) O conjunto 3, 5, 8, 10, 12, 15, 16, não tem moda e é chamado de amodal.
c) O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9, tem duas modas, 4 e 7, e é chamado de bimodal.
Moda para dados agrupados
Quando os valores estão agrupados sem intervalos de classe, a moda é o valor que
apresentar a maior freqüência.
Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no
período de um ano.

xi fi
0 3
1 4
2 7
3 6
∑ = 20
Assim, Mo = 2 viagens.
33
Quando os valores estão agrupados em uma distribuição de freqüências com intervalos de

classe, a classe que apresenta a maior freqüência é chamada de classe modal e para se calcular a
moda utiliza-se a fórmula de Czuber que é dada por:
 D1 
Mo = l * +  × h *
 D1 + D 2 
onde:
Mo = moda;
l* = limite inferior da classe modal;
D1 = diferença entre a freqüência da classe modal e a da classe imediatamente anterior;
D2 = diferença entre a freqüência da classe modal e a da classe imediatamente posterior;
h* = amplitude do intervalo de classe modal.
Exemplo: Calcule a moda para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi
1 46 ├ 50 3
2 50 ├ 54 5
3 54 ├ 58 8
4 58 ├ 62 11 ⇐ Classe modal
5 62 ├ 66 9
6 66 ├ 70 4
∑ = 40
D1 = 11 − 8 = 3
D 2 = 11 − 9 = 2
 D1   3  3 12
Mo = l * +  × h* = 58 +   × 4 = 58 + × 4 = 58 + = 58 + 2,4 = 60,4
 D1 + D 2  3+ 2 5 5
Mo = 60,4 kg
34
MEDIANA (Md)
A mediana de um conjunto de números, ordenados segundo suas grandezas, é o valor que

ocupa a posição central da série de observações ou a média aritmética dos dois valores centrais, ou
seja:
• Para um número ímpar de observações:
Md = x  n +1
 
 2 
• Para um número par de observações:
x n  + x n 
   +1
2 2 
Md =
2
Exemplos:
a) O conjunto dos números 4, 3, 10, 4, 5, 8, 8, 6, 8.
Ordenando o conjunto, temos: 3, 4, 4, 5, 6, 8, 8, 8, 10.

Como o número de observações é ímpar, a mediana é o valor que está na posição central da
série.
Md = x  n +1  = x  9+1  = x  10  = x 5 = 6
     
 2   2   2
b) O conjunto dos números 5, 18, 7, 5, 9, 15, 11, 12.
Ordenando o conjunto, temos: 5, 5, 7, 9, 11, 12, 15, 18.

Como o número de observações é par, a mediana é dada pela média dos valores centrais da
série.
x n  + x n  x 8  + x 8 
   +1    +1 x (4 ) + x (4+1)
2  2  2  2  x 4 + x 5 9 + 11 20
Md = = = = = = = 10
2 2 2 2 2 2
Mediana para dados agrupados
Quando os valores estão agrupados sem intervalos de classe, o cálculo da mediana se

processa de forma semelhante àquela para dados não agrupados, necessitando, porém, que se
calcule primeiramente as freqüências acumuladas.
35
Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no
período de um ano.

xi fi Fi
0 3 3
1 4 7
2 7 14
3 6 20
∑ = 20
Como o número de observações é par, a mediana é dada pela média dos valores centrais da
série.
x n  + x n  x  20  + x  20
   +1    +1 x (10 ) + x (10+1)
2 2   2   2  x 10 + x 11 2 + 2 4
Md = = = = = = =2
2 2 2 2 2 2
Md = 2 viagens

classe, primeiramente, devemos determinar em que intervalo de classe se localiza a mediana. O
intervalo de classe que contém a mediana será aquele cuja freqüência acumulada seja
∑ fi
imediatamente superior à .
2
Identificado o intervalo de classe que contém a mediana, para o seu cálculo, aplica-se a
seguinte fórmula:
 ∑ fi 
 − F(ant )  × h *
Md = l * +  
2
f*
onde:
Md = mediana;
l* = limite inferior da classe da mediana;
∑ f i = soma das freqüências (freqüência total);
F(ant ) = freqüência acumulada até a classe anterior a que contém a mediana;
f* = freqüência da classe da mediana;
h* = amplitude do intervalo de classe da mediana.
36
Exemplo: Calcule a mediana para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi Fi
1 46 ├ 50 3 3
2 50 ├ 54 5 8
3 54 ├ 58 8 16
4 58 ├ 62 11 27 ⇐ Classe da mediana
5 62 ├ 66 9 36
6 66 ├ 70 4 40
∑ = 40
∑ fi 40
= = 20 ⇒ Classe da mediana (i = 4).
2 2
 ∑ fi   40 
 − F(ant )  × h *  − 16  × 4
Md = l * + 
2  = 58 + 
2  = 58 +
(20 − 16) × 4 = 58 + 4 × 4 = 58 + 16 =
f* 11 11 11 11
= 58 + 1,455 = 59,455
Md = 59,5 kg
POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA
Nas distribuições simétricas os valores da média, mediana e moda são iguais. Nas
distribuições assimétricas essas medidas de posição são diferentes e quanto maior for a assimetria
maior será a diferença.
Se a curva for simétrica as três medidas são iguais, ou seja, X = Md = Mo
Se a curva for assimétrica à direita (Assimetria Positiva): Mo < Md < X
Se a curva for assimétrica à esquerda (Assimetria Negativa): X < Md < Mo

37
Exercícios:
Para cada um dos conjuntos, abaixo relacionados, calcule:

a) a média aritmética;
b) a moda;
c) a mediana.
O que se pode dizer sobre a assimetria do conjunto de dados?
Conjunto a)
19; 17; 15; 15; 14; 16.
Conjunto b)
Xi fi
62 1
63 4
64 3
65 2
Total 10
Conjunto c)
Classes fi
46,7 ├ 51,7 5
51,7 ├ 56,7 1
56,7 ├ 61,7 9
61,7 ├ 66,7 3
66,7 ├ 71,7 2
Total 20
38
UNIDADE 7 – MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
INTRODUÇÃO
As medidas de posição servem para sintetizar um conjunto de valores em poucos valores

representativos. Contudo, essas medidas não são suficientes para caracterizar a homogeneidade ou
heterogeneidade entre os valores que compõem o conjunto de dados.
Considere os seguintes conjuntos de valores das variáveis X, Y e Z:
X: 35, 35, 35, 35, 35, 35.
Y: 32, 33, 35, 36, 37, 37.
Z: 8, 19, 21, 35, 54, 73.
Calculando a média aritmética para cada uma das variáveis, temos:
∑ xi 210
X= ⇒ X= = 35
n 6
∑ yi 210
Y= ⇒ Y= = 35
n 6
∑ zi 210
Z= ⇒ Z= = 35
n 6
Os conjuntos X, Y e Z apresentam a mesma média aritmética, 35. Contudo, observa-se que o

conjunto X é o mais homogêneo pois todos os seus valores são iguais a média aritmética. O
conjunto Y é mais homogêneo que o conjunto Z, pois os seus valores estão mais próximos da média
aritmética que os valores observados em Z.
Assim, podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o
conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z.
Para medir os graus ao qual os dados numéricos tendem a dispersar-se em torno de um valor
médio utilizam-se as medidas de dispersão ou de variabilidade. Existem várias medidas de
dispersão ou de variabilidade, sendo as mais comuns a amplitude total, a variância, o desvio padrão
e o coeficiente de variação.
AMPLITUDE TOTAL
Amplitude total para dados não-agrupados
A amplitude total de um conjunto é a diferença entre o maior e o menor valor observado.
AT = x (máx.) − x (mín.)
Exemplo: A amplitude total do conjunto 2, 3, 3, 5, 5, 5, 8, 10, 12 é
AT = 12 − 2 = 10
Quanto maior for a amplitude total dos valores menor será o grau de concentração dos
mesmos. Assim, considerando, novamente, as variáveis X, Y e Z, temos:
X: 35, 35, 35, 35, 35, 35.
Y: 32, 33, 35, 36, 37, 37.
Z: 8, 19, 21, 35, 54, 73.
39
Calculando a amplitude total para cada uma das variáveis, temos:

ATX = 35 − 35 = 0 (dispersão nula)
ATY = 37 − 32 = 5
ATZ = 73 − 8 = 65
Amplitude total para dados agrupados
Quando os valores estão agrupados sem intervalos de classe, a amplitude total também será
a diferença entre o maior e o menor valor observado.
AT = x (máx.) − x (mín.)
Exemplo: Calcule a amplitude total para a distribuição do número de viagens realizadas por 20

xi fi
0 3
1 4
2 7
3 6
=
∑ 20
AT = 3 − 0 = 3 .

classe, a amplitude total é a diferença entre o limite superior do último intervalo de classe e o limite
inferior do primeiro intervalo de classe.
AT = L(máx.) − l(mín.)
40
Exemplo: Calcule a amplitude total para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi
1 46 ├ 50 3
2 50 ├ 54 5
3 54 ├ 58 8
4 58 ├ 62 11
5 62 ├ 66 9
6 66 ├ 70 4
∑ = 40
AT = 70 − 46 = 24
DESVIO PADRÃO
É a raiz média quadrática dos desvios absolutos das observações em relação a média
aritmética.
O desvio padrão de um conjunto de n números x1, x2, ..., xn é representado por “s” e definido
por:
∑ (x i − X )
2
s=
n
onde:
s = desvio padrão;
41
Desvio padrão para dados não-agrupados
Exemplo: Calcular o desvio padrão dos números 2, 8, 3, 6, 11.
2 + 8 + 3 + 6 + 11 30
Primeiramente, calcula-se a média aritmética: X = = =6
5 5
Aplicando a fórmula:
xi xi − X (x i − X )2
2 -4 16
8 2 4
3 -3 9
6 0 0
11 5 25
∑ = 54
∑ (x i − X )
2
54
s= = = 10,8 = 3,286
n 5
Desvio padrão para dados agrupados
com as freqüências f1, f2, ..., fk) o desvio padrão será definido por:
∑ f i (x i − X )
2
s=
n
Exemplo: Calcule o desvio padrão para a distribuição do número de viagens realizadas por 20
Número de viagens realizadas por 20 famílias no período de um a

xi fi f ix i xi − X (x i − X )2 f i (x i − X )2
0 3 0 -1,8 3,24 9,72
1 4 4 -0,8 0,64 2,56
2 7 14 0,2 0,04 0,28
3 6 18 1,2 1,44 8,64
∑ = 20 ∑ = 36 ∑ = 21,2
X=
∑ f i x i = 36 = 1,8
n 20
∑ f i (x i − X )
2
21,2
s= = = 1,06 = 1,0296
n 20
42

com o ponto médio do intervalo (xi) e o desvio padrão é dado por:
∑ f i (x i − X )
2
s=
n
Exemplo: Calcule o desvio padrão para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi xi f ix i xi − X (x i − X )2 f i (x i − X )
2
1 46 ├ 50 3 48 144 -11 121 363

2 50 ├ 54 5 52 260 -7 49 245
3 54 ├ 58 8 56 448 -3 9 72
4 58 ├ 62 11 60 660 1 1 11
5 62 ├ 66 9 64 576 5 25 225
6 66 ├ 70 4 68 272 9 81 324
∑ = 40 ∑ =2360 ∑ =1240
X=
∑ f i x i = 2360 = 59 kg
n 40
∑ f i (x i − X )
2
1240
s= = = 31 = 5,5678 kg
n 40
Obs.: Em algumas ocasiões utiliza-se “n - 1” no denominador para o cálculo do desvio padrão, ao

invés de “n”, porque o valor que disso resulta representa uma estimativa melhor do desvio padrão
da população da qual a amostra foi extraída.
43
VARIÂNCIA
É a média quadrática dos desvios absolutos das observações em relação a média aritmética.
A variância de um conjunto de dados é definida como o quadrado do desvio padrão e é
representada por “s2”.
∑ (x i − X )
2
s = 2
n
onde:
s 2 = variância;
Variância para dados não-agrupados
Exemplo: Calcular a variância dos números 2, 8, 3, 6, 11.
2 + 8 + 3 + 6 + 11 30
Primeiramente, calcula-se a média aritmética: X = = =6
5 5
Aplicando a fórmula:
xi xi − X (x i − X )2
2 -4 16
8 2 4
3 -3 9
6 0 0
11 5 25
∑ = 54
∑ (x i − X )
2
54
s =
2
= = 10,8
n 5
Variância para dados agrupados
com as freqüências f1, f2, ..., fk) a variância será definida por:
∑ f i (x i − X )
2
s =
2
n
44
Exemplo: Calcule a variância para a distribuição do número de viagens realizadas por 20 famílias
no período de um ano.
Número de viagens realizadas por 20 famílias no período de um a

xi fi f ix i xi − X (x i − X )2 f i (x i − X )2
0 3 0 -1,8 3,24 9,72
1 4 4 -0,8 0,64 2,56
2 7 14 0,2 0,04 0,28
3 6 18 1,2 1,44 8,64
∑ = 20 ∑ = 36 ∑ = 21,2
X=
∑ fi x i = 36 = 1,8
n 20
∑ f i (x i − X )
2
21,2
s =
2
= = 1,06
n 20

com o ponto médio do intervalo (xi) e a variância é dada por:
∑ f i (x i − X )
2
s2 =
n
Exemplo: Calcule a variância para a distribuição dos pesos de 40 alunos de um colégio.

i Peso (em kg) fi xi f ix i xi − X (x i − X )2 f i (x i − X )
2
1 46 ├ 50 3 48 144 -11 121 363

2 50 ├ 54 5 52 260 -7 49 245
3 54 ├ 58 8 56 448 -3 9 72
4 58 ├ 62 11 60 660 1 1 11
5 62 ├ 66 9 64 576 5 25 225
6 66 ├ 70 4 68 272 9 81 324
=
∑ 40 =
∑ 2360 =
∑ 1240
X=
∑ fi x i = 2360 = 59 kg
n 40
∑ f i (x i − X )
2
1240
s2 = = = 31 kg 2
n 40
45
Obs.: Sendo a variância uma medida que expressa um desvio quadrático médio, ela pode causar
alguns problemas de interpretação. Para evitar isto, costuma-se usar o desvio padrão que é uma
medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados.
COEFICIENTE DE VARIAÇÃO (CV)
O coeficiente de variação é definido como o quociente entre o desvio padrão e a média

aritmética. É freqüentemente expresso em porcentagem.
s
CV =
X
Esta medida serve para caracterizar a dispersão dos dados em termos relativos a seu valor
médio.
Exemplo: Calcule o coeficiente de variação para a distribuição dos pesos de 40 alunos de um

colégio.
X = 59 kg e s = 5,5678 kg
s 5,5678
CV = = = 0,094 = 9,4%
X 59
Quando se deseja comparar a dispersão de dois ou mais conjuntos de dados, expressos em

unidades diferentes, utiliza-se o coeficiente de variação.
Exemplo: Os dados a seguir representam o peso e a altura de um grupo de alunos de um colégio.

Em relação à que variável há uma maior dispersão dos dados?
X s
Peso 65 kg 7 kg
Altura 168 cm 12 cm
7
CVPeso = = 0,108 = 10,8%
65
12
CVAltura = = 0,071 = 7,1%
168
Observa-se que nesse grupo os pesos apresentam um maior grau de dispersão que as alturas.
46
Exercícios:
Para cada um dos conjuntos vistos no exercício da unidade 6, abaixo relacionados, calcule:
a) a amplitude total;
b) a variância;
c) o desvio padrão;
d) o coeficiente de variação.
Conjunto a)
19; 17; 15; 15; 14; 16.
Conjunto b)
Xi fi
62 1
63 4
64 3
65 2
Total 10
Conjunto c)
Classes fi
46,7 ├ 51,7 5
51,7 ├ 56,7 1
56,7 ├ 61,7 9
61,7 ├ 66,7 3
66,7 ├ 71,7 2
Total 20
47
APÊNDICE A – Tabela de Números Aleatórios
7 2 1 6 5 9 8 3 0 0 0 4 8 5 1 5 9 1 1 5 5 1 4 2 5 0 5 3 8 9 2 2 3 9 3 0 4 2 2 6 2 6 9
2 5 0 4 3 5 4 5 3 8 1 7 5 6 0 4 6 5 5 2 8 4 8 5 2 3 7 9 3 4 5 9 8 3 5 6 3 9 4 3 0 7 5
7 2 0 4 3 7 7 4 9 1 6 0 0 1 7 5 8 2 8 3 7 0 3 0 3 3 2 0 3 3 9 8 8 5 4 5 8 3 3 8 1 5 5
0 0 9 0 3 3 3 4 9 3 3 0 2 7 9 3 4 2 5 8 8 9 9 3 6 4 2 5 1 3 9 0 4 4 3 2 5 0 7 8 3 8 7
6 4 0 0 7 7 9 4 3 7 2 9 2 8 2 6 9 8 6 2 6 6 7 9 5 1 0 9 8 7 2 8 2 3 2 1 9 7 8 2 0 4 0
6 3 4 5 7 6 4 5 5 5 5 5 9 1 2 3 8 4 0 1 1 3 2 3 5 8 1 1 1 2 6 7 9 1 8 3 2 8 0 8 7 5 7
0 5 1 7 2 8 4 2 7 6 6 9 1 9 0 2 2 1 3 5 7 3 1 1 5 2 0 4 6 0 9 7 4 5 3 3 9 2 2 3 2 6 3
9 9 2 6 6 9 6 2 2 7 2 4 8 9 4 7 8 9 9 7 5 3 9 4 4 4 0 5 2 0 2 3 1 4 9 7 2 5 0 8 6 9 7
0 6 8 5 7 6 2 9 1 9 4 2 4 1 3 9 9 9 2 6 6 0 7 6 1 5 9 6 1 4 8 8 5 8 8 6 0 0 5 0 8 1 3
7 5 2 9 4 6 1 8 3 1 4 4 3 9 7 9 4 7 4 5 7 0 7 7 7 6 5 0 0 4 0 9 2 1 5 7 6 6 8 7 6 9 1
0 6 4 3 3 0 5 5 7 1 4 8 8 7 9 4 7 0 9 9 7 0 9 7 2 2 6 2 3 8 3 1 5 4 6 4 1 5 6 2 1 0 7
5 8 9 3 1 6 2 3 1 2 4 4 2 4 4 0 8 3 7 6 8 1 5 4 5 5 1 9 8 5 0 5 8 6 4 8 4 2 7 7 6 6 4
1 0 8 1 6 5 5 5 9 0 7 8 9 0 6 1 5 8 7 7 4 1 0 5 8 4 2 9 9 5 9 9 0 3 0 2 2 2 0 4 2 6 6
7 0 8 6 2 4 6 0 4 4 4 1 2 6 5 3 4 2 5 7 5 1 8 8 6 4 5 1 3 5 0 6 2 1 6 3 4 5 4 9 3 5 3
8 1 6 0 7 8 9 8 6 8 4 3 7 6 7 6 5 6 5 8 0 8 9 8 6 4 4 0 9 1 3 7 3 2 6 0 6 4 5 4 8 8 9
4 4 0 3 7 7 0 8 7 7 3 4 1 5 8 4 5 2 0 7 8 0 9 1 4 1 9 8 6 0 6 8 1 2 9 4 1 4 0 1 7 7 2
6 0 0 0 7 2 9 2 5 5 2 3 3 1 9 8 1 0 6 9 5 7 2 4 6 9 5 0 9 1 9 5 3 2 1 2 7 8 1 8 8 4 8
4 3 6 1 0 0 2 6 8 9 3 6 2 4 1 2 2 1 3 1 2 7 0 0 2 2 0 4 9 1 8 4 4 8 4 4 2 7 9 9 7 0 8
6 0 4 6 1 5 5 4 3 4 7 9 1 7 3 4 9 8 0 2 3 1 7 0 9 7 5 1 7 6 0 7 6 2 8 7 4 4 2 0 1 8 6
8 7 5 9 5 0 3 2 6 5 2 7 1 4 9 9 6 6 7 8 1 7 1 5 1 2 6 0 9 5 6 6 9 9 7 4 9 3 8 8 4 2 7
8 6 5 2 7 1 5 7 8 4 6 9 6 8 0 0 5 8 0 7 1 3 0 5 6 1 7 5 5 8 7 0 4 0 1 1 8 3 7 1 2 0 8
8 3 0 9 8 9 5 9 5 1 2 2 5 0 1 1 3 8 7 8 8 7 7 0 0 9 4 5 7 8 4 4 7 6 5 2 9 4 0 9 2 8 2
5 4 3 2 3 5 4 5 2 3 2 5 3 9 9 0 8 9 2 6 5 0 2 3 6 2 4 0 1 1 1 9 0 8 6 4 8 8 0 5 0 3 6
3 4 4 7 9 6 4 3 9 2 5 4 7 3 7 5 7 5 0 8 4 2 0 3 3 0 1 3 5 2 0 6 2 8 8 8 3 5 8 0 4 6 4
1 5 2 2 0 6 1 2 1 8 7 7 9 5 9 9 9 2 1 1 0 0 3 1 4 2 4 6 1 5 4 8 6 5 4 4 3 4 9 6 4 6 5
3 7 0 0 2 0 3 2 3 1 6 2 9 0 1 8 8 1 2 5 3 8 7 5 7 8 1 5 7 5 2 5 8 7 6 0 8 4 1 9 5 7 9
6 6 4 8 6 5 5 9 0 6 1 0 2 7 1 4 6 1 0 8 9 1 8 4 0 2 8 2 8 7 0 9 8 3 0 2 7 9 1 6 1 0 3
3 9 8 0 1 2 9 4 1 9 7 5 9 7 8 4 3 1 2 1 9 0 4 4 4 8 1 4 7 1 8 2 8 0 9 6 8 8 7 5 5 7 1
5 4 6 1 4 6 1 7 4 0 3 5 7 8 3 1 1 4 9 5 8 2 8 7 4 8 7 3 3 3 0 0 4 3 3 5 6 0 1 4 0 1 1
6 8 5 9 5 8 0 9 1 2 5 9 9 7 8 4 8 7 1 0 4 9 1 5 5 8 5 3 9 6 2 8 5 9 4 2 9 4 3 1 1 0 7
2 3 9 4 2 9 6 0 5 6 6 0 1 0 1 8 5 8 6 5 7 5 8 1 4 7 3 3 2 6 3 8 7 8 6 4 0 7 9 7 3 1 8
3 0 3 9 0 6 3 4 6 1 2 1 1 0 1 5 8 5 6 1 3 5 9 8 1 9 3 0 5 4 5 2 9 9 6 9 9 0 8 3 5 1 3
5 5 2 0 7 1 5 5 8 4 7 9 1 2 1 2 0 3 6 5 0 0 7 9 0 7 9 2 1 7 8 7 1 4 0 7 9 7 4 1 5 6 5
8 5 5 3 0 8 4 5 1 0 3 8 7 3 4 8 7 5 6 4 0 3 7 2 8 1 2 1 6 0 8 3 1 6 7 2 0 2 6 1 5 3 3
7 9 0 4 2 8 2 4 2 7 0 8 6 8 8 3 4 4 4 2 4 6 8 9 1 4 9 7 4 7 5 9 5 8 1 4 5 9 6 8 6 8 4
3 9 2 0 4 7 1 6 6 9 9 7 8 1 9 7 1 6 0 8 3 7 2 7 2 6 6 4 0 8 4 0 4 1 9 4 0 8 7 3 5 9 2
5 5 9 4 0 4 9 6 7 6 3 9 6 4 4 0 7 4 9 0 3 1 6 3 8 6 0 3 9 3 3 6 4 0 8 9 2 4 0 3 6 8 8
3 2 8 1 8 8 2 1 9 5 7 7 5 1 0 0 4 0 7 8 3 7 3 5 9 2 1 0 0 6 4 2 3 3 0 9 5 4 2 0 8 8 7
2 8 6 7 4 7 2 1 2 2 0 9 1 8 2 7 7 5 1 3 3 1 9 6 3 4 9 5 7 8 5 9 9 8 5 7 1 2 1 9 4 9 7
9 6 8 8 8 0 6 2 9 9 5 8 3 9 3 7 6 4 4 0 2 5 6 5 2 6 7 7 2 3 7 0 9 3 9 2 8 1 1 8 9 4 5
5 4 8 6 6 0 8 6 4 7 1 4 0 1 7 4 2 4 5 0 8 9 9 8 5 1 5 5 2 0 1 2 4 4 5 2 7 5 4 5 6 3 7

Faetec Apostila Estatistica PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Faetec Apostila Estatistica PDF

Enviado por

Direitos autorais:

Formatos disponíveis

E.T.E.

GOVERNO DO ESTADO DO RIO DE JANEIRO

SECRETARIA DE ESTADO DE CIÊNCIA, TECNOLOGIA E INOVAÇÃO

FUNDAÇÃO DE APOIO À ESCOLA TÉCNICA

ESCOLA TÉCNICA ESTADUAL REPÚBLICA

Prof. Cosme Marcelo Furtado Passos da Silva

UNIDADE 1 – A NATUREZA DA ESTATÍSTICA

A Estatística, tal como a Matemática, originou-se do convívio social, das trocas, da

Método é um conjunto de meios que se dispõe de forma a se chegar a um objetivo que se

A Estatística, ou métodos estatísticos, como é denominada algumas vezes, desempenha

Estatística Descritiva e Estatística Inferencial

A ciência Estatística é, basicamente, dividida em duas partes: a Estatística Descritiva e a

FASES DO MÉTODO ESTATÍSTICO

a) Redução do problema a ser estudado a uma hipótese testável, ou seja, elaboração do

b) Elaboração de instrumentos adequados para a coleta de dados.

c) Coleta de dados. O pesquisador pode ir a campo e fazer uma contagem ou um inquérito

g) Análise e interpretação dos resultados. O objetivo da pesquisa estatística é tirar conclusões

A ESTATÍSTICA NAS EMPRESAS

Nas empresas a Estatística auxilia o administrador na organização, direção e controle

UNIDADE 2 – POPULAÇÃO E AMOSTRA

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Ex.: População: Moradores de uma cidade.

Variável Qualitativa Nominal

Ex.: População: Moradores de uma cidade.

Variável Qualitativa Ordinal

Ex.: População: Moradores de uma cidade.

São variáveis que têm seus valores expressos em números.

Ex.: População: Moradores de uma cidade.

Variável Quantitativa Discreta

Ex.: População: Moradores de uma cidade.

Variável Quantitativa Contínua

Ex.: População: Moradores de uma cidade.

Amostragem Casual ou Aleatória Simples

Primeiramente, numeramos os alunos de 01 até 90. Com o auxílio de uma Tabela de

Amostragem Proporcional Estratificada

A amostragem estratificada é utilizada quando a população se divide em subpopulações

Exemplo: Se no exemplo anterior a população de 90 alunos fosse dividida em 54 meninos e 36

Sexo População 10% Tamanho da Amostra

A amostragem sistemática é utilizada quando os elementos da população já se encontram

UNIDADE 3 – SÉRIES ESTATÍSTICAS

Conforme varie um dos elementos da série, pode-se classificá-la em histórica, geográfica ou

Séries Históricas, Cronológicas, Temporais ou Marchas

São séries que descrevem os valores da variável, em determinado local, discriminados

Séries Geográficas, Espaciais, Territoriais ou de Localização

São séries que descrevem os valores da variável, em determinado instante, discriminados

São séries que descrevem os valores da variável, em determinado tempo e local,

Capítulos da CID Nº Internações

Título Distribuição do Número de Internações Hospitalares

TABELA DE DUPLA ENTRADA (SÉRIES CONJUGADAS)

Região 1998 1999 2000 Total

Freqüência de um dado valor de uma variável (qualitativa ou quantitativa) é o número de

DADOS ABSOLUTOS E DADOS RELATIVOS

Considere a tabela a seguir:

Distribuição por sexo dos adolescentes das Classes Sociais A e B.

Calculando as percentagens dos adolescentes de cada sexo, temos:

Com a inclusão de uma nova coluna na série, temos:

Distribuição por sexo dos adolescentes das Classes Sociais A e B.

A percentagem é muito usada quando desejamos verificar a participação da parte no todo.

Considere a tabela a seguir:

Os coeficientes representam razões entre o número de ocorrências e o número total. Onde o

número de alunos evadidos

número de alunos aprovados

número de alunos recuperados