Você está na página 1de 48

1

ESTATÍSTICA E PROBABILIDADE

CAPÍTULO I – ESTATÍSTICA DESCRITIVA


1.1 - FASES DO MÉTODO ESTATÍSTICO

1.1.1 – O que é Estatística e Probabilidade: Um pouco de história e seu


campo de aplicação.

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados para a utilização dos mesmos na
tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,


enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou
Inferencial.

A Estatística Inferencial cuida dos fenômenos aleatórios, fenômenos de azar ou fenômenos


estocásticos através do uso do cálculo das probabilidades.

1.1.1.1 - A Importância da Estatística

Embora existam muitos conceitos desprimorosos sobre o valor e a importância


da Estatística, é hoje fato incontestável que nenhuma organização, empresa ou nação que
aspire não só sobreviver à intensa competição existente, mas também desenvolver-se em
bases racionais, poderá prescindir do auxílio deste ramo da Matemática Aplicada.
De outro lado, é evidente que “inferências” válidas em Estatística, dependem
da veracidade das informações coletada, as quais, a sua vez, estão na dependência da
eficiência do sistema estatístico.Portanto os números não são verdadeiros ou falsos, mas sim
os meios estatísticos que os coletam e manipulam é que são competentes ou incompetentes,
verdadeiros ou falsos.
Assim, pois, como não se pode atribuir à Ciência as falhas e deficiências de
maus cientistas, não se pode atribuir à Estatística as falhas ou deficiências na coleta ou
manipulação de dados estatísticos.
Feitos estes reparos, e para dar uma idéia real da importância da Estatística no
mundo moderno, podemos reproduzir o seguinte depoimento de Steele:

“A Estatística dá bases para previsões; confirma ou destrói doutrinas; esclarece o passado e


orienta o futuro; é arma indispensável para aquilatar sobre qualquer reforma ou
empreendimento”.

É, portanto imprescindível e inestimável instrumento de racionalização no


mundo moderno, aconselhando e orientando planejadores, administradores, empresários,
cientistas e estadistas.

Obs: Inferência estatística (Indução Estatística) - é a parte da Estatística que tem por fim,
baseando-se no estudo de conjuntos chamados amostras, chegarem a conclusões que dizem
respeito às populações.

1.1.1.2 - Conceituação e Definição

A palavra Estatística deriva do latim “Status”, no sentido adquirido do latim


medieval de “Estado Político”.
A primitiva utilização da estatística envolvia compilações de dados e gráficos
que descreviam vários aspectos de um estado ou país. Em 1662, John Graunt publicou
informe estatístico sobre nascimentos e mortes. O trabalho de Graunt foi secundado por
2

estudos de mortalidade e taxas de morbidade, tamanho de populações, rendas e taxas de


desemprego.
A palavra Estatística aparece pela primeira vez na obra de J. F. Von Bieffeld-
1770, intitulada “Elementos de Erudição Universal”, onde num de seus capítulos, denominado
“Estatística” ele assim a define:

“Estatística é a Ciência que nos ensina a situação política dos estados modernos do mundo
conhecido”.

A Estatística como Teoria, isto é, como instrumento científico, tem um


desenvolvimento relativamente recente.
As raízes da Estatística Teórica podem ser encontradas nos trabalhos de
Laplace e Gauss sobre a Teoria dos Erros de Observação.
O matemático belga Quetelet é considerado, geralmente, como o fundador da
Estatística Moderna, por ter sido o primeiro que baseou suas investigações numéricas no
cálculo das probabilidades, tendo sido o iniciador dos Congressos Internacionais de Estatística
e o fundador da Estatística Oficial de Bruxelas.
Sob a influência de Galton e Pearson, os progressos foram notáveis e
firmaram-se as bases dessa disciplina que continua tendo grande desenvolvimento,
especialmente no que diz respeito à Teoria Matemática da Estatística.

A Estatística está dividida em:

• Estatística Descritiva - é a parte da estatística que procura somente descrever e analisar


certo grupo, sem tirar quaisquer conclusões ou inferências sobre o um grupo maior.

• Estatística Inferencial - é a parte da estatística que tem por fim, baseando-se no estudo de
conjuntos chamados amostras, chegarem a conclusões que dizem respeito às populações.

Do ponto de vista do seu emprego, a Estatística poder ser entendida como:


• o estudo de populações;
• o estudo de variações;
• o estudo aplicado de métodos de sintetização;
• o estudo e aplicação de métodos de inferência estatística.

Quando realizamos observações ou experiências que podem ser repetidas um


grande número de vezes, em circunstâncias semelhantes, pode acontecer que o resultado
destas experiências ou observações seja invariavelmente o mesmo, isto é, se manifeste com
absoluta regularidade ou exatidão.
Traduzindo essa regularidade, com uma lei ou fórmula matemática, podemos
representar as Causas como variáveis independentes e os Efeitos como variáveis
dependentes, de modo que para certos e determinados valores das variáveis independentes,
resultarão valores certos e constantes para as variáveis dependentes.
Se chegarmos a conhecer suficientemente bem o fenômeno investigado,
podemos fazer predições exatas do fenômeno em cada observação individual, com nos casos
de certas Leis Física, Química e Mecânica.
Na grande maioria dos casos, porém, qualquer que seja o campo de
conhecimento em que se situe, o nosso conhecimento carece da precisão necessária para
poder realizar predições exatas sobre os resultados das observações individuais, como no caso
da Cinética dos Fluídos, o Movimento das Nebulosas, o Controle de Qualidade de Produtos
Industriais, etc, e, nestes casos, diremos que estamos em presença de Fenômenos Aleatórios.
Uma variável que expresse resultados de experiências ou observações
aleatórias denominar-se-á de variável aleatória ou estocástica.
Os chamados fenômenos aleatórios, fenômenos de azar ou fenômenos
estocásticos, constituem o campo de aplicação e do estudo da Estatística Matemática e de seu
fundamento matemático o cálculo das probabilidades.
A principal tarefa da Estatística Matemática é a descoberta e definição de
qualquer regularidade típica nos fenômenos aleatórios de massa ou multidão. A definição
constatada dessa regularidade se faz através da Inferência Estatística, que não é mais do que
o Método Indutivo ao qual foram adicionados os instrumentos de cálculo de probabilidades.
3

Existem inúmeras definições sobre o que é Estatística, cada uma de acordo


com a sua aplicabilidade, dentre elas adotaremos:

“A Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-
los, analisá-los, interpretá-los e deles extrair conclusões”.
“A Estatística é um método científico de obter, apurar, apresentar e interpretar dados
numéricos, relativos à variação de um determinado fenômeno”.

1.1.1.3 - O Objetivo da Estatística

O objetivo da estatística e estudar conjuntos para tirar parâmetros, que


possibilitarão as decisões.

Um parâmetro é uma medida numérica que descreve uma característica da população.


Uma estatística é uma medida numérica que descreve uma característica da amostra.

1.1.2 - A pesquisa Estatística: planejamento e execução


Qualquer que seja o conceito de Estatística fica evidenciado que o trabalho
estatístico exige como “matéria-prima” um conjunto de números resultantes de uma coleta de
informações, retirada da População.

Esses números serão “trabalhados” para a elaboração do “produto”.

Um simples exemplo pode caracterizar muito bem as Fases do Método Estatístico:


a elaboração de uma prova.

“as questões, planejadas inicialmente, são aplicadas aos alunos (informantes dos
questionários) e, logo depois, coletadas e corrigidas (criticadas); compete ao professor, ainda
apurar os resultados, divulgando-os (exposição) e analisando-os (interpretação)”.

Podemos classificar estas fases nas seguintes denominações:

A) PLANEJAMENTO

Nesta fase, define-se o que se quer determinar (escolha do objetivo), quando, onde
e como fazer.

O Planejamento compreende fases distintas, que deverão ser seguidas na seguinte ordem:

Organização do plano geral - implica em obter respostas para uma série tradicional
de perguntas, antes mesmo das informações disponíveis sobre o assunto, perguntas que
procuram justificar a necessidade efetiva da pesquisa, a saber:
 Quem deseja as informações?
 O que devemos perguntar no questionário?
 A pesquisa será periódica ou ocasional? Será executada sempre?
 Por que desejam as informações?
 Quando deverá estar concluída a pesquisa?
 Qual a época oportuna para a aplicação dos questionários?
 Para que desejam tais informações?

As respostas obtidas darão à equipe as coordenadas para a “partida”.


Implicará em saber a profundidade da pesquisa e decidirá sobre o conteúdo do questionário,
pois devem ficar definidas as perguntas que serão feitas.
4

Exame das informações disponíveis - implica em reunir tudo que já foi


publicado sobre o assunto, compilar a legislação específica, obter relatórios sobre atividades
semelhantes ou correlatas, adquirir mapas da região geográfica, enfim, a equipe provavelmente
não será a pioneira sobre o tema e, portanto não poderá partir do “nada”; sempre que possível
procurará analisar a experiência de trabalhos anteriores para não incidir nos mesmos erros,
para ganhar ou para não perder tempo, para não pisar em terreno totalmente desconhecido.
Segundo a sua origem, os dados dividem-se em duas categorias:
a) primários;
b) secundários.

Primários, são os dados coletados pela própria pessoa ou entidade que os vai
elaborar.
Secundários, os que já existem e são aproveitados. Um conjunto de dados é,
assim, primário ou secundário em relação a alguém.
Sempre que possível, lançamos mão de dados secundários disponíveis, devido à
economia de tempo e a redução de custo conseguida. Porém certas precauções são
necessárias; tais como, o grau de fidedignidade dos dados, a utilização somente de fontes
dignas de confiança.
No trabalho com dados transcritos deve-se considerar a possibilidade, destes
estarem errados ou embutirem algum dado desnecessário ao nosso interesse e até mesmo
excluírem fatores importantes. Publicações de revistas especializadas são, em geral,
fidedignas.
Quando é necessário, a utilização de dados de origem diversa (oriundo de estados ou
países diferentes ou mesmo entidades diversas), o critério é o mesmo, a homogeneidade entre
esses dados, assim torna possível a comparação e a elaboração dos mesmos.

Obtenção dos Dados

Quando os dados secundários não existem ou não satisfazem os existentes, temos


que passar à obtenção de dados primários. Existem três categorias de coletas ou
levantamentos:

a) levantamentos contínuos;
b) levantamentos periódicos;
c) levantamentos ocasionais.

Levantamentos contínuos têm pôr objetivo a coleta dos dados que são os mais
importantes, por serem fundamentais e que por serem de natureza contínua no tempo, é
necessário registrá-los à medida que acontecem, a fim de facilitar o trabalho dos que deles se
utilizam.
Ex: registros de óbitos, nascimentos, casamentos, etc.

Levantamentos periódicos e ocasionais: a única diferença existente entre eles


está na época de realização.
Os periódicos são feitos em épocas, com intervalo de tempo constante, e
determinado por uma lei (ex: Recenseamento).
Os ocasionais são feitos com o objetivo de coletar dados para uma determinada
pesquisa, em qualquer campo e em qualquer época (ex: pesquisa de mercado, eleitoral, etc.).

Definição do universo - implica em saber qual o conjunto a ser pesquisado,


distribuindo, classificando ou grupando os elementos desse conjunto em populações, para
permitir o trabalho mais fácil, mais lógico, mais racional.

Tipo de levantamento - implica em saber face à natureza e em função dos recursos


financeiros e do prazo determinado para a conclusão do trabalho, a conveniência ou não, da
adoção do tipo de levantamento a ser adotado.
Os métodos aplicáveis na coleta de dados classificam-se em:
a) censo;
b) amostragem.
5

No censo, são pesquisados todos os elementos componentes de um conjunto a ser


estudado, chamado de “população”;na metodologia de amostragem, pesquisa-se um
subconjunto representativo da população, denominado por “ amostra “, selecionado de forma
aleatória através de técnicas específicas da Estatística, adequadas a cada caso. Esta pesquisa
está afeta à Tecnologia da Amostragem. Vários são os modelos existentes: amostragem
aleatória simples, amostragem aleatória composta, amostragem aleatória estratificada,
amostragem aleatória por conglomerado, amostragem aleatória sistemática, etc...
Para escolhermos um método de coleta de dados relacionados a uma pesquisa,
temos que levar em conta os seguintes fatores:

a) o prazo ou tempo necessário para concluir a pesquisa;


b) os recursos financeiros disponíveis;
c) a existência de pessoal com a devida preparação técnica.
d) no caso da amostragem, fixar o erro de estimativa desejado.

Processo de coleta - é o modo pelo qual serão obtidas e onde serão coletadas
as informações.
Os principais processos de coleta de dados são:
a) experimental;
b) de observação;
c) mecânico;
d) por questionário

a) Processo Experimental

Consta de dois tipos:


Processo experimental de demonstração;
Processo experimental de explicação funcional.

O processo experimental de demonstração tem como objetivo provocar reações,


através de uma experiência com um novo produto, por exemplo, ou ainda comparar dois
produtos análogos, verificando a preferência dos consumidores; este processo é muito aplicado
em pesquisa de mercado.
O processo experimental de explicação funcional é experiência a fim de pesquisar
reações de coletividade à presença ou ausência de certas condições; como por exemplo, a
verificação se a propaganda influi numa campanha de vacinação.

b) Processo de Observação

Neste processo não existe informante, o próprio pesquisador é que dá a informação,


exemplificando temos, a contagem do número de casa de uma rua, etc.

c) Processo Mecânico

Neste processo também não há presença de informante e o observador é substituído


por um aparelho mecânico

Exemplo:
i) aparelhos de contagem de tráfego em uma rodovia;
ii) roletas que registram o número de pessoas que passam por elas.

d) Processo por Questionário

Este é o processo mais utilizado na coleta de dados. Os questionários podem ser:


* por questionário enviado;
* por questionário apresentado;
* por questionário e entrevista;
* por inquérito pessoal.
6

No primeiro caso utilizamos os serviços do correio, assim diminuindo gastos com


pesquisadores, porém algumas informações são perdidas por extravio ou até alguns
questionários não são devolvidos. No caso de questionários apresentados os pesquisadores
mais tarde voltam para buscá-los, evitando assim o extravio.
Os dois casos apresentam desvantagens:
- dificuldades em esclarecer as dúvidas do informante;
- falta de respostas em alguns itens;
- uso de abreviaturas nas respostas, má letra, etc...;
- impossibilidade de fazer comprovações.

Deve-se observar que nos dois processos descritos acima a população alvo é
selecionada, os informantes devem estar aptos a responder sozinhos o questionário, tendo
compreensão do valor e do alcance da pesquisa.
O terceiro processo é o melhor de todos. Nele, o próprio entrevistador preenche o
questionário, interrogando o informante. O custo é evidentemente maior, pois é necessário que
os entrevistadores sejam capazes e bem treinados. Além do número de entrevistadores serem
maior, devido ao tempo gasto em cada entrevista.
No último caso não existe um questionário propriamente dito, e sim uma lista de
informações a serem colhidas e de tal maneira que o pesquisador as registrará sem
necessidade de interrogar o entrevistado. Nem sempre os dados resultantes, são aproveitáveis,
estatisticamente.

Propaganda - escrita ou falada (rádio ou TV) dando detalhes da pesquisa.

Elaboração do questionário, respeitando a seguinte orientação técnica:

 deverá ser preparado com a máxima clareza;


 é aconselhada a inclusão das possíveis respostas ( tipo múltipla escolha);
 as perguntas devem ser formuladas de tal modo que as respostas sejam objetivas e
possam ser facilmente apuradas, evitando dissertações;
 a disposição das perguntas deve apresentar uma seqüência lógica;
 as perguntas devem ser inéditas para o órgão, ou seja, não pesquisar junto ao
informante respostas que já existem no órgão executor do levantamento; não é
admissível que uma escola, volte a perguntar aos alunos o sexo, a idade, o local de
residência, etc...;
 evitar redações longas para os quesitos;
 o questionário não deve ser extenso, pois prenderá o informante durante muito
tempo;
 boa qualidade do papel, evitando cores escuras, reunida a uma boa impressão.

A confecção de um questionário é uma tarefa delicada e muito importante, visto que


um questionário mal elaborado põe em risco toda a pesquisa. Alguns atributos são
indispensáveis para a redução dos erros de informação: o bom senso, o conhecimento do
assunto a ser estudado e alguma prática de pesquisa.

Recomendações gerais:

a) Só perguntar o estritamente necessário;


b) Inquirir, apenas, aquilo que o informante tem conhecimento direto;
c) Perguntar fatos e não juízos;
d) Não exigir cálculo do informante;
e) Empregar termos familiares ao entrevistador e ao entrevistado;
f) Enunciar perguntas sem prolixidade;
g) Não formular perguntas que suscetibilizem e não amedronte o entrevistado, que
façam apelo a memória, ou ainda, criem algum nível de distorção, etc...;
h) Não utilizar perguntas com respostas abertas.
7

B) EXECUÇÃO

Coleta de Dados

É a fase em que direta ou indiretamente, consegue-se obter os dados necessários ao


fim determinado.
A coleta é a fase primordial de um estudo estatístico. Sem a existência de um
satisfatório grau de precisão nos dados obtidos, as fases subseqüentes ficam inválidas. De que
vale o emprego das técnicas apuradas de análise, quando, esta é realizada em dados que não
são fidedignos?
Coletar dados não é tarefa fácil; são necessárias, sobretudo, persistência e habilidade
para bem executá-la.

Crítica aos Dados (ou questionário)

Fase em que à medida que a coleta vai sendo executada, a leitura de cada
questionário deve ser feita com o espírito de julgamento sobre possibilidade de respostas
erradas, ao mesmo tempo em que são verificadas lacunas deixadas pelos informantes.
Estando imperfeito um questionário, por um ou outro motivo, será o mesmo devolvido
ao informante, para o acerto final, mas nem sempre isso é possível, por falta de tempo, para
não onerar mais ainda o trabalho ou porque o informante não poderá ser mais encontrado.
Deve, pois ficar prevista a perda natural de algumas informações.
A crítica deve ser considerada como complementação necessária da coleta de dados,
para entregar à apuração questionários isentos de imperfeições e de falhas.

Apuração dos Dados (ou informações)

Feita a crítica, faz-se à depuração e a totalização dos dados coletados em função do


objetivo primeiro do levantamento: nesta fase, obtém-se o dado bruto (valores não organizados
numericamente), o dado observado.

Análise dos Dados (ou informações)

Essa fase cuida da apresentação, tabulando-se os dados, criando-se então os quadros,


as tabelas, as distribuições de freqüências e os gráficos, com o objetivo de facilitar a
interpretação e a análise dos dados, que seria a fase final do levantamento estatístico.

1.1.3 - População e Amostra

População

Ao conjunto de pessoas, de escolas, de notas, de leitos de um hospital,


etc, que constitui o todo para permitir o cálculo do parâmetro, é dado o título de Universo. O
Universo é, assim, o conjunto constituído por todos os elementos; tais elementos são reunidos
em subconjuntos denominados populações.

População é, pois, um total de objetos ou de pessoas que apresentam as


mesmas características dentro do mesmo Universo.
Há populações Homogêneas e Heterogêneas, conforme uma ou mais
características do conjunto apreciado “pouco variem” ou “variem bastante” entre si ou em
relação a um valor tomado como unidade de comparação.

Exemplos: População Homogênea: Ex.Os alunos de Estatística I desta Turma.


População Heterogênea: Ex.Os alunos de Estatística I desta Turma quanto ao
sexo.

As populações podem ser Finitas (os seus elementos podem ser contados) ou
Infinitas (os seus elementos não podem ser contados).
8

Exemplos: População Finita: Ex. O número de alunos na sala de aula.


População Infinita: Ex.O número de alturas possíveis entre 1,60 m e 1,70 m.

Para estudar estatisticamente uma dada população, faz-se necessário delimitá-


la, de acordo com o objetivo em questão.
Na maioria das vezes em que precisamos coletar informações sobre uma
população, enfrentamos dificuldades em função:

• de tempo - as informações devem ser obtidas com rapidez;


• de precisão - as informações devem estar corretas;
• de custo - no processo de coleta, sistematização, análise e interpretação, o custo deve
ser o menor possível.

Para minimizar a influência dessas dificuldades no trabalho estatístico,


utilizamos os processos de amostragem.

Amostra
Uma amostra é uma parte representativa da população que contém todas as
suas características.
Para se realizar uma pesquisa a respeito de uma população não é necessário à
contagem de todas as unidades dessa população, bastando para se conhecer determinados
parâmetros da população, o conhecimento das estatísticas das amostras que a representam.
A escolha de uma amostra no lugar de toda a população se justifica pelos
seguintes fatores:

• praticabilidade: as pesquisas em populações podem ser impraticáveis, quando estas são


em número excessivo.
• rapidez: pesquisas em amostras são mais rápidas em virtude de conter bem menor número
de unidades.
• precisão: a amostra permite que cada informação pesquisada seja obtida com maior
precisão em virtude do menor número de unidades a pesquisar.
• custo: certamente que as despesas com a averiguação amostral é bem menor do que se
fosse com a população.

A importância da amostra está no fato de que os dados ou estatísticas por ela


fornecido dão ensejo a que se realizem inferências (conclusões) ou estimativas dos parâmetros
populacionais.
Para isso a amostra deve ser escolhida de modo que ela seja representativa.

Quando trabalhamos com amostras, antes de tomarmos uma decisão, temos


que responder três perguntas:
(1ª ) como escolher a amostra?
(2ª ) que informação estatística será retirada da amostra?
(3ª ) como se comporta a estatística quando o mesmo procedimento de escolher a amostra é
usada numa população conhecida?

As observações colhidas de uma amostra são tão mais informativas sobre a


população quanto mais conhecemos esta mesma população.

Exemplo: a análise da quantidade de glóbulos brancos obtida de algumas gotas de sangue da


ponta do dedo de um paciente dará uma idéia geral da quantidade de glóbulos no corpo todo,
pois sabe-se que a distribuição dos glóbulos brancos é mais homogênea, e de qualquer lugar
que se tivesse retirado a amostra ela seria representativa.
Mas nem sempre a escolha de uma amostra representativa é imediata, por
exemplo, suponhamos o seguinte: queremos estudar a proporção de indivíduos na cidade A
que são favoráveis a certo Projeto Governamental. Uma amostra de 200 pessoas é sorteada. A
opinião de cada uma dessas pessoas é registrada. Se escolhermos intencionalmente uma
amostra de 200 pessoas moradoras em certa Região que sra beneficiada pelo projeto,
sabemos de antemão que o resultado conterá um “viés de seleção”, isto é, na amostra, a
proporção de pessoas favoráveis ao projeto deve ser maior do que no todo.
9

As maneiras de se obter uma amostra são tão importantes, que estes


procedimentos constituem uma especialidade dentro da Estatística conhecida como
amostragem.

Devemos levar em conta, também, que se um número é extraído de uma urna,


deve-se decidir se ele será ou não reposto na mesma. No primeiro caso, o número pode
ocorrer várias vezes (Amostra com Reposição), enquanto que no segundo, ele só pode
aparecer uma vez (Amostra sem Reposição).

1.1.4 – Variáveis e Atributos


Variável é o que assume valores diferenciados (ou não) de indivíduo para
indivíduo, podendo ser de natureza quantitativa (numérica) ou qualitativa (atributo).

Variável quantitativa é aquela que pode ser medida ou contada.


Geralmente é representada pelas letras X, Y, Z,..., O conjunto de valores assumidos por uma
variável ou, o seu campo de definição é chamado de domínio. Ela pode ser discreta ou
contínua. Definiremos que x é um possível valor observado de X, ou ainda, que x é algum
dado bruto observado a cerca de certo fenômeno (ou experiência aleatória).

a) Variável discreta é aquela que só pode assumir valores inteiros. É definida no


conjunto dos números inteiros ou dos naturais, (Z ou N);
Ex: Número de alunos presentes no dia 21/02/99;
Número de carros que passam pela Av. Paris, entre 18 e 20 horas;
Número de partículas emitidas por um material radioativo;
Número de peças produzidas por uma máquina;
Número de caras no lançamento de uma moeda 100 vezes.
Note que em todas estas variáveis discretas, os dados são contados.

b) Variável contínua é aquela que assume qualquer valor numérico de um


intervalo, isto é, entre dois quaisquer dados existe, teoricamente, uma infinidade de valores.
Esta variável é definida no conjunto dos números reais.
Ex: A quantidade de café vendida por dia em uma mercearia;
A altura, o peso e idade dos alunos;
O tempo de reação de uma vacina;
O tempo de duração de vida de um componente eletrônico;
O diâmetro e o volume das esferas produzidas por uma máquina.
Note que em todas estas variáveis contínuas os dados são medidos.

Em resumo, temos o seguinte: quando existe a contagem dos dados, a variável


é discreta, e, quando há a medição do fenômeno, a variável é contínua.

Variável qualitativa é aquela que não é inerentemente numérica. A ela está


associada à presença ou ausência de certo atributo, ou ainda, uma ordenação classificatória de
atributos. A variável qualitativa pode ser classificada como nominal ou por posto.

a) Variável nominal é aquela que envolve uma nomeação ou categorização dos


atributos:
Ex: Sexo (masculino ou feminino);
Cor dos olhos (azuis, castanhos, verdes);
Área econômica de trabalho (comércio, indústria, serviços, agricultura,
turismo);
b) Variável por posto (ou ordem) é aquela que se refere tipicamente a
avaliações, nem sempre subjetivas, quando se dispõem as respostas segundo uma ordem de
preferência ou de desempenho.
Ex: Escolaridade (Pré-primário, 1º grau, 2º grau, 3º grau, Pós - graduação);
Preço de imóvel (barato, caro, muito caro);
Corrida de cavalos, classificação de chegada (1º, 2º, 3º,...).

Assim nenhuma dessas variáveis é naturalmente numérica ou quantitativa.


Todavia, quando aplicadas a uma população ou uma amostra, é possível atribuir cada resposta
10

a uma classe e contar o número de observações pertencentes a cada categoria. Por exemplo:
em uma pesquisa de mão-de-obra, gostaríamos de saber quantos trabalhadores pertencem ao
setor de comércio. Conta-se o número de trabalhadores nessa categoria.

1.1.5 – Métodos de Coleta: Censo e Amostragem

Censo
Um Censo é uma coleção de dados relativos a todos os elementos de uma
população.

Existem diversos tipos de Censo, tais como:

• Censo demográfico - que envolve edificações e habitantes;


• Censo industrial - que abrange indústrias de transformações e indústrias especiais;
• Censo de mercadorias - que se classifica em comércio de mercadorias e comércio de
valores;
• Censo rural - aplicado ao setor rural;
• Censo agrícola - aplicado ao setor agrícola.

Amostragem

Já estudamos no item 1.1.3 o que é amostra a sua importância na obtenção


dos parâmetros populacionais.
Sabemos, também, que uma das maneiras segundo as quais se pode obter
uma amostra representativa é a técnica especial denominada amostragem, de acordo com a
qual cada elemento de uma População pode ou não ter a mesma probabilidade de ser incluído
na amostra.

A amostragem está grupada em dois grandes grupos:

- probabilísticos
- não probabilísticos

Probabilísticos

São amostragens em que a seleção é aleatória de tal forma que cada elemento
da População tem a mesma probabilidade conhecida da fazer parte da amostra.
Assim, se N define o tamanho da População e se todos os seus elementos
possuem igual probabilidade, teremos que 1/N é a probabilidade de cada elemento participar
da amostra.
Os principais tipos de amostragem probabilísticos são:

- amostragem aleatória simples ou aleatória ou simples


- amostragem sistemática
- amostragem estratificada
- amostragem por conglomerados
- amostragem múltipla

Não Probabilísticos ou Intencionais

São amostragens em que os elementos são selecionados com o auxílio de


especialistas, é a amostra de voluntários, como ocorre em alguns testes sobre novos remédios.
Nesses tipos de pesquisa de mercado as inferências feitas nessas condições não permite
avaliar a probabilidade de erro.

A grande vantagem das amostras probabilísticas é medir a precisão da


amostra obtida, baseando-se no resultado contido na própria amostra, e é claro que esse tipo
de amostragem que nos interessa pesquisar.
11

Aplicação prática de amostragem do grupo Probabilístico

Estudaremos, a seguir, três das principais técnicas de amostragem.

Quando pretendemos selecionar os elementos que comporão a amostra


devemos seguir a seguinte iteração:

1) Numerar o universo – tomando o cuidado de cada elemento ter a mesma quantidade


de algarismos que o universo.
Exemplo: N = 100 numerar de 001 até 100
N = 75 numerar de 01 até 75
N= 9 numerar de 1 até 9
OBS: em tabelas se for conveniente a numeração pode começar em 00

2) Dimensionar o tamanho da amostra – em alguns problemas o número de elementos


que comporão a amostra é dado em percentagem.
Exemplo: N = 75 amostra de 10% logo n = 8 elementos

3) Escolher o tipo de amostragem que quer utilizar


4) Utilizar convenientemente a Tabela de números aleatórios (TNA) – Escolhe-se
qualquer linha ou coluna da TNA, onde serão extraídos os números que comporão a
amostra. Esses números terão a mesma quantidade de algarismos que o universo.

OBS: na ausência da TNA era comum atribuir um número a cada elemento da população,
registrar esse número em papéis, colocá-los em uma urna (ou caixa, ou saco) e então
retirar os papéis um a um, numa quantidade de vezes igual ao número de elementos que
comporiam a amostra.

Amostragem Aleatória Simples

Obter uma amostra aleatória de 10% representativa da estatura de noventa alunos de


determinada turma da UNISUAM. Utilizar a TNA a partir da 18ª linha.

Resposta:
N = 90 alunos, logo os alunos serão numerados de 01 a 90.
n = 10% de 90, logo n = 9 alunos cálculo: 10 x 90 = 9 alunos
100
a partir da 18 linha da TNA serão lidos os dois últimos algarismos do número tabelado:

números tabelados:

11, 93, 06, 16, 83, 36, 27, 91, 78, 70, 46 os números 93 e 91 não podem participar porque
excedem 90.

OBS: Na seleção não pode haver número repetido.

Amostragem Sistemática

Obter uma amostragem sistemática de uma rua que contem 900 prédios dos quais
desejamos inspecionar 10 prédios. Utilizar a TNA a partir da 4ª coluna.

Resposta:
Encontrar a parcela sistemática, isto é, a parte repetitiva: 10 = 10:10 = 1
900 900:10 90
essa fração nos informa que de cada 90 prédios 1 será inspecionado, logo o sistema vai de
90 em 90 prédios.

N = 900, logo os prédios serão numerados de 001 a 900


n = 10 prédios a serem inspecionados
12

a partir da 4ª coluna da TNA serão lido os três últimos algarismos do primeiro número da
tabela que se enquadre na numeração estabelecida, a partir desse número serão obtidos
os demais por acréscimos sucessivos de 90 (parcela sistemática).

Valores selecionados: número tabelado 030

030, 120, 210, 300, 390, 480, 570, 660, 750, 840.

Se depois de inspecionar os 10 prédios acima eu quisesse inspecionar mais um. Qual seria
esse prédio?

Como 840+90 = 930 e eu só tenho 900 não posso usar o 930.


De 840 até 900 há 60 prédios logo faltam 30 para chegar até 90. Como 030 já está
selecionado eu tenho que selecionar na tabela o próximo número que é 372.

OBS: Na seleção não pode haver número repetido.

Amostragem Proporcional ou Estratificada

Obter uma amostragem estratificada de 10% representativa da estatura de noventa alunos


de determinada turma da UNISUAM, sabendo que os primeiros 54 alunos são do sexo
masculino. Utilizar a TNA a partir da 1ª linha.

Resposta:
N = 90 alunos, logo os alunos serão numerados de 01 a 90
Os primeiros 54 são do sexo masculino e estão numerados de 01 a 54 M = 54
Os 36 últimos são do sexo feminino e estão numerados de 55 a 90 F = 36

SEXO População 10% Amostra


M 54 10x54 = 5,4 5
100
F 36 10x36 = 3,6 4
100
Total 90 10x 90 = 9,0 9
100
a partir da 1ª linha da TNA serão lidos os dois últimos algarismos do número tabelado:

números tabelados:

masculinos: 13, 30, 02, 14, 33.


femininos: 70, 69, 61, 59.

OBS: Na seleção não pode haver número repetido.

Exercícios para serem feitos na sala de aula:

1) Desejando distribuir 5 livros entre seus alunos, em número de 35, um professor, tendo
em mãos o diário de Classe e a Tabela de números aleatórios(TNA), resolveu sortear
aleatoriamente (ao acaso) os 5 alunos que irão receber esses livros.
Consultar a TNA a contar da 2ª coluna.
13

2) Em Niterói, em 1965, existiam 28 ginásios. Selecionar sistematicamente, uma


amostra de 7 ginásios.
Consultar a TNA a partir da 20ª linha.

3) Em uma escola existem 80 alunos com 10 anos de idade, sendo 8 alunos na Primeira
Série, 13 na Segunda Série, 30 na Terceira Série e 29 na Quarta Série. Selecione 18
alunos dessa escola proporcionalmente às Séries.
Consultar a TNA a contar da 6ª coluna.

1.1.6 – Confecção de questionários: perguntas abertas e fechadas.

Classificação de perguntas:

a) com respostas fechadas:

dicotômicas: são aquelas que apresentam apenas duas alternativa de respostas:


Exemplo: O senhor votou na última eleição?
( ) Sim ( ) Não

perguntas com múltiplas respostas: são aquelas que apresentam uma lista de
alternativas:
* com apenas uma única marcação como resposta;
Exemplo: A Sra. faz compras neste mercado:
( ) Diariamente ( ) Semanalmente
( ) Quinzenalmente ( ) Mensalmente.
14

* com mais de uma marcação como resposta, sem necessidade de preferência


ou ordem;
Exemplo: Quais os bancos com os quais o Sr(a) trabalha?
( ) Unibanco ( ) Bandeirantes ( ) Bradesco
( ) Real ( ) Itaú ( ) Banerj
( ) Brasil ( ) Caixa Econômica

perguntas com ordenação de respostas: são aquelas que apresentam


múltiplas alternativas de resposta, havendo porém a marcação seqüencial de preferência ou
importância:
Exemplo: Por que o(a) Sr(a). estuda Comunicação Social?
( ) Vocação profissional;
( ) Mercado de trabalho promissor, com ganhos financeiros;
( ) Amplo contato com o público;
( ) Versatilidade de trabalho
( ) Possibilidade de incrementar técnicas criativas;
( ) Viajar em busca de novos assuntos e desenvolvimento tecnológico.

perguntas com escala de significação: são aquelas que apresentam uma lista
de respostas alternativas preestabelecidas, escalonadas quanto à significação, só podendo
haver uma única marcação:
Exemplo: O que acha da obrigatoriedade de todo cidadão ser um doador de
órgãos em potencial, conforme requer o texto legal aprovado, recentemente, pelo Congresso
Nacional?
( ) Aceito, integralmente a idéia;
( ) Aceito, condicionalmente a idéia;
( ) Rejeito, integralmente a idéia;
( ) Não tenho posição definida

b) com respostas abertas:

Sempre que possível não devemos utilizar respostas em aberto, posto que o
informante com liberdade de expressão e opinião, não garante uma apuração objetiva e
concreta do fato pesquisado.

1.2 – SÉRIES ESTATÍSTICAS

1.2.1 – Elaboração de Tabelas

A tabela estatística é o meio utilizado para apresentar os dados de uma ou mais séries
estatísticas (conjunto de dados observados). O seu uso é oficializado pela ABNT - Associação
Brasileira de Normas Técnicas, através da Resolução nº 886, de 26 de outubro de 1966.

Uma tabela estatística compõe-se de elementos essenciais e elementos


complementares.

Os elementos essenciais de uma tabela estatística são: o título, o cabeçalho, a coluna


indicadora e o corpo.

Título - é a indicação que precede a tabela e que contém a designação do fato observado, o
local e a época em que foi registrado.

Cabeçalho - é a parte superior da tabela e que especifica o conteúdo das colunas.

Coluna Indicadora - é a parte da tabela que especifica o conteúdo das linhas. Uma tabela
pode ter mais de uma coluna indicadora.
15

Corpo - é o conjunto de colunas e linhas que contém, respectivamente, em ordem vertical e


horizontal, as informações sobre o fato observado.

No corpo da tabela, o encontro de cada linha com cada coluna constitui uma “casa” ou
“célula” e não deve ser preenchida com expressões literais; na falta de um registro numérico,
será inscrito um sinal convencional.

Os elementos complementares de uma tabela estatística são: a fonte, as notas e as


chamadas e se situam no rodapé da tabela.

Fonte - é a indicação da entidade responsável pelo fornecimento dos dados ou pela sua
elaboração.

Notas - são informações de natureza geral, destinadas a conceituar ou esclarecer o conteúdo


das tabelas, ou a indicar a metodologia adotada no levantamento ou elaboração dos dados.

Chamadas - são informações de natureza específica sobre determinada parte da tabela,


destinadas a conceituar ou esclarecer dados.

1.2.1.1 - Indicação da data de referência dos dados

a) data não deve ter ponto separando grupo de três algarismos nem espaço entre algarismos.
Exemplo: 2000 errado 2.000 ou 2 0 0 0

b) quando os dados se referirem a uma série de anos civis consecutivos, indicam-se o primeiro
ano da série separado por hífen dos dois últimos algarismos, do último ano da série.
Exemplo: Série 1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987 representação 1980-87

c) quando os dados se referirem a uma série de anos civis consecutivos que indiquem
mudança de século, representa-se, o primeiro ano da série, separado por hífen dos três
últimos algarismos do último ano da série.
Exemplo: Série: 1897, 1898, 1899, 1900, 1901, 1902, 1903, 1904 representação 1897-904.

d) quando os dados se referirem a uma série de anos civis não consecutivos, indicam-se o
primeiro e o último ano da série, ambos em algarismos completos, separados por hífen.
Exemplo: Série: 1987, 1989, 1990, 1993, 1994, 1995, 1996, 1998, 1999 representação
1987-1999 .
e) quando os dados se referirem a um período de doze meses diferentes do ano civil, indicam-
se o primeiro ano e a parte variável do segundo, separados por uma barra inclinada ( / ).
Exemplo: 1998/99.

f) a indicação dos meses poderá ser abreviada pelas suas três primeiras letras, exceto o mês
de maio, ou por algarismos romanos.
Exemplo: janeiro - jan ou I fevereiro - fev ou II maio - maio ou V.

1.2.1.2 - Emprego de Sinais Convencionais


__ (traço), quando o dado for nulo.
... (três pontos), quando não dispuser do dado.

0 (zero), 0,0 (zero vírgula zero), 0,00 (zero vírgula zero zero), quando o valor numérico for
menor que a metade da unidade ou fração decimal
x (letra x), quando o dado for omitido a fim de evitar a individualização das informações.

1.2.1.3 - Símbolos das Unidades de Medidas

Para designar as várias unidades de medidas devem ser usados, exclusivamente, os


símbolos indicados no “Quadro de Unidades Legais no Brasil” (Decreto no 52.423, de 1963).
O símbolo não deve ser seguido de ponto final ou da letra s em sinal de plural.
16

Exemplos:
gramas símbolo g e não gr ou grs
metros símbolo m e não mts ou Mt.
toneladas símbolo t e não T ou ton

Quando o valor numérico de uma grandeza for fracionário, o símbolo deve ser escrito
no final e não intercalado.
Exemplo: cinqüenta quilos e vinte e cinco 50,25 kg e não 50 kg, 25.
Os símbolos serão escritos na mesma linha dos números e não em forma de expoente,
sendo exceção, apenas, as unidades sexagesimais de ângulo.
Exemplo: 3 anos 2 meses 20 dias 13 horas 7 minutos 9 segundos - 3 a 2 m 20 d 13 h 7
min 9 s
15 graus 10 minutos 25 segundos - 15o 10’ 25’’

1.2.1.4 - Tipos de Tabelas

As tabelas podem ser:


• simples (ou unidimensional) - são aquelas que apresentam dados ou informações relativas
a uma variável apenas.
• dupla entrada ou cruzada (ou bidimensional) - são aquelas que apresentam informações
de, pelo menos, duas variáveis, podendo as duas ser ou não qualitativas ou quantitativas.

Exemplo: Tipo Simples


Empresa Delta, número de funcionários por tempo de
serviço  2000

Tempo de serviço Número de funcionários


(em anos)
3 03
4 04
5 06
6 07
7 05
8 03
9 02
Total 30
Fonte: Departamento de Pessoal.

Exemplo: Tipo Dupla Entrada


Rio de Janeiro, número de ouvintes, segundo suas
preferências por programa de rádio e por sexo  1999

Sexo
Preferência por Masculino Feminino Total
Programa de rádio
noticiários 08 05 13
musical 10 16 26
novela 07 23 30
esportivo 40 06 46
outro 02 03 05
Total 67 53 120
Fonte: Revista Brasileira de Informações & Negócios, nº 01,jan/2000
17

Tabela Completa
Rede Ferroviária Federal S/A Título
Pessoal existente em 31.12 - 1980-91

Anos Pessoal existente em Cabeçalho


31.12
Coluna indicadora
1980 89.420
1981 88.325
1982 84.632
1983 82.292 Casa
1984 85.736
1985 (1).. 67.522
1986 63.878
1987 62.829
1988 58.683
1989 58.449
1990 52.976
1991 49.341

Fonte: RFFSA - Gerência de Estatística


(1) Não inclui a partir de 1985, o pessoal Chamadas
da CBTU: Cia. Brasileira de Trens Urbanos.
Nota: Inclui o pessoal do Plano de Cargos
e Salários e aqueles ocupantes de Cargos
em Comissão, não pertencentes a RFFSA

1.2.1.5 - Observações Complementares

Toda tabela deve apresentar um Total, horizontal, vertical ou ambos dependendo da


natureza da tabela e a linha de total fica inserida no corpo da tabela.
É preciso certa ESTÉTICA de construção.
Não se fecha a tabela lateralmente.
A tabela deve ser bastante clara para propiciar rápida observação dos dados.

Exercícios de construção de tabelas

a) Substituir por uma tabela o trecho do Relatório a seguir:

“Assim sendo, podemos concluir que este Banco, em 2003, contou com a colaboração de
345 funcionários, distribuídos pelas nossas cinco Agências, a saber: Niterói, 43; Rio de Janeiro,
102; São Paulo, 98; Belo Horizonte, 75; Vitória, 27. Quanto ao sexo, apenas em Vitória não
existiam funcionárias, mas em São Paulo trabalharam 11 delas, enquanto em Belo Horizonte
apenas 3. Em Niterói 38 eram do sexo masculino e no Rio de Janeiro, 87.”
18

BANCO
Número de Funcionários, segundo as Agências e por Sexo
em 2003

Número de Funcionários
Agências por Sexo
Total
Feminino Masculino

Rio de Janeiro 15 87 102


São Paulo 11 87 98
Belo Horizonte 3 72 75
Niterói 5 38 43
Vitória - 27 27
Total 34 311 345
Fonte: Relatório do Banco

b) Um Grupo Escolar funciona em três turnos e possui alunos nas cinco séries em todos os
turnos, à exceção da 1 a Série, que não funciona no 1 o Turno, e da 5a Série, que não funciona
no 3o Turno. Preparar uma tabela onde possamos revelar o número de alunos desse
estabelecimento, por Série e ao mesmo tempo por Turnos.

GRUPO ESCOLAR
Número de Alunos segundo as Séries e Turnos - 2005

Número de Alunos
Séries por Turnos
Total
1º Turno 2º Turno 3º Turno

1ª Série -
2ª Série
3ª Série
4ª Série
5ª Série -
Total
Fonte: Secretaria do Grupo Escolar.

c) Organizar uma tabela com os dados abaixo, dando-lhe o título conveniente:


Em 1940 uma fábrica tinha 300 operários sindicalizados e 500 não sindicalizados, sendo 600
homens e 200 mulheres. Em 1941, havia 600 operários mais que em 1940; 300 eram
sindicalizados e 900 eram homens. Quanto à cor, pretos e brancos, no primeiro ano havia 700
pretos; no segundo ano, 122 pretos e no terceiro, 700 pretos. Em 1942 os operários eram
2000, dos quais 1.200 do sexo masculino e 1.500 sindicalizados.

FÁBRICA
Número de Operários segundo o Vínculo Sindical, Sexo e Cor – 1940-42

Número de Operários
Anos por Vínculo Sindical por Sexo por Cor
Total
Sindicalizados Não Sindicalizados Homens Mulheres Pretos Brancos

1940 300 500 600 200 700 100 800


1941 300 1.100 900 500 122 1.278 1.400
1942 1.500 500 1.200 800 700 1.300 2.000
Fonte: Divisão de Pessoal da Fábrica
19

d) Reproduzir a tabela abaixo, observando as Normas vigentes de apresentação de quadros


estatísticos:

Unidades Escolares, por Localização  1960 -1968


Anos Unidades Escolares
Urbanas Distritais Rurais Total
1960 ignorado ignorado ignorado 45
1961 12 não tem 40 52
1962 14 não tem 46 60
1963 14 não tem 48 62
1964 15 2 56 73
1965 17 3 60 80
1966 20 5 63 88
1967 23 6 66 95
1968 26 4 70 100
Erros observados:
1) O Título colado no Cabeçalho. 2) Omissão do Local de ocorrência. 3) A época é para série
de anos não consecutivos. 4) Falta, na Coluna Indicadora “Unidades Escolares”, a sub coluna
“por Localização”. 5) No corpo, na parte numérica [a partir da 2ª coluna], não pode haver
expressões literais tais como: ignorado e não tem, essas expressões tem que serem
substituídas por sinais convencionais. 6) Falta indicar a Fonte. 7) Tabela não se fecha
lateralmente.

1.2.2 Séries Estatísticas

Entende-se por Representação Tabular a apresentação de um determinado fenômeno


de forma quantitativa, isto é, em números organizados (tabulados) em quadros ou tabelas.
Esses números constituem as Séries Estatísticas. Desta forma podemos definir Séries
Estatísticas como sendo a apresentação das informações em forma de tabelas ou como toda e
qualquer coleção de dados estatísticos referidos a uma ordem de classificação, ou ainda, como
uma sucessão de dados estatísticos que medem a intensidade do fenômeno, dispostos em
correspondência com um critério de modalidade qualitativa ou quantitativa.

O conjunto de dados estatísticos (variável) é agrupado segundo os seguintes


itens: época, local e fato.

a) Série temporal ou histórica ou cronológica ou evolutiva ou de andamento ou de marcha: é


aquela em que varia a época (tempo), permanecendo fixos o local e o fato.
Exemplo:
20

MUNICÍPIO DE VITÓRIA, OBSERVAÇÕES METEREOLÓGICAS


Temperatura do ar, máxima e mínima - janeiro a dezembro – 1974

Temperatura do ar (ºC) Temperatura do ar (ºC)

Meses Média das Média das Meses Média das Média das
máximas mínimas máximas mínimas

Janeiro 31,2 23,3 Julho 26,9 18,1


Fevereiro 31,6 23,1 Agosto 27,1 19,3
Março 30,4 23,0 Setembro 27,4 20,5
Abril 29,4 22,1 Outubro 27,7 20,8
Maio 27,7 21,1 Novembro 29,0 21,5
Junho 26,6 19,0 Dezembro 29,4 22,0

Fonte - IBGE- Anuário Estatístico do Brasil - 1975


Nota: As temperaturas constantes da tabela são resultantes da média aritmética das
observações diárias realizadas nas estações meteorológicas do município.

b) Série geográfica ou espacial ou de localização ou territoriais, etc: é aquela em que varia o


local (território ou área), permanecendo fixos a época e o fato.
Exemplo:

PRODUÇÃO DO PESCADO BRASILEIRO


Quantidade de pescado nas Regiões Nordeste, Sudeste e Sul, por
Unidades da Federação - 1973

QUANTIDADE DE
UNIDADES DA FEDERAÇÃO PESCADO
(t)

TOTAL.................................. 637.669

REGIÃO NORDESTE.................. 148.869


Maranhão.......................................... 49.961
Piauí.................................................. 2.547
Ceará................................................. 32.955
Rio Grande do Norte.......................... 10 643
Paraíba.............................................. 24.097
Pernambuco...................................... 4.784
Alagoas............................................. 2.915
Sergipe.............................................. 1.797
Bahia............................................. 19.179

REGIÃO SUDESTE..................... 222.672


Minas Gerais..................................... 2.237
Espírito Santo................................... 9.294
Rio de Janeiro......(1)........................ 158.652
São Paulo.......................................... 52.489

REGIÃO SUL............................... 266.128


Paraná............................................... 4.034
Santa Catarina................................... 135.799
Rio Grande do Sul............................. 126.295
FONTE: FIBGE- Fundação Instituto de Geografia e Estatística, Anuário Estatístico do Brasil – 1975,
Superintendência do Desenvolvimento da Pesca
1 - Corresponde ao atual Estado do Rio de Janeiro.
NOTA: Na classificação de pescado inclui peixes, crustáceos, moluscos, mamíferos aquáticos e
quelônios.
21

c) Série especificativa ou categórica: é aquela em que varia o fato (fenômeno),


permanecendo fixos a época e o local.

Exemplo: Produção Agrícola no Brasil  1974

Especificação Produção em 1.000 t


Algodão em Caroço 1.959
Cacau 165
Café 3.220
Cana de açúcar 96.412
Fumo em Folha 304
Milho em Grão 17.284
Soja 7.876
Trigo 2.858
Fonte: Revista Comércio e Mercado (Suplemento), março/76
d) Série mista: é aquela em que todos os itens são variáveis, ou seja, uma combinação das
séries: histórica, geográfica e categórica.
Exemplo
Estado do Rio de Janeiro

Produção de papel, segundo o tipo de produto – 1993-97

Tipo de papel Produção ( t )

1993 1994 1995 1996 1997

Total 214.611 213.641 230.252 233.282 222.119


Cartões e cartolinas 2.126 3.458 1.350 1.100 1.100
Embalagens 100.141 109.117 126.848 122.458 121.814
Escrever 17.008 6.032 845 800 2.350
Especiais 19.072 20.456 20.012 20.438 13.787
Impressão 29.565 32.579 35.854 37.590 37.647
Sanitários 46.699 41.999 45.343 50.896 45.421
Fonte: Anuário Estatístico do Estado do Rio de Janeiro - 1997
CIDE – Centro de Informações de Dados do Rio de Janeiro

e) Série de freqüência ou distribuição de freqüências: é aquela em que todos os itens são


fixos, porém, os dados da variável são agrupados por valores ou em classes de valores. No
agrupamento por valores associamos a cada dado observado da variável a sua freqüência
no rol, ou ainda, associamos a cada classe de valores a freqüência dos dados contidos no
rol, relativos à classe.
Exemplo:

Distribuição de freqüência simples ou por valores

SUAM - Estaturas dos Alunos de Estatística I -


2000/I

Estaturas (cm) No de Alunos


168 4
169 5
170 8
171 7
172 2
173 1
Total 27
Fonte: Vice - Diretoria Acadêmica
22

Distribuição de freqüências por classes

SUAM - Estaturas dos Alunos de Estatística II -


2000/I
Estaturas (cm) No de Alunos
150  156 5
156  162 4
162  168 10
168  174 18
174  180 4
180  186 3
186  192 2
Total 46
Fonte: Vice - Diretoria Acadêmica

1.2.2.1 - Gráficos das séries estatísticas

Série temporal - gráfico de linha ou curva e coluna;


Série geográfica - gráfico de barra, setor, coluna, cartograma ou barra composta;
Série categórica - gráfico de barra, setor, coluna ou barra composta;
Série mista - gráfico de barra ou de coluna;
Distribuição de freqüências - histograma, poligonal característica, polígono de freqüências e
ogiva de Gauss.
Distribuição etária da população - gráfico em pirâmide;

1.2.3 - Arredondamento de números

Arredondar é uma forma de se escrever um número com menos algarismos sem que ele perca
seu valor significativo, desde que fique especificado na Tabela a unidade de medida que se
está adotando ou com a mesma quantidade de algarismo quando se solicita que o
arredondamento seja feito para a aproximação pedida. Para isso, basta determinarmos para
que ordem ou casa decimal se queira fazer o arredondamento. Valores que antecedam a 0, 1,
2, 3 ou 4 não são arredondados permanecem fixos e valores que antecedam 5, 6, 7, 8 ou 9,
sofrem o arredondamento pelo acréscimo da unidade.

Exemplo:
arredondar 1.237.563 para unidade de milhar = 1.238 unidades de milhar ou 1.238.000.
arredondar 123.456 para centenas = 1.235 centenas ou 123.500.
arredondar 33,143 para dezenas = 3 dezenas ou 30.

Não podemos esquecer a máxima da aritmética  “Dez unidades de uma ordem qualquer faz
uma unidade de ordem imediatamente superior“. Os números são divididos em Classes
(unidades simples, milhares, milhões, bilhões , etc) e Ordens (unidades, dezena e centena), na
sua parte inteira.

A parte fracionária do número é composta pelos décimos, centésimos e milésimos, e


correspondente, respectivamente, à primeira, segunda e terceira casa após a vírgula. As
demais casas depois da vírgula não têm nome específico mas, seguem a metodologia das
classes indo de três em três algarismos e recebem as denominações de: milionésimos,
bilionésimos, etc.

Exemplo:
arredondar 567, 4373 para centésimos = 567,44 centésimos.
arredondar 33,143 para décimos = 33,1 décimos.
arredondar 22, 000543982 para milionésimos = 22,000544 milionésimos.
arredondar 125,47684 para milésimos = 125,477 milésimos
23

Exercício: arredondar como sugerido na coluna.

Número Décimos Unidades Dezenas Centenas


16,4
272,6
8,5
4,09
8,501
19.314,59
367,4176

Número Milésimos Centésimos Décimos Unidades Dezenas Centenas


319,1719
2,2583
97,6729
8,5001
2.543,5666
347,5113
66,5056
4,5912
777,1853
50,0000
5.327,492

1.3 - Distribuição de Freqüências

1.3.1- Dados brutos

São os valores que ainda não foram numericamente organizados, estão em bruto.

1.3.2- Rol

São os dados numéricos organizados em ordem, crescente ou decrescente de valor.

1.3.3- Distribuição de freqüências

É uma série em que o fenômeno, a época e a região permanecem fixos. O fenômeno,


porém, pode ser subdividido em grupos ou classes.
Quando os valores não estão agrupados em classes temos uma distribuição de freqüências
simples ou de valores; quando estão agrupadas em classes as distribuições são ditas de
freqüências por classes. Nas distribuições de freqüências, a primeira coluna da tabela
representa o fato numérico que analisamos (peso, altura, grau, etc) e a segunda coluna é a
coluna da freqüência. Freqüência é o número de vezes que o valor da primeira coluna
apareceu.

As distribuições de freqüências são utilizadas para representar um conjunto de dados


brutos, dependentes de uma variável contínua (estatura, peso, etc). A finalidade da distribuição
é tornar mais cômoda, ao analista, o estudo da série.

1.3.3.1 - Distribuição de Freqüência para dado não agrupado em classes ou Distribuição


de Freqüência Simples

Nessa tabela coloca-se na primeira coluna os valores da série numérica em ordem


crescente, sem repeti-los e, na segunda, coluna as freqüências.
24

Exemplo: Os dados a seguir referem-se à estaturas, em metros, dos 32 alunos de Estatística I


da Turma 52303, no ano 2000.
1,74 1,70 1,56 1,68 1,76 1,78 1,62 1,81 1,72 1,68 1,66 1,56 1,69 1,68 1,62 1,60 1,63
1,68 1,62 1,72 1,68 1,67 1,70 1,53 1,71 1,66 1,68 1,56 1,60 1,72 1,73 1,63.
Construir uma Distribuição de Freqüências Simples.

Estaturas Número
(m) de Alunos
1,53 1
1,56 3
1,60 2
1,62 3
1,63 2
1,66 2
1,67 1
1,68 6
1,69 1
1,70 2
1,71 1
1,72 3
1,73 1
1,74 1
1,76 1
1,78 1
1,81 1
Total 32

1.3.3.2 - Distribuição de Freqüência para dado agrupado em classes ou Distribuição de


Freqüência por Classes

Para se forma os agrupamentos ou classes procede-se da seguinte forma:

( i ) - tomam-se os números maior ( Ls ) e menor ( Li ) da série de valores;


( ii ) - Calcula-se a Amplitude Total ( AT ) da série numérica pela diferença entre o maior e
menor valor
AT = Ls - Li

os grupamentos ou classes surgem pela subdivisão deste campo de variação. Esse subdivisão
é feita de maneira a englobar porções de valores e o número de classes vai ser função do
intervalo destes grupamentos.

1.3.3.2.1- Noções de Intervalos de Classe

Os intervalos de classes podem ser:

1) Intervalo aberto: representado por a  b , no qual inclui todos os valores


intermediários aos extremos, com exceção aos extremos.
2) Intervalo fechado: representado por a  b, no qual incluem, além dos valores
intermediários aos extremos, os próprios extremos.
3) Intervalo semi-aberto à direita: representado por ab, no qual inclui todos os valores
intermediários aos extremos, inclusive o extremo à esquerda, mas não inclui o extremo à
direita.
4) Intervalo semi-aberto à esquerda: representado por a  b, no qual inclui todos os
valores intermediários aos extremos, inclusive o extremo à direita, mas não inclui o extremo
à esquerda.
25

( iii ) - Calcular o intervalo de classe ( h )


É comum dividir-se a amplitude total em um número conveniente de intervalos de classe que
tenham a mesma amplitude. Se isto não é possível, usam-se intervalos de classe de
amplitudes diferentes ou abertos. O número de intervalo de classe é comumente tomado entre
5 e 20 dependendo dos dados.
Há várias maneiras de se determinar o tamanho de h ( intervalo de classe)

1ª maneira
h  [ AT/20; AT/5]

2ª maneira
Encontrando o h ideal.
Para o cálculo do h ideal usamos a fórmula: h  AT
1 + 3,332 . log N
sendo h = intervalo de classe
AT = amplitude total
N = número de dados coletados

Pode-se determinar o número de classes , n,( número de intervalos) por dois critérios:

n = 1 + 3,332 . log N ou n = AT/ h

A tabela de logaritmos mais comuns está anexada no final do item.

( iv) - Construir a coluna das classes:


O valor que inicia a primeira classe é o menor valor ( Li ) da série de valores ou qualquer valor
ligeiramente menor que ele para que ele esteja contido.
O valor que termina a primeira classe será obtido pelo acréscimo de h ao primeiro valor da
classe.
O valor que termina uma classe inicia a classe seguinte, exceto a primeira classe, e o valor que
termina cada classe será obtido pelo acréscimo de h ao primeiro valor da classe.
O valor que termina a última classe poder ser o maior valor ( Ls ) da série de valores ou
qualquer valor ligeiramente superior a ele para que ele esteja contido.

(v) Construir a coluna das freqüências.

Observação: para não se perder tempo não há necessidade de se colocar os dados


numéricos dispostos em um rol, use-se nesse caso uma coluna auxiliar denominada
Contagem.

Exemplo: Imagine a coleta dos seguintes dados a respeito de um determinado fenômeno:

49 28 36 30 35 41 38 37 36 45 65 47 35 46 36 48 41 22 56 54 43 33 45 43 40
37 33 52 56 44 38 50 49 29 29 32 35 33 45 28 49 32 30 63 37 37 38 50 40 52
29 46 57 33 45 43 40 45 40 33 34 34 36 42 47 42 54 47 33 33 41 34 19 42 29
50 46 33 45 54 53 44 31 29 55 38 42 44 31 32 39 39 38 38 40 37 45 46 37
31.

Construir uma distribuição de freqüências por classes conveniente, utilizando a 2ª maneira.

Ls = 65 e Li = 19 ;

AT = Ls - Li = 65 - 19 = 46

h AT h 46 h 6
1 + 3,332 . log N 1+ 3,332.log 100
26

Classes Contagem Freqüências


19  25 2
25  31 9
31  37 24
37  43 26
43  49 21
49  55 12
55  61 4
61  67 2
Total - 100

Exercício em sala de aula.

Os pesos (em quilogramas) dos alunos de Métodos Quantitativos estão arrolados baixo:

67 81 72 55 69 74 82 76 54 61 79 84 59 57 65 89 76 88 57 74 66 78 58 77 75 74 73 72 72 84
59 57 56 82 87 67 89 90 72 66 55 69 87 77 76 75 64 63 62 61 60 78 79 77 76 75 74 73 71 59
58 57 56 55 90 54 78 67 59 62 75 88 57 81 73 55 89 .
Construir uma distribuição de freqüências por classes conveniente.

a) Encontrar Li = kg e Ls = kg
b) Calcular AT = Ls - Li =
c) Encontrar o N (que é o número de alunos) N = alunos
d) Encontrar o valor para h (que é o intervalo de classe) utilizando a 1ª maneira

h= [ AT ; AT ] =
20 5

e) Construir a distribuição solicitada

Pesos Contagem Número de Alunos


(kg)

Total

1.3.3.3 - Elementos Característicos das Distribuições de freqüências

1) Classes - são os agrupamentos em que a série foi subdividida. São constituídas pelos
valores da variável contínua Xi que se enquadram entre seus extremos.
No exemplo anterior vê-se uma série com 8 classes.
A 1a Classe é 19  25 e a 6 a é 49  55.

2) Limites de Classes - são os valores de cada classe, sendo o da esquerda (menor valor)
limite inferior ( Li ) e o da direita ( maior valor), limite superior ( Ls ) .
No exemplo anterior o limite inferior da 3 a Classe é 31 e o superior da mesma classe é 37.
27

3) Limites não definidos - são aqueles em que geralmente deixamos indefinidos seus
intervalos. Isso só pode ocorrer na primeira classe, na última classe ou em ambas.
Se não existe limite inferior da primeira classe a tabela é dita aberta à esquerda.
Se não existe limite superior da última classe a tabela é dita aberta à direita.
Se não existe limite inferior da primeira classe nem superior da última a tabela é dita aberta.

Exemplo: Distribuição dos Domicílios da Grande São Paulo,


segundo a Classe de Renda  1974

Renda Domiciliar Número de


1,00 u.m. Domicílios
Até 800 622.720
801 a 1.600 733.920
1.601 a 2.300 356.265
2.301 a 3.500 256.455
3.501 a 5.900 109.115
Mais que 5.900 83.400
Total 2.171.875
Fonte:Revista Mercado Global no 5  set/74

4) Limites Reais ou Verdadeiros de Classe - são obtidos através da média aritmética


simples entre o limite superior de uma classe e o limite inferior da classe seguinte.

Exemplo:
No quadro do item 3 , o Limite Inferior Real da 2 a Classe é 800 u.m. + 801 u.m. = 800,5
u.m.
2
e o Limite Superior Real da 4 a Classe é 3.500 u.m. + 3.501 u.m. = 3.500,5 u.m.
2

5) Amplitude do Intervalo de Classe (h) - é a diferença entre o limite inferior ( ou superior )


de uma classe e o limite inferior ( ou superior ) da classe anterior.

Exemplo:
No exercício do item (b) a amplitude do intervalo de classe referente à 4 a classe pode ser
obtido fazendo:
h4 = Li4 - Li3 = 37 - 31 = 6 ou h4 = Ls4 - Ls3 = 43 - 37 = 6.

6) Pontos Médios das Classes ( Xi ) - é a média aritmética simples entre o limite superior e o
inferior de uma mesma classe, ou, ainda, é a soma do limite inferior de uma classe com a
metade da amplitude do intervalo de classe (h), ou seja:
Xi = Li + Ls ou Xi = Li + h
2 2
Observação: quando a distribuição possui o mesmo h para todas as classes, calcula-se o
ponto médio para a primeira classe e obtém-se os demais por acréscimos sucessivos de h.

Exemplo: Calcular Xi para as classes da tabela abaixo.

Classes Freqüências Xi
19  25 2 22
25  31 9 28
31  37 24 34
37  43 26 40
43  49 21 46
49  55 12 52
55  61 4 58
61  67 2 64
Total 100 -
28

7) Amplitude Total ou Oscilação (AT) - é a diferença entre os valores extremos.

Exemplo: na tabela do item 6 a AT = 67 - 19 = 48

8) Classe Modal - é a classe onde se verifica a maior freqüência. Uma tabela pode ter mais de
uma classe modal.

Exemplo: na tabela do item 6 a classe modal é 37 43 .

9) Freqüência Absoluta Simples (Fi ) - é definida como sendo o número de informações de


cada classe.
Exemplo: na tabela do item 6 a freqüência simples da 6 a classe é F6 = 12.

10) Freqüência Total (Ft ) - é a soma de todas as freqüências simples absolutas.

Exemplo: na tabela do item 6 a freqüência total é Ft = 100.

11) Freqüência Simples Relativa (Fr ) - é o quociente entre a freqüência simples e a


freqüência total, isto é:
Fr = Fi / Ft

observação: a soma das freqüências relativas vale 1 (um).


Quando calculamos a freqüência relativa devemos utilizar uma precisão de 4
(quatro) dígitos decimais, sempre que possível, para evitar erro de arredondamento.

Exemplo: Calcular a freqüência relativa dos dados da tabela.

Classes Freqüências Fr
19  25 2 0,02
25  31 9 0,09
31  37 24 0,24
37  43 26 0,26
43  49 21 0,21
49  55 12 0,12
55  61 4 0,04
61  67 2 0,02
Total 100 1,00

12) Freqüência Percentual ou porcentagem (%) - é o produto da freqüência relativa por 100,
isto é,

% = Fr x 100
observação: a soma das freqüências percentuais vale 100 .

Exemplo: Calcular a freqüência percentual dos dados da tabela.

Classes Freqüências %
19  25 2 2
25  31 9 9
31  37 24 24
37  43 26 26
43  49 21 21
49  55 12 12
55  61 4 4
61  67 2 2
Total 100 100
29

13) Freqüência Absoluta Acumulada (F ac )

Podemos acumulas as freqüências por dois métodos distintos: “abaixo de ‘’ e “acima de ‘’.

No processo “ abaixo de ‘’ (Fac  ) (crescente, direta) - a freqüência acumulada é obtida


através da adição sucessiva das freqüências simples absolutas de cada classe anterior a ela e
a freqüência simples absoluta de cada classe.

Exemplo: Calcular a freqüência acumulada ‘’ abaixo de’’ dos dados da tabela.

Classes Freqüências Fac


19  25 2 2
25  31 9 11
31  37 24 35
37  43 26 61
43  49 21 82
49  55 12 94
55  61 4 98
61  67 2 100
Total 100 -

No processo “acima de ‘’ (Fac  ) (decrescente, indireta) - a freqüência acumulada é obtida


através da adição sucessiva das freqüências simples absolutas de cada classe posterior a ela e
à freqüência simples absoluta de cada classe.

Exemplo: Calcular a freqüência acumulada “acima de’’ dos dados da tabela.

Classes Freqüências Fac 


19  25 2 100
25  31 9 98
31  37 24 89
37  43 26 65
43  49 21 39
49  55 12 18
55  61 4 6
61  67 2 2
Total 100 -

14) Representação Gráfica de uma Distribuição de Freqüências

Numa Distribuição de Freqüências podemos destacar quatro tipos de gráficos:


• Histograma ou Diagrama de Colunas;
• Poligonal Característica;
• Polígono de Freqüências;
• Polígono de Freqüências Acumuladas ou Ogivas (Ogiva de Galton).
Esses gráficos foram apresentados no item 1.2.3.2 e).
30

Exercícios em sala de aula.


1) Dada a tabela abaixo:

Classes Freqüências
19  25 2
25  31 9
31  37 24
37  43 26
43  49 21
49  55 12
55  61 4
61  67 2
Total 100
Responda:

a) Qual o limite inferior da terceira classe ? R: Li3 =

b) Qual o limite superior da sétima classe ? R: Ls7 =

c) Quantas classes tem a tabela ? R:

d) Qual a amplitude total da tabela ? R: AT = Ls - Li =

e) Qual a classe modal ? R:

f) O intervalo de classe (h) é constante ? R:

2) Dada a distribuição de freqüências calcule o ponto médio das classes ( Xi )

Estaturas Número de Xi
(cm) Alunos
162  166 5
166  172 7
172  180 15
180  184 11
184  194 6
Total 44

3) Dada a distribuição de freqüências calcule o ponto médio das classes ( Xi )

Estaturas Número de Xi
(cm) Alunos
162  166 5
166  170 7
170  174 15
174  178 11
178  182 6
Total 44
31

4) Dada a distribuição de freqüências calcule as freqüências relativas ( Fr )

Estaturas Número de Fr
(cm) Alunos
162  166 5
166  170 7
170  174 15
174  178 11
178  182 6
Total 44

5) Dada a distribuição de freqüências calcule as freqüências percentuais ( % )

Estaturas Número de %
(cm) Alunos
162  166 5
166  170 7
170  174 15
174  178 11
178  182 6
Total 44

6) Dada a distribuição de freqüências calcule as freqüências acumuladas pelo processo abaixo


de ( Fac  )

Estaturas
(cm)
Número de
Alunos
Fac 
162  166 5
166  170 7
170  174 15
174  178 11
178  182 6
Total 44

7) Dada a distribuição de freqüências calcule as freqüências acumuladas pelo processo acima


de ( Fac  )

Estaturas
(cm)
Número de
Alunos
Fac 
162  166 5
166  170 7
170  174 15
174  178 11
178  182 6
Total 44
32

1.4 - Representação Gráfica de maior uso.

1.4.1 - Requisitos e Vantagens

Todo gráfico deve ter simplicidade clareza e veracidade.

Simplicidade - indispensável devido à necessidade de levar a uma rápida apreensão do


sentido geral do fenômeno apresentado a fim de não nos perdermos na observação de
minúcias de importância secundária.
Clareza - é a representação de um dado de tal forma que não haja dúvida quanto a sua correta
interpretação.

Veracidade - indispensável qualquer comentário, posto que, se não representa uma realidade,
perde o gráfico sua finalidade.

As representações gráficas têm por finalidade principal mostrar, mediante a


utilização de figuras, as variações das intensidades de um ou mais fenômenos, mediante as
variações de outros fenômenos. Da mesma maneira que as tabelas, os gráficos também
apresentam algumas normas na sua confecção, quais sejam:

a) colocação de título acima da parte gráfica propriamente dita, escrito de forma clara e
completa, porém o mais conciso possível;
b) subtítulos - deverão ser colocados apenas quando necessário;
c) fonte - da mesma maneira que nas tabelas, logo abaixo do gráfico,
d) moldura - quando se deseja dar efeito mais estético ao gráfico;
e) orientação geral para leitura do gráfico - da esquerda para a direita;
f) notas e chamadas - sempre colocadas junto ao rodapé e somente quando absolutamente
necessário;
g) legendas - quando necessárias, devem ser dispostas de tal forma que não prejudiquem a
leitura do gráfico, facilitando-lhe a compreensão;
h) não aparecem as palavras classe e freqüências, incluindo-se , porém, no desenho apenas
as coordenadas indispensáveis para guiar a leitura adequada do mesmo;
i) a escala horizontal deve ser lida da esquerda para a direita; e a vertical de baixo para cima;
j) se o diagrama apresenta linhas curvas, estas devem ser traçadas de modo a se
diferenciarem bem das demais, e se incluir duas ou mais curvas diferentes, será vantajoso
que sejam de cores ou de espessuras diferentes;
k) sendo necessário apresentar algum sombreado ou colorido, deve sê-lo de modo a não
causar ilusões de ótica ou efeitos desagradáveis.

1.4.2.- Principais Gráficos

Os principais tipos de gráficos utilizados em nosso campo de estudo são:


estereogramas, cartogramas e diagramas, vamos deter-nos no estudo de alguns diagramas,
apenas.

Entre os diagramas (gráficos traçados sobre o plano no qual consideramos as


duas dimensões) temos vários tipos, a saber:

a) Gráfico em colunas e em barras simples

Gráfico em Colunas - mais utilizado quando as legendas a serem inseridas sob os retângulos
são de mesma largura, com altura proporcional às grandezas a serem comparadas, forem
curtas.

Gráfico em Barras - mais utilizado quando as legendas a serem inseridas são longas,
diferenciando-se do gráfico em colunas apenas pela posição dos retângulos que neste ocupam
a posição horizontal.
33

( i ) Colunas

REDE FERROVIÁRIA FEDERAL S/A


PESSOAL EMPREGADO

Pessoal existente em 31.12 - 1980-91

Anos Pessoal existente em


31.12

1980 89.420
1981 88.325
1982 84.632
1983 82.292
1984 85.736
1985 (1).......67.522
1986 63.878
1987 62.829
1988 58.683
1989 58.449
1990 52.976
1991 49.341

Fonte: RFFSA- Gerência de Estatística


Chamada: (1) Não inclui a partir de 1985, o
pessoal da CBTU: Cia. Brasileira de Trens
Urbanos.
Nota: Inclui o pessoal do Plano de Cargos
e Salários e aqueles ocupantes de Cargos
em Comissão, não pertencentes à RFFSA

Rede Ferroviária Federal S/A


Pessoal empregado em 31.12 - 1980-91

89,4 88,3
90 84,6 83 85,7
80
Milhares de empregados

70 67,5
63,9 62,8
58,7 58,4
60 53
49,3
50
40
30
20
10
0
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991

Fonte : Rede Ferroviária Federal S/A


34

Observando o modelo apresentado na página anterior chegaremos às seguintes conclusões:

a) as bases dos retângulos são todas iguais;

b) os espaços entre estes retângulos também são iguais, sendo que os mesmos não podem
ser menores do que a metade da base dos retângulos;

c) dados numéricos não devem ser inseridos no interior dos retângulos;

d) se cronológica a série a ser representada, nesta ordem, os dados a serem dispostos no eixo
horizontal devem ser colocados rigorosamente;

e) no eixo vertical foram feitos segmentos de tamanhos proporcionais às diversas intensidades


do fenômeno quantitativo (pessoal existente), em correspondência às diversas modalidades
da variável anos.
35

(ii ) Barras

CIGARROS

Produção de cigarros dos seis maiores produtores mundiais - 1995

Quantidade de cigarros
Países produtores produzidos
( Bilhões de unidades/ano)

China 1.720
Estados Unidos da América 716
Japão 265
Alemanha 220
Indonésia 190
Brasil 170

Fonte: Revista Veja - Março/1996. Fundação Getúlio Vargas. Instituto de Economia

PRODUÇÃO DE CIGARROS DOS SEIS MAIORES PRODUTORES MUNDIAIS


1995
BRASIL

INDONÉSIA

ALEMANHA

JAPÃO

EUA Bilhões de unidades

CHINA

0 500 1000 1500 2000

FONTE; Revista Veja - Março/1996 . Fundação Getúlio Vargas. Instituto de


Economia
36

Os gráficos em colunas e em barras visam comparar grandezas por meio de retângulos de


mesma largura e de alturas ou comprimentos proporcionais às respectivas grandezas. Para
tanto deve-se ordenar os fenômenos em ordem decrescente ou crescente, segundo suas
intensidades.

b) Gráfico em setor (ou setorgrama )

É o gráfico que representa as partes de um todo por setores de um círculo, visando justamente
a comparar estas partes entre si em relação ao total.

Guanabara  Investimentos Realizados


pela Firma Z  1965-67

Anos Valores (Cr$)


1965 90.000
1966 120.000
1967 150.000
Total 360.000
Fonte: Departamento Financeiro da Firma Z

Guanabara - Investimentos realizados


pela Firma Z - 1965-67

42%
25%

33%
1965
1966
1967

Fonte: Departamento Financeiro da Firma Z.

c) Gráfico Polar (ou radar)

É usado quando há interesse em evidenciar variações que após certo período de tempo se
repetem segundo um determinado ciclo.
37

Rio de Janeiro, Movimento das Vendas


da Firma Z  1999

Mês Valores (R$)


Janeiro 12.000
Fevereiro 13.000
Março 14.000
Abril 12.000
Maio 15.000
Junho 19.000
Julho 17.000
Agosto 18.000
Setembro 14.000
Outubro 16.000
Novembro 12.000
Dezembro 18.000
Fonte: Departamento de Vendas da Firma Z

Rio de Janeiro, Movimento das Vendas da Firma Z -


1999

Janeiro
20.000
Dezembro Fevereiro
15.000

Novembro 10.000 Março

5.000

Outubro - Abril Valores (R$)

Setembro Maio

Agosto Junho

Julho

Fonte: Departamento de Vendas da Firma Z


38

d) Gráfico em Linhas ou Curvas

É utilizado quando se pretende representar graficamente fenômenos contínuos, mormente em


dados dispostos por período de tempo (semana, mês, ano, hora, etc), ou por magnitude das
ocorrências (distribuições de freqüências).

BRASIL
Força de Trabalho
Taxa de desemprego aberto de fevereiro,
em todos os setores da economia-1984- 98

Taxa de desemprego
Anos aberto
%

1984 7,82
1985 6,12
1986 4,40
1987 3,38
1988 4,33
1989 3,99
1990 3,43
1991 5,41
1992 6,36
1993 5,77
1994 5,37
1995 4,25
1996 5,70
1997 5,55
1998 7,42
Fontes: IBGE - Fundação Instituto Brasi-
leiro de Geografia e Estatística
Jornal do Brasil - Economia - 31/3/98
Nota: A taxa de desemprego aberto
é calculada pela relação percentual entre o
número de pessoas que estavam procurando
emprego e a população economicamente
ativa.(PEA).
39

Brasil
Taxa de desemprego aberto de fevereiro- 1984-98

8
7
6
5
% 4
3
2
1
0
fev- fev- fev- fev- fev- fev- fev- fev- fev- fev- fev- fev- fev- fev- fev-
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98
Fontes: IBGE e Jornal do Brasil 31/3/98

e) Representação Gráfica de uma Distribuição de Freqüências

Numa Distribuição de Freqüências podemos destacar quatro tipos de gráficos:


• Histograma ou Diagrama de Colunas;
• Poligonal Característica;
• Polígono de Freqüências;
• Polígono de Freqüências Acumuladas ou Ogivas (Ogiva de Galton).

1) Histograma ou diagrama em Colunas

Construído em um sistema de eixos ortogonais, o Histograma é uma representação gráfica em


forma de retângulos (colunas) justapostos. É um dos gráficos que representa as Distribuições
de Freqüências.

Para sua construção, deve ser observado o seguinte:

Toma-se no eixo das abscissas positivas tantos segmentos iguais e consecutivos quantas
forem as classes da distribuição. Os seguimentos assim marcados servirão de bases a
retângulos cujas áreas deverão ser proporcionais às freqüências das classes correspondentes.
Para tanto é necessário que:

• A área total do Histograma seja proporcional à freqüência total, e as áreas parciais (área de
cada retângulo), proporcionais às freqüências das classes.
• As bases dos retângulos são proporcionais à amplitude do intervalo de classe (h).
• Caso as amplitudes dos intervalos de classes sejam unitárias, a altura de cada retângulo
terá como correspondente sua respectiva freqüência.
• A fórmula matemática para o cálculo da área do retângulo é S = b.h, sendo:
S = freqüência de classe (área)
b = intervalo de classe
h = altura

Para determinar a altura dos diversos retângulos basta dividir as freqüências das classes pelas
respectivas amplitudes. Os quocientes assim obtidos recebem o nome de densidade de
freqüência e são marcados no eixo positivo das ordenadas.

OBS: O contorno externo do Histograma é denominado “ poligonal característica” e,


as vezes, é apresentado por alguns autores como se fosse o Histograma.
40

UNISUAM - Estaturas dos Alunos de Estatística


e Probabilidade - 2004/I

Estaturas (cm) No de Alunos


150  156 5
156  162 4
162  168 10
168  174 18
174  180 4
180  186 3
186  192 2
Total 46
Fonte: Vice - Diretoria Acadêmica

Nº de Alunos
20 UNISUAM - estaturas dos alunos de
Estatística e Probabilidade - 2004/I

18

16

14

12

10

0
150 156 162 168 174 180 186 192

Fonte: Vice-Diretoria Acadêmica


41

2) Polígono de freqüência

É uma Poligonal, cujos vértices são obtidos pela interseção de cada ponto médio da classe e
sua respectiva freqüência absoluta simples correspondente. É outro gráfico que representa as
Distribuições de Freqüências

Para sua construção tomam-se no eixo das abscissas os valores do atributo e no eixo das
ordenadas as respectivas freqüências. Mas, ao invés de construirmos retângulos, marcamos os
pontos centrais dos segmentos em que foi dividido o eixo dos “x“ e por esses pontos,
levantamos ordenadas proporcionais às freqüências das classes, ligando-as depois por
segmento de reta. Os dois pontos extremos da distribuição devem ser ligados ao eixo das
abscissas no centro das classes seguintes (anterior e posterior).

UNISUAM - Estaturas dos Alunos de Estatística e


Probabilidade - 2004/I

Estaturas (cm) No de Alunos


150  156 5
156  162 4
162  168 10
168  174 18
174  180 4
180  186 3
186  192 2
Total 46
Fonte: Vice - Diretoria Acadêmica

UNISUAM - Estaturas dos Alunos de


Estatística e Probabilidade - 2004/I
Nº de Alunos

20

18

16

14

12

10

0 150 156 162 168 174 180 186 192

Fonte: Vice – Diretoria Acadêmica


42

3) Polígono de freqüências acumuladas (Ogivas de Galton)

Representam as freqüências acumuladas da mesma maneira que representamos as


freqüências absolutas simples. É outro gráfico que representa as Distribuições de
Freqüências.

Para sua construção, marcamos nas abscissas os valores da variável e nas ordenadas as
freqüências acumuladas.

UNISUAM- Estaturas dos Alunos de Estatística e


Probabilidade - 2004/I

Estaturas (cm) No de Alunos


150  156 5
156  162 4
162  168 10
168  174 18
174  180 4
180  186 3
186  192 2
Total 46
Fonte: Vice - Diretoria Acadêmica

a) Ogiva crescente - (processo abaixo de)

UNISUAM - Estaturas dos Alunos de Estatística


e Probabilidade - 2004/I

50
45
40
35
Nº de Alunos

30
25
20
15
10
5
0

Fonte: Vice – diretoria Acadêmica


43

b) Ogiva decrescente (processo acima de)

UNISUAM - Estaturas dos Alunos de Estatística


e Probabilidade - 2004/I

50
45
40
35
Nº de Alunos

30
25
20
15
10
5
0

Fonte: Vice – Diretoria Acadêmica.


44

TRABALHO DE PESQUISA

Nos exercícios abaixo marque a resposta certa:

1) É uma variável quantitativa:

a) nacionalidade; b) religião; c) peso; d) regiões brasileiras.

2) É uma variável qualitativa:

a) salário; b) temperatura; c) idade média; d) hierarquia militar.

3) É uma variável quantitativa contínua:

a) litros de água de um tanque; b) número de filhos das famílias dos favelados;


c) origem social dos alunos universitários; d) número de ações negociadas.

4) É uma variável quantitativa discreta:

a) a quantidade de café vendida no bar; b) número de filhos das famílias dos favelados;
c) origem social dos alunos universitários; d) os estados do nordeste brasileiro.

5) Segundo a sua origem os dados dividem-se em:

a) contínuos e periódicos; b) primários e secundários; c) periódicos e ocasionais; d)


homogêneos e contínuos.

6) Os métodos aplicáveis de coleta de dados classificam-se em:

a) contínuos e periódicos; b) periódicos e ocasionais; c) censo e amostragem; d) primários


e secundários.

7) Roletas que registram o número de pessoas que passam por elas, é um processo de coleta
de dados:

a) mecânico; b) experimental; c) de observação; d) por questionário

8) É a primeira Fase do Método Estatístico

a) Análise das informações; b) Planejamento; c) Crítica aos dados; d) Coleta de dados

9) No processo de coleta por questionário:

a) o entrevistador utiliza os serviços do correio;


b) os pesquisadores voltam mais tarde para buscar o questionário evitando, assim, o extravio;
c) o pesquisador tem uma lista de informações a serem colhidas e as registra sem
necessidade de interrogar o entrevistado;
d) o entrevistador preenche o questionário, interrogando o informante.

10) A propaganda da pesquisa a ser realizada pode ser:

a) somente escrita; b) só falada; c) escrita e falada; d) comentada

11) Em relação à classificação das perguntas, marque verdadeiro ( V ) ou falso ( F )

a) dicotômicas - são aquelas que apresentam uma lista de respostas ( );


b) Pergunta com ordenação de resposta - são aquelas que apresentam uma lista de
alternativas, com apenas uma marcação como resposta ( );
45

c) Perguntas com escala de significação - são aquelas que apresentam uma lista de
respostas preestabelecidas, escalonadas quanto à significação, só podendo haver uma
única marcação ( ).

12) A Fase do Método estatístico que cuida da apresentação, tabulando-se os dados, criando-
se os quadros, as tabelas, as distribuições de freqüências e os gráficos, com o objetivo de
facilitar a interpretação é:

a) Coleta de dados; b) Análise das informações; c) Crítica aos questionários; d) Apuração das
informações.

Responda as questões 13 e 14 a partir da observação da tabela abaixo:

Número de itens Número de pedidos


10  15 03
15  20 07
20  25 16
25  30 12
30  35 09
35  40 05
40  45 02
Total 54

13 ) Essa tabela é classificada como sendo de:

a) dupla entrada ou bidimensional; b) simples ou unidimensional; c) especifica; d) cruzada.

14) A série estatística que ela representa chama-se:

a) temporal; b) mista; c) distribuição de freqüências simples; d) distribuição de freqüências por


classes

15) A série estatística na qual o local varia chama-se:

a) temporal; b) especifica; c) geográfica; d) mista.

16) Para a Tabela abaixo o gráfico que melhor se ajusta é:


Preferência por Número de
programa de rádio ouvintes
noticiário 13
musical 26
novela 30
esportivo 46
outros 5
Total 120

a) barras; b) colunas combinadas; c) polígono de freqüências; d) histograma

17) A diferença entre o gráfico de colunas e o histograma, está no fato de:

a) a disposição dos retângulos ser vertical num e horizontal no outro;


b) o histograma possuir retângulos adjacentes;
c) o gráfico de colunas ser de emprego mais reduzido;
d) o histograma ser levantado sobre o meio dos intervalos de classe;
e) o histograma ser um gráfico de área.
46

18) O gráfico em barras ou colunas deve ser usados quando;

a) os dados estão grupados em classe;


b) queremos comparar as partes com o todo;
c) queremos evidenciar as variações;
d) queremos representar fenômenos contínuos;
e) comparar grandezas entre si.

19) O gráfico em setor deve ser usado quando:

a) os dados estão grupados em classe;


b) queremos comparar as partes com o todo;
c) queremos evidenciar as variações;
d) queremos representar fenômenos contínuos;
e) comparar grandezas entre si.

20) O gráfico em linhas ou curvas deve ser usado quando:

a) os dados estão grupados em classe;


b) queremos comparar as partes com o todo;
c) queremos evidenciar as variações;
d) queremos representar fenômenos contínuos;
e) comparar grandezas entre si.

21) O gráfico polar deve ser usado quando:

a) os dados estão grupados em classe;


b) queremos comparar as partes com o todo;
c) queremos evidenciar as variações;
d) queremos representar fenômenos contínuos;
e) comparar grandezas entre si.

22) Considerando a distribuição abaixo responda as questões de 1 a 6.

Classes Freqüências
0  3 3
3  6 5
6  9 4
9  12 2
 14

1) O limite superior da 3a classe é:

a) 6; b) 9; c) 2; d) 5.

2) Assinale a alternativa errada:

a) o número de elementos é 7; b) o limite inferior da 2 a categoria é 3; c) o intervalo de classe


é 3; d) o ponto médio da 3a classe é 7,5.

3) A Freqüência relativa (Fr) da 2 a categoria é:

a) 5; b) 0,21; c) 8; d) 0,36.

4) A percentagem acumulada até a 3a classe é:

a) 120%; b) 85,71%; c) 100%; d) 39%


47

5) O ponto médio da 4a classe é:

a) 7,5; b) 1,5 ; c) 10,5; d) 4,5.

6) O intervalo de classe é:

a) 3; b) 2; c) 4; d) 1.

23) Para representar a classe usa - se:

a) amplitude; b) ponto médio; c) o intervalo de classe; d) o limite da classe.


24) Dados os números 17, 45, 38, 27, 6, 48, 11, 57, 34, 22.
a) dispo-los em um rol crescente de valor.
b) dispo-los em um rol decrescente de valor.
c) Determinar a amplitude total do rol.
25) A representação gráfica das distribuições de freqüências podem ser feitas através de:
a) gráfico em colunas; b) somente por histograma; c) polígono de freqüências, ogiva e
histograma; d) gráfico em setor.

26) Os graus finais de estatística de 80 estudantes da Universidade do Estado estão


relacionados abaixo.

68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74
62 95 78 63 72 66 78 82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75 65 80 73 57 88 78 62 76 53 74 86 67 73 81 72
63 76 75 85 77.

Com referência a esses dados, determinar:


a) o maior grau;
b) o menor grau;
c) a amplitude total;
d) os graus dos cinco estudantes mais adiantados;
e) os graus dos cinco estudantes mais atrasados;
f) o grau do estudante classificado em 10o lugar;
g) quantos estudantes receberam grau igual ou superior a 75;
h) quantos estudantes receberam grau abaixo de 85;
i) qual a percentagem dos estudantes que receberam graus entre 65 e 85, inclusive;
j) o intervalo de classe h;
k) a distribuição de freqüências por classes;
l) a classe modal;
m) o ponto médio das classes;
n) a freqüência acumulada pelo processo “ abaixo de”;
27) Arredondar cada um dos números para a aproximação pedida.

a) 3.256 para centenas


b) 5,781 para décimos
c) 0,0045 para milésimos
d) 43,7385 para centésimos
e) 125,9995 com duas casas decimais
f) 3.502.378 para milhão
g) 148,574 para unidades simples
h) 0,000098501 para milionésimos
i) 2.184,73 para dezenas
j) 43,87500 para centésimos.
48

TRABALHO DE PESQUISA - GABARITO

1) (c) 7) ( a )
2) (d) 8) ( b )
3) (a) 9) ( d )
4) (b) 10) ( c )
5) (b) 11) a (F) b (F) c (V)
6) (c) 12) ( b )

13) ( b) 18) (e)


14) (d) 19) (b)
15) (c) 20) (d)
16) (a) 21) (c)
17) (b)

22) 1) b 2) a 3) d 4) b 5) c 6) a
23) b
24) a) 6, 11, 17, 22, 27, 34, 38, 45, 48, 57.
b) 57, 48, 45, 38, 34, 27, 22, 17, 11, 6.
c) AT = Ls - Li = 57 - 6 = 51.
25) c
26) a) 97.
b) 53.
c) AT = Ls - Li = 97 - 53 = 44
d) 94, 95, 95, 96, 97.
e) 53, 57, 59, 60 , 60.
f) 88.
g) 44.
h) 63.
i) 65%.
j) 6.
k) m)  n) 
Notas No de Xi Fac
Alunos
50 56 1 53 1
56 62 7 59 8
62 68 12 65 20
68 74 13 71 33
74 80 24 77 57
80 86 9 83 66
86 92 7 89 73
92 98 7 95 80
 80 - -

l) 74 80

27) a) 3.300 b) 5,8 c) 0,005 d) 43,74 e) 126,00 f) 4.000.000 g) 149 h) 0,000099 i) 2.180
j) 43,88.

Você também pode gostar