Você está na página 1de 47

ESTATÍSTICA I

ESTATÍSTICA
UNIDADE I DESCRITIVA

Instituições e Sistemas
Políticos do Estado

2018
Ficha Técnica:

Ficha Técnica:
Autor: Narcélio Mutombene
Revisor: Faculdade de Gestão, Economia e Contabilidade
Execução gráfica e paginação: Instituto Superior Monitor
1ª Edição: 2011
Readaptação por Instituto Superior Monitor: Janeiro de 2018
© Instituto Superior Monitor

Todos os direitos reservados por:


Instituto Superior Monitor
Av. Samora Machel, n. º 202 – 2.º andar
Caixa Postal 4388 Maputo
MOÇAMBIQUE

Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve
de modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
Índice
CAPÍTULO I – INTRODUÇÃO Á ESTATÍSTICA E APLICAÇÕES DA ESTATÍSTICA...5
1.1 CONCEITOS BÁSICOS DE ESTATÍSTICA ............................................................5
1.2. APLICAÇÕES DA ESTATÍSTICA.........................................................................6
1.3 CARACTERÍSTICAS DA INFORMAÇÃO ESTATÍSTICA ......................................6
1.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................7
1.5. ESTATÍSTICA NAS EMPRESAS ...........................................................................8
CAPÍTULO II– ESTATÍSTICA DISCRITIVA ..................................................................8
2.1 ORGANIZAÇÃO DE DADOS ESTATÍSTICOS.......................................................9
2.2 COLECTA DE DADOS......................................................................................... 10
CAPÍTULO III – DISTRIBUIÇÃO DE FREQUENCIAS ................................................. 12
3.1 COMPONENTES BÁSICAS DE UMA TABELA ................................................... 12
3.2 DISTRIBUIÇÃO DE FREQUÊNCIA ..................................................................... 13
3.3 APRESENTAÇÃO DE TABELAS ......................................................................... 15
3.4 GRÁFICOS ESTATÍSTICOS ................................................................................. 21
3.5 RECOLHA DE DADOS ........................................................................................ 22
3.6 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS ................................................. 23
3.6.1. GRÁFICO DE SECTORES................................................................................ 23
3.6.2. DIAGRAMA DE BARRAS................................................................................ 27
CAPÍTULO IV – REPRESENTAÇÃO GRÁFICA DE DADOS........................................ 30
4.1 GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS............................................... 30
4.1.1 HISTOGRAMA ................................................................................................. 30
4.1.2. POLÍGONO DE FREQUÊNCIA ........................................................................ 31
4.1.3 GRÁFICO DE FREQUÊNCIA ACUMULADA OU OGIVA ................................. 32
4.1.4 DIAGRAMA DE RAMO-E-FOLHAS ................................................................. 33
4.2 DISTRIBUIÇÕES SIMÉTRICAS .......................................................................... 36
4.3 DISTRIBUIÇÕES ENVIESADAS ......................................................................... 36
EXEMPLO PRÁTICO ................................................................................................ 39
SOLUÇÃO: ................................................................................................................... 40
EXEMPLO ANALÍTICO ............................................................................................... 41
SOLUÇÃO .................................................................................................................... 42
EXERCÍCIOS CONTINUAÇÃO .................................................................................... 43
CORRECÇÃO DO EXERCÍCIO..................................................................................... 45
BIBLIOGRAFIA............................................................................................................ 47
UNIDADE I – INTRODUÇÃO À ESTATÍSTICA

Prezados Estudantes: A disciplina de Estatística I será ministrada em 3 unidades.


Nesta 1.ª unidade, o estudante será capaz de:

 Identificar e aplicar os requisitos fundamentais para a representação gráfica de


dados;

 Transformar dados em informação útil que permita fazer comparações e testar


hipóteses;

 Elaborar e interpretar gráficos de sectores, diagramas de barras para a


representação de variáveis qualitativas;

 Elaborar e interpretar Histogramas, Polígonos de Frequência, Ogivas, Diagramas


de Ramo e Folhas para a representação de variáveis quantitativas;

Cada unidade corresponde a cerca de 5 semanas de estudo. No final de cada unidade de


estudo irá encontrar um teste de avaliação que deverá ser respondido e enviado para o
ISM pelas seguintes vias: correio, entregue presencialmente na sede ou nos centros de
recurso ou digitalizado e enviado para o email: testes@ismonitor.ac.mz. Os testes
devem ser enviados ao fim de cada 5 semanas de estudo por forma a garantir o
conhecimento atempado dos resultados obtidos no mesmo. Não entregue os 3 testes ao
mesmo tempo, pois assim não estará a par da sua progressão e dos seus erros e
melhorias que deve levar a cabo para ter sucesso.

Na página do ISM www.ismonitor.ac.mz encontra todos os contactos. Deve estar


sempre atento aos contactos da direcção do seu curso, da coordenação e do tutor de cada
uma das disciplinas que frequenta.
No final de cada unidade é providenciada uma lista de bibliografia e de referências na
internet que poderá consultar. A biblioteca virtual do ISM inclui livros digitalizados,
artigos, websites e outras referências importantes para esta e outras disciplinas, que
deverá utilizar na realização de casos práticos. A biblioteca virtual pode ser consultada
na página do ISM.
CAPÍTULO I – INTRODUÇÃO Á ESTATÍSTICA E APLICAÇÕES DA
ESTATÍSTICA

1.1 CONCEITOS BÁSICOS DE ESTATÍSTICA


A palavra “Estatística” já foi usada muitas e repetidas vezes na secção anterior. Você
deve estar a questionar-se mas então o que é “Estatística”?

Estatística pode ser definida como o ramo da Matemática aplicada que fornece um
conjunto de métodos científicos de colecta, organização, resumo, descrição, análise e
interpretação de dados visando estudar e medir os fenómenos colectivos, bem como
para a utilização dos mesmos na tomada de decisões.
Fenómeno colectivo aquele que se refere à população, ou universo, que compreende
um grande número de elementos, sejam pessoas ou outro elementos.

Fenómeno estatístico qualquer evento que se pode analisar aplicando técnicas


estatísticas.
População ou Universo é a totalidade dos elementos que apresentam pelo menos uma
característica em comum no objecto de estudo, isto é, o conjunto de todos os itens,
objectos, coisas ou pessoas a respeito das quais a informação é desejada para a
solução de um problema.

Amostra é um subconjunto ou parte das unidades estatísticas seleccionadas por um


método cuidadosamente concebido e projectado a partir de uma população.

As inferências sobre a população baseadas na amostra podem não ser absolutamente


certas. Portanto, o uso da Teoria de Probabilidade se torna indispensável para
apresentar as conclusões. Dada a sua importância, você vai estudar os conceitos básicos
da teoria de probabilidade numa das unidades desta disciplina.
Unidade estatística denota cada elemento que constitui a população observada. É
precisamente sobre este elemento que recai a observação estatística.

Numa perspectiva mais ampla, a Estatística pode ser dividida em termos de duas áreas
diferentes de estudos: (1) a Estatística Descritiva ou Dedutiva e (2) a Estatística
Indutiva ou Inferencial.

Estatística descritiva ou dedutiva é a parte da estatística que tem como objectivo a


observação de fenómenos de mesma natureza, colecta, organização, classificação, análise
e interpretação dos dados para além de cálculo de medidas (estatísticas), que permitem
resumidamente descrever o fenómeno estudado.

Estatística inferencial ou indutiva é a parte da estatística que trata das condições de


generalização das conclusões tiradas a partir da observação de uma parte das unidades
(amostra), para todo o conjunto das unidades a estudar (população).

1.2. APLICAÇÕES DA ESTATÍSTICA


A estatística tem basicamente duas finalidades: descrever os fenómenos e suas
características e fazer predições sobre as ocorrências futuras de certo fenómeno em
condições semelhantes àquelas em que ele ocorreu no passado.

Os métodos estatísticos são usados hoje em quase todos os campos de investigação


científica, já que eles nos capacitam a responder a um vasto número de questões, entre
outras as seguintes:

 Como os Cientistas avaliam a validade de novas teorias?

 Como os investigadores testam a eficiência de novas drogas?

 Como os Demógrafos prevêem o tamanho da população do mundo em qualquer


tempo futuro?

 Como pode um Economista verificar se a mudança actual no Índice de Preços ao


Consumidor (IPC) é a continuação de uma tendência secular, ou simplesmente
um desvio aleatório?

 Como é possível para alguém predizer o resultado de uma eleição entrevistando


apenas algumas centenas de eleitores.

1.3 CARACTERÍSTICAS DA INFORMAÇÃO ESTATÍSTICA


A informação estatística é um instrumento ao serviço do desenvolvimento de uma
realidade. É um meio, não um fim porque ela está ao serviço do utilizador de dados
estatísticos – governantes, gestores, homens de negócios, sociólogos, investigadores,
etc.

Pela natureza da informação estatística ela deve obedecer as seguintes características:


Qualidade, Actualidade e Utilidade.
1.4 . FASES DO MÉTODO ESTATÍSTICO
Para realizarmos uma pesquisa estatística, é preciso seguir algumas etapas para se obter
o melhor resultado possível. Tais etapas ou fases devem ser bem definidas antes da
pesquisa, pois qualquer falha em alguma dessas fases poderá trazer graves problemas
tais como a repetição da pesquisa ou invalidação da mesma.

Podemos dividir o método estatístico em seis fases, abaixo descritas:

i. Definição do problema: você deve saber exactamente aquilo que pretende


investigar. Para tal o problema e os objectivos da investigação devem ser
claramente definidos.

ii. Planeamento: logo no início de qualquer investigação você deve procurar


responder as seguintes perguntas, entre outras questões: Que dados deverão ser
obtidos? Que tipo de amostragem será usada? Que instrumento será usado para a
colecta de dados?Qual será o tamanho da amostra? Qual será o cronograma das
actividades? Quais serão os custos envolvidos?

iii. Colecta de dados: esta corresponde a fase operacional da pesquisa. É o registo


sistemático de dados, com um objectivo previamente determinado;

iv. Apuramento e limpeza dos dados: nesta fase você deve fazer uma análise
exploratória dos dados para identificar valores extremos, valores estranhos, e
erros na recolha e digitação dos dados. Para além disso, você deve resumir os
dados através de sua contagem e agrupamento, resultando em tabulação de
dados;

v. Apresentação dos dados: Há duas formas de apresentação, que não são


mutuamente exclusivas, nomeadamente apresentação tabular e apresentação
gráfica. A apresentação tabular é a apresentação numérica dos dados em linhas
e colunas distribuídas de modo ordenado. Enquanto a apresentação gráfica dos
dados numéricos constitui uma apresentação geométrica permitindo uma visão
rápida e clara do fenómeno;

vi. Análise e interpretação dos dados: Corresponde a última fase do trabalho


estatístico e é a mais importante e delicada. Está ligada essencialmente ao
cálculo de medidas e coeficientes, cuja finalidade principal é descrever o
fenómeno sem pretender tirar conclusões de carácter mais genérico (estatística
descritiva). Na estatística indutiva, os resultados obtidos da análise de uma
amostra da população servem de base para como o apoio da teoria da
probabilidade, se possa inferir, estimar ou induzir as leis de comportamento da
população da qual a amostra foi tirada.

1.5. ESTATÍSTICA NAS EMPRESAS


A direcção de uma empresa, de qualquer tipo, incluindo privadas e governamentais,
exige de seu administrador a importante tarefa de tomar decisões. Neste processo de
tomada de decisões, o conhecimento e o uso da Estatística facilitam ao administrador o
seu tríplice trabalho de organizar, dirigir e controlar a empresa.

Por meio de sondagem, de colecta de dados e de recolha de opiniões, podemos conhecer


a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis,
assim como as expectativas da comunidade sobre a empresa. Fazendo o uso das
ferramentas Estatísticas, também podemos estabelecer metas e objectivos com maior
possibilidade de serem alcançados no curto, médio ou longos prazos.
Decisões estatísticas são aquelas tomadas com base em informações amostrais. “O
executivo de negócios é por profissão, um tomador de decisão. A incerteza é sua
oponente
A tomada de decisões é o núcleo da responsabilidade administrativa. O administrador
deve constantemente decidir o que fazer, quem deve fazer, quando, onde e, muitas
vezes, como fazer.
O homem de hoje, em suas múltiplas actividades, deve fazer uso de processos e técnicas
estatísticos. Só estudando-os evitaremos o erro das generalizações apressadas a respeito
de tabelas e gráficos apresentados em jornais, revistas e televisão. Ishikawa (1994, p.31)
recomenda: “Habitue-se a discutir os problemas com base nos dados e respeite os
factos que eles revelam”.

CAPÍTULO II– ESTATÍSTICA DISCRITIVA


A colecta de dados estatísticos tem crescido muito nos últimos anos em todas as áreas
de pesquisa, especialmente com o aparecimento dos computadores e surgimento de
softwares cada vez mais sofisticados.
A área de Estatística Descritiva compreende às seguintes tarefas:

1) Encontrar um método apropriado de recolha de dados numéricos eficientemente para


um dado problema.

2) Determinar um formato eficiente, tal como uma apresentação tabular, para a


organização dos dados de uma forma sistemática e ordenada, de maneira que a
informação fornecida pelos dados possa ser observada com grande facilidade e precisão.

3) Apresentar dados numéricos, sejam organizados ou não, de forma que as características


e o comportamento dos dados sejam facilmente revelados. Tais apresentações são feitas
por meio de métodos gráficos.

4) Sumarizar ou descrever cada característica ou propriedade dos dados por um simples


número, tal como uma média, uma percentagem ou alguma outra medida apropriada, a
qual é calculada a partir dos dados por meio de uma fórmula derivada a partir de algum
princípio válido.

Se uma medida descritiva é calculada a partir dos dados da população, ela é chamada de
parâmetro populacional, ou simplesmente parâmetro; se é calculada a partir dos dados
da amostra ela é chamada de estatística amostral, ou simplesmente estatística.

2.1 ORGANIZAÇÃO DE DADOS ESTATÍSTICOS


Tipos de variáveis

Existem diversos tipos de variáveis que podem ser utilizadas em um estudo estatístico.
É importante compreender o conceito matemático de variável. Variável é uma
abstracção que se refere a um determinado aspecto do fenómeno.

Variável é a característica de interesse que é medida em cada elemento da amostra ou


população. Como o nome diz, seus valores variam de elemento para elemento. As
variáveis podem ter valores numéricos ou não numéricos. As variáveis são
normalmente representadas porsímbolos ou letras maiúsculas, tais como X , Y ou Z .

Variáveis quantitativas: são as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido. As variáveis
quantitativas podem ser contínuasou discretas.
Variáveis quantitativas contínuas: características mensuráveis que assumem valores
em uma escala contínua, para as quais valores decimais fazem sentido. Usualmente
devem ser medidas através de algum instrumento. Exemplos: peso, altura, tempo, e
pressão arterial.

Variáveis quantitativas discretas: Correspondem a características mensuráveis que


podem assumir apenas um número finito ou infinito contável de valores. Sendo assim,
somente fazem sentido valores inteiros. Geralmente são o resultado de contagens.
Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros
fumados por dia.

Variáveis qualitativas(ou categóricas): são as características que não possuem valores


quantitativos, mas, ao contrário, são definidas por variáveis categóricas, ou seja,
representam uma classificação dos indivíduos. Elas podem ser nominaisou ordinais.

Variáveis qualitativas nominais: são variáveis qualitativas para as quais não existe
ordenação dentre das categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante,
doente/sadio.

Variáveis qualitativas ordinais: são variáveis qualitativas para as quais existe uma
ordenação entre as categorias. Exemplos: Nível de escolaridade (1o, 2o, 3o graus),
estágio da doença (inicial, intermediário, terminal), mês de observação (Janeiro,
Fevereiro, Dezembro).

Uma variável originalmente quantitativa pode ser colectada de forma qualitativa. Por
exemplo, a variável idade, quando medida em anos completos, é quantitativa contínua.
Mas, se a variável idade for classificada em faixas etárias (tais como 0 a 5 anos, 6 a 10
anos, etc.), é qualitativa ordinal. Outro exemplo é o peso dos lutadores de boxe, uma
variável quantitativa (contínua) se trabalhamos com o valor obtido na balança, mas
qualitativa (ordinal) se a classificarmos em categorias do boxe (peso-pena, peso-leve,
peso-pesado, etc.).

2.2 COLECTA DE DADOS


Após a definição do problema a ser estudado e o estabelecimento do planeamento da
pesquisa (forma pela qual os dados serão colectados, cronograma das actividades,
custos envolvidos, exames das informações disponíveis, delineamento da amostra, etc.),
o passo seguinte é a colecta de dados, que consiste na busca ou aplicação dos dados das
variáveis, componentes do fenómeno a ser estudado. Os dados podem ser classificados
como:

 Dados primários: quando são publicados pela própria pessoa ou organização que os
tenha recolhido. Ex: tabelas do censo demográfico do Instituto Nacional de Estatística
(INE).

 Dados secundários: quando são publicados por pessoa ou organização que não os tenha
recolhido. Ex: quando determinado jornal publica estatísticas referentes ao censo
demográfico extraídas do INE.

A colecta de dados pode ser directa ou indirecta. A colecta de dados é directa quando
os dados são obtidos na fonte originária. Os valores assim compilados são chamados de
dados primários, como, por exemplo, dados obtidos em pesquisas de opinião pública,
vendas registadas em notas fiscais da empresa, contagem do número de carros que passa
por dia em um cruzamento, etc.

A colecta de dados é indirecta quando os dados obtidos provêm de colecta directa. Os


valores assim complicados são denominados de dados secundários, como, por exemplo,
o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas demográficas
publicadas pelo Instituto Nacional de Estatística – INE, utilização de dados publicados
pelo Instituto Nacional de Meteorologia, etc.

Quanto ao tempo, a colecta de dados pode ser classificado como:

 Contínua: quando se realiza permanentemente (registos de nascimento, óbitos,


casamentos, etc.);

 Periódica: quando é feita em intervalos de tempo (recenseamento demográfico, censo


industrial) e

 Ocasional: quando efectuado sem época preestabelecida. (registo de casos de certo tipo
de doença rara).

Objectivando a eliminação de erros capazes de provocar futuros enganos de


apresentação e análise, procede-se a uma revisão crítica dos dados, suprimindo os
valores estranhos ao levantamento.
CAPÍTULO III – DISTRIBUIÇÃO DE FREQUENCIAS

A análise estatística se inicia quando um conjunto de dados se torna disponível de


acordo com a definição do problema da pesquisa. Um conjunto de dados, seja de uma
população ou de uma amostra, contem muitas vezes um número muito grande de
valores. Além disso, esses valores, na sua forma bruta, encontram-se muito
desorganizados.
Os dados precisam então ser organizados e apresentados em uma forma sistemática e
sequencial por meio de tabelas ou gráficos.

3.1 COMPONENTES BÁSICAS DE UMA TABELA


Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:

 Título: Conjunto de informações, as mais completas possíveis, localizadas no topo da


tabela, normalmente respondendo às perguntas: O quê? Onde? Quando?

 Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.

 Coluna indicadora: Parte da tabela que especifica o conteúdo das linhas.

 Linhas: Rectas imaginárias que facilitam a leitura, no sentido horizontal, de dados que
se inscrevem nos seus cruzamentos com as colunas.

 Casa ou célula: Espaço destinado a um só número.

 Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também


as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos
dados.
Exemplo:
Moçambique – Estimativa de População
1970 93.139
1971 95.993
1972 98.690
1973 101.433
1974 104.243
1975 107.145
1976 110.124
Fonte: INE

3.2 DISTRIBUIÇÃO DE FREQUÊNCIA


Distribuição de frequências é uma tabela em que os dados são agrupados com as suas
respectivas frequências absolutas. Nesta secção, você ira estudar com algum detalhe as
distribuições de frequências porque estas representam o tipo de tabela mais importante
na área de Estatística Descritiva.
Dados Brutos: são os dados originais que ainda não se encontram numericamente
organizados.
Exemplo: os dados brutos a seguir apresentados correspondem as idades dos
funcionários da empresa Monitorilandia.
24 21 34
23 25 21
22 36 31
28 26 25
35 22 31
21 30 26
23 32 25
33 25 35
34 26 33
24 33 31
Rol estatístico ou simplesmente Rol é uma lista em que os valores ou dados numéricos
são dispostos em uma determinada ordem, crescente ou decrescente.
Usando os dados das idades dos funcionários da Monitorlandia, obteríamos o seguinte
rol estatísticos:
21 25 31
21 25 32
21 25 33
22 26 33
22 26 33
23 26 34
23 28 34
24 30 35
24 31 35
25 31 36

Amplitude total ou “range” ( A ) é obtida pela diferença entre o maior e o menor valor
observados. Com base no exemplo anterior, A  36  21  15 .

Número de classes ( K ): De modo a interpretar melhor o que esses números exprimem,


os intervalos (classes) devem ser, preferencialmente, igualmente espaçados. O número
de classes depende do número de observações ( n ) e do grau de dispersão dos dados.
Matematicamente, o número de classes é dado por:
 5 p a ra n  2 5

K  

 n p a ra n  2 5

Por exemplo, para n  49 , o numero de classes é definido como sendo K  49  7 .

Amplitude das classes ( h ): A especificação da largura do intervalo é uma


consideração importante. Intervalos muito grandes resultam em um número reduzido
de classes de intervalo, e vice-versa. A amplitude das classes é dada pela seguinte
relação
A m p litu d e A
h  
N u m e ro d e c la s s e s K

Assim como no caso do número de classes ( K ), a amplitude das classes ( h ) deve ser
K  6 ,4
aproximada por excesso para o maior número inteiro. Assim, se , você deve
K  7 h  1, 7 h  2
arredondar para ou, se , você deve arredondar para .
Limites das classes: Existem diversas maneiras de expressar os limites das classes. A
seguir são listadas algumas das maneiras para expressar os limites de classes:

a)
 2 0 , 2 3  : compreende todos os valores entre 20 e 23. Nesta denotação, o 20

representa o limite inferior da classe, enquanto o 23 denota o limite superior da classe;

b)
 2 0 , 2 3  : compreende todos os valores entre 20 e 23, excluindo o 23;

c)
 2 0 , 2 3  : compreende todos os valores entre 20 e 23; excluindo o 20.

Nesta unidade, usar-se-á a forma expressa no exemplo b.


Ponto médio da classe ( Xi ) é a média aritmética entre o limite superior e o limite

inferior de uma determinada classe. Assim, se a classe for 20 , 23  , o ponto médio desta
classe será dado como
20  23
X i
  21 , 5
2

f i ou f (.)
Frequência absoluta simples ( ) é o número de vezes que um determinado
elemento aparece na amostra, ou, o número de elementos pertencentes a uma
determinada classe.
Usando a informação das idades dos funcionários da Monitorlandia apresentado no
f ( 21 )  3
exemplo anterior, . Isto significa que existem 3 funcionários com 21 anos de
idade.
Usando os dados apresentados no exemplo, você deve verificar que de facto existem 3
funcionários com 21 anos de idade.
Fi
Frequência absoluta acumulada ( ) representa a soma das frequências absolutas
simples dos valores iguais ou inferiores a determinado valor.
fr
Frequência relativa ( ) denota a percentagem de um determinado valor na amostra.
A frequência relativa de um determinado valor é dada por
fi
fr   100%
n
n

n   f i  f 1  f 2  ...  f n
Onde: i 1

Frequência relativa acumulada ( F r ) é a soma das frequências relativas dos valores


iguais ou inferiores ao um determinado valor.

3.3 APRESENTAÇÃO DE TABELAS


3.3.1. Variáveis Qualitativas
A apresentação dos dados estatísticos na forma de tabelas consiste na reunião ou
agrupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de
modo ordenado, simples e de fácil percepção e com economia de espaço.
Suponha-se que se pretende estudar a marca de computadores portáteis preferida pelos
estudantes do ensino superior. Para alcançar este objectivo, foram entrevistados 35
estudantes. Com base nas entrevistas foram obtidos os seguintes dados:
COMPAQ COMPAQ IBM TOSHIBA
TOSHIBA COMPAQ IBM IBM
FUJITSU COMPAQ COMPAQ TOSHIBA
ACER FUJITSU TOSHIBA ACER
FUJITSU IBM COMPAQ ACER
HP ACER IBM FUJITSU
COMPAQ COMPAQ IBM FUJITSU
IBM TOSHIBA ACER COMPAQ
TOSHIBA IBM ACER

Para construir a tabela de frequências deve-se proceder à contagem do número de vezes


que cada uma das marcas é mencionada pelos estudantes. Você deve verificar que a
marca COMPAQ foi mencionada 9 vezes.
Portanto, este valor representa a frequência absoluta da marca para COMPAQ. Por
outro lado, a frequência relativa desta marca é dada por
9
 1 0 0  2 5, 7 %
35

A tabela de frequências para os dados apresentados acima é representada na tabela


abaixo. Esta tabela de frequência permite-nos saber a distribuição das preferências dos
35 elementos da amostra relativamente às marcas de computadores portáteis.
Frequência relativa
Frequência absoluta
Marca de PC (%)
fi fr

COMPAQ 9 25.7
HP 1 2.9
TOSHIBA 6 17.1
ACER 6 17.1
IBM 8 22.9
FUJITSU 5 14.3


Somatório 
 35 100

Esta tabela representa a distribuição das preferências dos estudantes entrevistados em


termos de marcas de computadores portáteis. A tabela mostra que com cerca de 26%
dos estudantes, COMPAQ é a marca de computador mais preferida, seguida da IBM
com 23%.

3.3.2. Variáveis Quantitativas


No caso de variáveis quantitativas discretas, desde que o espaço amostral não tenha
dimensões muito elevadas, o procedimento utilizado para construir tabelas de
frequências é idêntica ao que foi apresentado para as variáveis qualitativas.
Exemplo: Suponhamos o seguinte conjunto de dados:

14 13 11 15
16 13 15 13
11 12 15 14
14 13 13 12
12 14 12 16
12 14 17
14 14 13
Para representar a distribuição de frequências desses dados, você deve primeiro verificar
quais são os possíveis valores observados para a variável de interesse. Esses possíveis
valores da variável de interesse são colocados na primeira coluna da tabela de
frequências. Enquanto o número de repetições de cada um dos possíveis valores da
variável de interesse são colocados na segunda coluna da tabela de frequências.
Usando os dados do exemplo acima apresentado, a distribuição de frequências será
representada da seguinte tabela:
Valor fi fr Fi Fr

11 2 2/26 = 0,0769 2 2/26 = 0,0769


12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000

TOTAL 26 1,0000
Até agora, você estudou como são calculadas as frequências (relativas e acumuladas)
para variáveis quantitativas discretas. Mas quando tratamos de variáveis quantitativas
contínuas os valores observados devem ser tabulados em intervalos de classes.
Para a determinação dessas classes não existe uma regra pré estabelecida, sendo
necessário um pouco de tentativa e erro para a solução mais adequada. Suponhamos que
o volume de milho produzido, em uma determinada região seja dado pela tabela a
seguir:

Ano Milho (1000 t) Ano Milho (1000 t)


1 280 10 365
2 305 11 280
3 320 12 375
4 330 13 380
5 310 14 400

6 340 15 371
7 310 16 390
8 340 17 400
9 369 18 370

Você deve saber que alguns passos devem ser seguidos para a tabulação de frequências
de dados que se referem a uma variável quantitativa contínua, como é o caso de nosso
anterior exemplo.

1) Definir o número de classes. O número de classes não deve ser muito baixo nem muito
alto. Um número de classes pequeno gera amplitudes de classes grandes o que pode
causar distorções na visualização dos dados. Um número de classes grande gera
amplitude de classes muito reduzidas. Foram definidas regras práticas para a
determinação do número de classes, sendo que este deve variar entre 5 e 20 (5 para um
número muito reduzido de observações e 20 para um número muito elevado). Se n

representa o número de observações (na amostra), o número de classes, K , é calculado


K  n n  18
como sendo . No caso do exemplo anterior temos, sabemos que ,
K  18  4, 2
portanto . Podemos arredondar o número de classes para 5;
2) Calcular a amplitude das classes. Uma vez conhecidos o número de classes e a
amplitude total dos dados, a amplitude das classes por ser calculada. A amplitude total
dos dados é obtida com base na seguinte expressão
V a lo r m a x im o  V a lo r m in im o
A m p litu d e d a c la s s e =
N u m e ro d e c la s s e s

Em geral, a amplitude da classe é também arredondado para um número inteiro mais


adequado. Com base no nosso exemplo temos
400  280
h   24
5

3) Preparar a tabela de selecção com os limites de cada classe . Na tabela abaixo,


apresentamos para os dados do nosso exemplo os limites inferiores e superiores de cada
uma das 5 classes de frequência.

Classe Limite inferior Limite Superior

1 280 304

2 304 328

3 328 352

4 352 376

5 376 400

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite
inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma
observação seja exactamente igual ao valor do limite de classe deve-se estabelecer um
critério de inclusão. Para evitar esse tipo de dificuldade normalmente se estabelece que
o limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada
classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite
superior, com excepção da última classe.
4) Agrupar os dados por classe de frequência. A partir da listagem de dados se
determina para cada um deles a sua classe de frequência. Em seguida, se calcula as
frequências de cada uma das classes.

De acordo com o nosso exemplo, teremos:

Classes fi Fr
(%)
[280 – 304[ 2 0,11 (11 %)
[304 – 328[ 4 0,22 (22 %)
[328 – 352[ 3 0,17 (17 %)
[352 – 376[ 5 0,28 (28 %)
[376 – 400[ 4 0,22 (22%)
Total 18 1,00 (100 %)

Para você exercitar e solidificar os conhecimentos de acabou de adquirir, apresentamos


mais um exemplo. Suponhamos que se registou a duração, em horas, de uma amostra de
40 pilhas extraídas ao acaso de um lote de produção diário. Os seguintes valores foram
observados:

45,7 44,5 45,3 45,2 44,2


45,0 43,7 43,8 43,9 44,7
45,8 45,0 44,2 43,7 44,9
45,0 44,9 45,3 43,6 44,5
44,7 44,1 45,6 43,8 45,2
44,8 44,4 43,9 44,2 45,5
44,5 44,7 44,9 45,5 45,7
43,8 44,5 44,0 43,9 44,4
Nesta unidade, você acabou de aprender a rotina adequada para construir uma tabela de
frequências. Aplicando esta rotina, com base nos dados do nosso exemplo, você deve
obter a seguinte tabela de frequência:

Duração fi fr Fr
(%) (%)

 4 3, 5; 4 4  9 22,5 22,5

 4 4; 4 4 , 5  7 17,5 40,0

 4 4 , 5; 4 5  11 27,5 67,5

 4 5; 4 5, 5  7 17,5 85,0

 4 5, 5; 4 6  6 15,0 100,0

 40 100,0

Você também deve fazer os cálculos em falta (frequência absoluta, frequência absoluta
acumulada, etc.).

3.4 GRÁFICOS ESTATÍSTICOS


O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objectivo
é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e
viva do fenómeno em estudo.Apesar do grande impacto visual, a representação gráfica
de um fenómeno deve obedecer a certos requisitos fundamentais para ser realmente útil:

 Simplicidade: o gráfico não deve ter detalhes de importância secundária, assim como
de traços desnecessários que possam levar o observador a uma análise com erros.

 Clareza: o gráfico deve possibilitar uma correcta interpretação dos valores


representativos do fenómeno em estudo.

 Veracidade: o gráfico deve expressar a verdade sobre o fenómeno em estudo.


Você deve ser muito cuidadoso ao fazer e interpretar representações gráficas pois o uso
indevido de gráficos pode induzir a uma leitura falsa dos dados que estão sendo
analisados, chegando mesmo a confundir o leitor. Este problema de interpretação está,
muitas vezes, relacionado com a construção de escalas.

INSTITUTO SUPERIOR MONITOR


21
WWW.ISMONITOR.AC.MZ
3.5 RECOLHA DE DADOS
Principalmente devido ao uso de computadores, é muito comum nos dias de hoje
realizarem-se pesquisas que resultam na colecta de uma grande variedade de dados que
devem ser analisados. Muitas vezes, torna-se muito difícil entender os dados recolhidos
caso estes não estejam devidamente resumidos.

Com o objectivo de levantar dados, para exemplificar a maioria das técnicas


apresentadas nesta Unidade, fez-se um levantamento de dados através de um
questionário aos alunos do 2º ano do curso de Estatística da Universidade Eduardo
Mondlane (UEM) matriculados na disciplina de Estatística. As seguintes variáveis
socioeconómicas foram recolhidas para cada um dos estudantes entrevistados:

Tabela 1. Descrição das variáveis

Variável Descrição

Sexo Sexo do estudante com as seguintes categorias: (1)


masculino e (2) feminino

Idade Idade do estudante em anos

Altura Altura do estudante em metros e centímetros

Peso Peso do estudante em quilogramas

Estado civil Estado civil do estudante com as seguintes


categorias: (1) solteiro, (2) casado e (3) divorciado

Irmão Número de irmãos

Transporte Tipo de transporte usado pelo estudante com


categorias: (1) próprio e (2) público

Trabalho Relação do trabalho do estudante com o curso de


Estatística com os seguintes categorias: (1)
desempregado, (2) completamente relacionado, (3)
parcialmente relacionado, e (4) não relacionado

INSTITUTO SUPERIOR MONITOR


22
WWW.ISMONITOR.AC.MZ
Informação Meio de informação mais usado com categorias:
(1) TV, (2) jornal, (3) rádio, (4) revista, e (5)
internet

Disciplina Número de disciplinas reprovadas no 1º ano da


UEM

3.6 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS


Dois tipos de gráficos podem ser usados para representar as variáveis do tipo
qualitativas, nomeadamente os de sectores e os de barras.

3.6.1. GRÁFICO DE SECTORES


Os gráficos de sectores, mais conhecidos como gráficos de pizza ou torta, são
construídos dividindo-se um círculo (pizza) em sectores (fatias). Cada sector representa
uma categoria e o seu tamanho é proporcional à frequência relativa da categoria
representada por este mesmo sector.

Esta variável mostra a distribuição de número de estudantes por sexo.

Tabela 2. Distribuição de frequência da variável sexo

Sexo fi fr  % 

Feminino 12 55

Masculino 10 45

Total 22 100

Nas tabelas de frequência, como o próprio nome diz, apresentam as frequências com
que ocorrem cada uma das categorias da variável de interesse comparativamente ao
total.

Para construir gráficos de sectores, devemos primeiro calcular a proporção de cada


categoria no círculo. Para o exemplo da variável sexo, usando a frequência relativa, a
contribuição proporcional dos estudantes do sexo feminino é dada por:

INSTITUTO SUPERIOR MONITOR


23
WWW.ISMONITOR.AC.MZ
     
0
100% 360

55%       x

Você deve provavelmente saber que um círculo corresponde a 360 graus o que é
equivalente a frequência relativa total (100%). Com base na frequência absoluta, a
contribuição dos estudantes do sexo feminino é dada por:


0
22 360

12  x

O valor de x é obtido através do uso da regra de três simples, ou seja,

55%  360 12  360


0 0

x   196 x   196
0 0
ou
100% 22

Com ajuda do transferidor e compasso, desenhamos um círculo e medimos 1960 que


correspondem a fatia do número de estudantes do sexo feminino.

Para calcular a contribuição relativa dos estudantes do sexo masculino procedemos da


mesma maneira fazendo:

 
0 0
100% 360 22 360

ou

45%  x 10  x

Calculamos o x e obtemos a fatia correspondente ao número de estudantes do sexo


masculino. Antes de proceder com a leitura, você deve calcular a porção do círculo
correspondente aos estudantes do sexo masculino. Depois de calculados as fatias
correspondentes a cada uma das categorias, o gráfico de sectores pode ser ilustrado
como

INSTITUTO SUPERIOR MONITOR


24
WWW.ISMONITOR.AC.MZ
Masculino
10 Feminino
45% 12
55%

Figura 1. Gráfico de sectores para variável sexo

Através da Figura 1, fica mais fácil perceber que o número de estudantes do sexo
feminino é maior que o número de estudantes do sexo masculino. Como esta figura
contém toda a informação apresentada na Tabela , esta figura pode substituir esta tabela
com a vantagem de tornar a análise dessa variável mais atraente.

Para além de variáveis qualitativas, os gráficos de sectores também podem ser usados
para ilustrar graficamente variáveis quantitativas desde que estas estejam organizadas
em classes (categorizadas).

Tabela 3. Distribuição de frequência da variável idade

Faixa etária (anos) fi fr  % 

1 8  2 2  11 50,0

 2 2  2 6 6 27,3

 2 6  3 0 2 9,1

30  34 1 4,5

 3 4  3 8 2 9,1

Total 22 100,0

Antes de proceder com a leitura dos apontamentos, você deve construir o gráfico de
sectores da variável idade.

Quando a variável em estudo tem mais de seis categorias, o gráfico de sectores não
é adequado para representar tal variável porque iríamos violar o pressuposto de

INSTITUTO SUPERIOR MONITOR


25
WWW.ISMONITOR.AC.MZ
que um gráfico deve ser o mais claro possível. Um exemplo de aplicação inadequada
dum gráfico de sectores é apresentado a seguir:

Figura 2. Percentagens dos candidatos na 1.ª volta das eleições presidências francesas
de 2007

Na prática, existem muitos programas de computadores (como o Excel, SPSS, etc.) que
fazem não só os gráficos como também calculam outras estatísticas que você vai
apreender nesta disciplina, assim como as que não vai aprender nesta disciplina.

Mas então, como é criado um gráfico circular em Excel?

1. Abra o Excel e digite os dados que pretende representar num gráfico circular,
como a seguir se ilustra:

A B

1 Menu

2 Sanduíches 40

3 Saladas 21

4 Sopa 15

INSTITUTO SUPERIOR MONITOR


26
WWW.ISMONITOR.AC.MZ
5 Bebidas 9

6 Sobremesas 15

2. Seleccione os dados que pretende representar no gráfico circular. Para o nosso


exemplo, seleccione a região entre A2 e B6.

3. No separador Inserir (Insert), no grupo Gráficos, clique em Circular (pie).

4. Aparecerá um gráfico circular cuja formatação poderá ser alterada dependendo


do utilizador.

As vantagens da representação gráfica das distribuições de frequências ficam ainda mais


evidentes quando há a necessidade de comparar vários grupos com relação às variáveis
que possuem muitas categorias, como veremos mais adiante.

3.6.2. DIAGRAMA DE BARRAS


Uma alternativa ao gráfico de sectores é o gráfico de barras como o da Figura 3.

Ao invés de dividirmos um círculo, dividimos uma barra. Note que, em ambos os


gráficos, as frequências relativas das categorias devem somar 100%.

INSTITUTO SUPERIOR MONITOR


27
WWW.ISMONITOR.AC.MZ
100%

90%

80%
Masculino, 45%

70%
Frequência relativa
60%

50%

40%

30%
Feminino, 55%

20%

10%

0%
Sexo

Figura 3.Frequência relativa para a variavel sexo

Uma situação diferente ocorre quando desejamos comparar a distribuição de frequências


de uma mesma variável em vários grupos, como por exemplo, a frequência de
estudantes do sexo feminino em quatro regiões do país.

Se quisermos usar o gráfico de sectores para fazer essa comparação, devemos fazer
quatro gráficos, um para cada região com duas fatias cada um. Uma alternativa é a
construção de um gráfico de barras (horizontal ou vertical) como ilustrado na Figura 4,
com uma barra para cada região. Assim, podemos representar a frequência de estudantes
do sexo feminino de cada região.

60%

50%

40%
Frequência relativa

30%

48%

20%

31%

10% 21%

0%
Norte Centro Sul

Figura 4. Frequência relativa dos estudantes do sexo feminino por região

INSTITUTO SUPERIOR MONITOR


28
WWW.ISMONITOR.AC.MZ
A ordem dos grupos pode ser qualquer, ou aquela mais adequada para a presente
análise. Frequentemente, encontramos as barras em ordem decrescente, já antecipando
nossa intuição de ordenar os grupos de acordo com a sua frequência para facilitar as
comparações. Caso a variável fosse do tipo ordinal, a ordem das barras seria a ordem
natural das categorias, como na tabela de frequências.

A Figura 5 mostra um gráfico de barras que pode ser usado para comparar a distribuição
de frequências relativas de uma mesma variável em vários grupos. Este gráfico também
representa uma alternativa ao uso de vários gráficos de sectores, sendo, na verdade, a
junção de três gráficos, num só gráfico.

Negros Brancos

Total 59% 41%

Nao pobres 22% 78%

Pobres 81% 19%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Figura 5. Distribuição de frequência relativa da variável raça em varios grupos (pobres


e nao pobres)

Observação: Este tipo de gráfico só deve ser usado quando não houver muitos grupos a
serem comparados e a variável em estudo não tiver muitas categorias (de preferência, só
duas como ilustrado na Figura acima).

Através desse gráfico, podemos observar que a população moçambicana total, em 1960,
dividia-se quase que igualmente entre brancos e negros, com uma pequena
predominância de brancos. Porém, quando nos restringimos às classes menos
favorecidas economicamente, essa situação se inverte, com uma considerável
predominância de negros, principalmente na classe da população considerada indigente,

INSTITUTO SUPERIOR MONITOR


29
WWW.ISMONITOR.AC.MZ
indicando que a classe socioeconómica influencia a distribuição de negros e brancos na
população moçambicana de 1960.1

CAPÍTULO IV – REPRESENTAÇÃO GRÁFICA DE DADOS

4.1 GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS

4.1.1 HISTOGRAMA
É um gráfico de colunas justapostas que representa uma distribuição de frequência para
dados contínuos ou uma variável discreta quando esta apresentar muitos valores
distintos.

No eixo horizontal são dispostos os limites das classes segundo as quais os dados foram
agrupados enquanto o eixo vertical corresponde às frequências absolutas ou relativas
das mesmas.

Quando os dados são distribuídos em classes de mesma amplitude, Figura 7 (a), todas as
colunas apresentam bases iguais com alturas variando em função das suas frequências
absolutas ou relativas. Neste caso, a área de cada rectângulo depende apenas da sua
altura enquanto no caso de dados agrupados em classes de dimensões diferentes, como
mostra a Figura 7 (b), a área de cada coluna já não é mais proporcional à sua altura.

1 Esta afirmação pode ser confirmada efectuando-se um teste de hipótese apropriado que você ira
aprender na última unidade desta disciplina.

INSTITUTO SUPERIOR MONITOR


30
WWW.ISMONITOR.AC.MZ
Figura 7.Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da
UEM

4.1.2. POLÍGONO DE FREQUÊNCIA


É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de
abcissas correspondentes aos pontos médios de cada classe e as ordenadas, às
frequências absolutas ou relativas dessas mesmas classes.

O polígono de frequência é um gráfico que deve ser fechado no eixo das abcissas
(Figura 8). Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma
classe à esquerda e outra à direita, ambas com frequências zero. Tal procedimento
permite que a área sob a linha de frequências seja igual à área do histograma.

INSTITUTO SUPERIOR MONITOR


31
WWW.ISMONITOR.AC.MZ
Uma das vantagens da aplicação de polígonos de frequências é que, por serem gráficos
de linhas, permitem a comparação entre dois ou mais conjuntos de dados por meio da
superposição dos mesmos.

Figura 8. Polígono de frequência com base na idade dos alunos da disciplina Inferência
Estatística do curso de Estatística da UEM

4.1.3 GRÁFICO DE FREQUÊNCIA ACUMULADA OU OGIVA


Histograma de frequência acumulada (ou ogiva) é a representação gráfica do
comportamento da frequência acumulada. Permite descrever dados quantitativos por
meio da frequência acumulada. A ogiva é um gráfico de linha que une os pontos cujas
abcissas são os limites superiores das classes, e, ordenadas suas respectivas frequências
acumuladas.

Da Figura 9, você pode notar que não existem alunos com idade inferior a 18 anos
enquanto existem vinte alunos com idade inferior a 34.

INSTITUTO SUPERIOR MONITOR


32
WWW.ISMONITOR.AC.MZ
Figura 9. Frequência acumulada da idade dos alunos da disciplina Inferência Estatística
do curso de Estatística da UEM.

4.1.4 DIAGRAMA DE RAMO-E-FOLHAS


O diagrama Ramo-e-Folhas, criado por John Tukey, é um procedimento utilizado para
armazenar os dados sem perda de informação. É utilizado para se ter uma ideia visual da
xi
distribuição dos dados. Cada valor observado, , da variável X , deve ter no mínimo
dois dígitos e a variável pode ser tanto quantitativa discreta como contínua.

Para construir o diagrama de Ramo-e-Folhas, cada número deve ser dividido em duas
partes. A primeira parte é denominada por ramo enquanto a segunda é denominada por
folha. O ramo consistirá de um ou mais dígitos iniciais se o valor da variável for um
número inteiro e do número inteiro, se o valor da variável for um número com decimais.
Nas folhas, colocam-se os dígitos restantes se o valor observado for número inteiro ou
caso contrário, as decimais.

A Tabela 4 apresenta o Ramo-e-Folhas correspondente a variável idade do aluno. Você


deve notar que o primeiro ramo (o ramo correspondente ao digito 1) mostra que existem
2 alunos com 18 anos de idade e 1 aluno com 19 anos de idade. Por outro lado, o ultimo
ramo (o ramo correspondente ao digito 3) mostra que existem 3 alunos com idade igual
ou superior a 30 anos: o primeiro aluno tem 30 anos, o segundo tem 35 anos enquanto o
terceiro tem 37 anos de idade.

Tabela 4. Ramo e folha sem divisão de ramos

Ramo Folha Frequência

INSTITUTO SUPERIOR MONITOR


33
WWW.ISMONITOR.AC.MZ
1 889 3

2 0 0 0 0 0 0 1 1 2 3 4 5 55 6 9 16

3 057 3

O estudante deve ter notado que o ramo correspondente ao dígito 2 tem muitas folhas.
Neste caso, a opção é dividir este ramo em dois: as folhas de 0 a 4 pertencerão a uma
linha e as folhas de 5 a 9 pertencerão à outra linha. Neste caso, a segunda linha do ramo
deve ser discriminada por um sinal de asterisco no seu expoente, como apresentado:

Tabela 5. Ramo e folha com divisão de ramos

Ramo Folha Frequência

1 889 3

2 00000011234 11

2* 5 55 6 9 5

3 05 7 3

Depois de ter aprendido diferentes maneiras de apresentar os dados graficamente, você


deve pegar numa caneta e folha de papel para aprofundar os seus conhecimentos.

Actividade: construa um gráfico adequado para os dados abaixo apresentados


referentes às idades de ursos em meses.

8 19 57 81

9 20 57 82

11 44 57 83

17 45 58 100

17 53 70 104

Para visualizar a distribuição dos valores de idade, usaremos um diagrama de ramo-e-


folhas, já que um histograma resumiria mais ainda algo que já está resumido. Podemos

INSTITUTO SUPERIOR MONITOR


34
WWW.ISMONITOR.AC.MZ
organizar os dados, separando-os pelas dezenas, uma em cada linha, como apresentado
na Figura 10 abaixo.

Ramo Folha

0 8 9

1 1 7 7 9

2 0

4 4 5

5 3 7 7 7 8

7 0

8 1 2 3 Legenda

9 5 3 = 53 meses

10 0 4 10 4 = 104 meses

Figura 10. Distribuição da idade dos ursos

ASPECTOS GERAIS

Alguns histogramas apresentam formas que, pela frequência com que surgem, merecem
referência especial. Assim, as distribuições mais comuns apresentadas pelos dados são:

 Distribuições simétricas

 Distribuições enviesadas

INSTITUTO SUPERIOR MONITOR


35
WWW.ISMONITOR.AC.MZ
4.2 DISTRIBUIÇÕES SIMÉTRICAS
Diz se que os dados tem uma distribuição simétrica quando o gráfico (histograma) dos
dados frequências têm uma forma aproximadamente simétrica, relativamente a uma
classe média.

Um caso especial de uma distribuição simétrica é aquele que sugere a forma de um


"sino" e que é apresentado por amostras provenientes de Populações "Normais".

Figura 11. Distribuições simétricas

4.3 DISTRIBUIÇÕES ENVIESADAS


A distribuição das frequências tem uma forma acentuadamente assimétrica,
apresentando valores substancialmente mais pequenos num dos lados relativamente ao
outro como mostrado na figura:

Figura 12.Distribuições enviesadas

EXERCÍCIOS

1. Diga, em poucas palavras o que entende por Estatística.

INSTITUTO SUPERIOR MONITOR


36
WWW.ISMONITOR.AC.MZ
2. Qual é o principal objectivo da Estatística?

3. Classifique as variáveis:

a) Cor dos olhos das alunas;

b) Índice de liquidez nas indústrias;

c) Produção de café (em sacos) em Moçambique;

d) Número de defeitos em aparelhos de TV;

e) Comprimento dos pregos produzidos por uma empresa;

f) Ponto obtido em cada jogada de um dado.

4. Pretendia-se fazer um estudo sobre o número de irmãos dos alunos do 10º ano de
escolaridade de uma Escola Secundária. Para isso, efectuou-se um inquérito ao qual
responderam 60 alunos. Indique:

a) A população em estudo;

b) A amostra escolhida;

c) A variável em estudo e classifique-a.

5. Consideremos os seguintes dados que representam as alturas de 50 indivíduos em


cm.

162 188 173 168 179 183 167 186 177 187
174 164 174 159 177 173 163 180 196 171
184 179 190 181 166 181 182 176 169 172
162 175 192 178 177 200 191 188 168 165
193 175 160 180 187 176 170 156 174 179

a) Construa a tabela de distribuição de frequências;

INSTITUTO SUPERIOR MONITOR


37
WWW.ISMONITOR.AC.MZ
b) Calcule os pontos médios das classes.

Correcção do Trabalho
1. Ciência que trata do delineamento, colheita, organização, sumarização, apresentação
e análise de dados, bem como, na obtenção de conclusões válidas e tomada de decisões
em diversos campos, a saber, engenharias, campo da saúde, biologia, farmácia, biofísica
etc.
2. O objectivo fundamental deste ramo do conhecimento consiste na recolha,
compilação, análise e interpretação de dados, havendo a necessidade de se distinguir
entre estatística descritiva e inferência estatística.
No âmbito da estatística descritiva procura-se sintetizar e representar de forma
compreensível a informação contida num conjunto de dados. Esta tarefa concretiza-se
na construção de tabelas e gráficos e no cálculo de valores que representem a
informação contida nos dados.
O objectivo da inferência estatística consiste, em última análise, em fazer previsões a
partir da parte para o todo, ou seja, com base na análise de um conjunto limitado de
alguns dados (amostra) recolhidos junto de um conjunto total de indivíduos
(população), pretendemos caracterizar a população.

3.

a. Cor dos olhos das alunas... Qualitativa nominal

b. Índice de liquidez nas indústrias... Quantitativa contínua

c. Produção de café em Moçambique (em sacos)... Contínua

d. Número de defeitos em aparelhos de TV... Discreta

e. Comprimento dos pregos produzidos por uma empresa... Contínua

f. Ponto obtido em cada jogada de um dado... Discreta


4.

a) População em estudo: todos alunos do 10º ano de escolaridade de uma Escola


Secundária.

b) A amostra: Os 60 alunos que responderam ao questionário.

INSTITUTO SUPERIOR MONITOR


38
WWW.ISMONITOR.AC.MZ
c) A variável em estudo: o número de irmãos dos alunos do 10º ano de
escolaridade de uma Escola Secundária. A variável é quantitativa discreta.

5. Usando as regras para a construção de tabelas, temos:

Do Rol obtido: Xmax =200 e Xmin =156

Amplitude total: At = 200-156 = 44, k  50  7

Classes fa Fa fr Fr
(%) (%)

[156.0 – 162.3[ 5 5 10 10

[162.3 – 168.6[ 7 12 14 24

[168.6 – 174.9[ 9 21 18 42

[174.9 – 181.2[ 15 36 30 72

[181.2 – 187.5[ 6 42 12 84

[187.5 – 193.8[ 6 48 12 98

[193.8 – 200.1[ 2 50 4 100

Total 50 — 100 —

EXEMPLO PRÁTICO
Os dados seguintes apresentados referem-se ao consumo de energia eléctrica em kWh
de uma amostra de 60 residências na Cidade de Maputo.

80 51 70 65 60 160 150

140 135 85 51 60 60 120

160 110 160 120 155 70 51

51 100 120 100 120 98 90

65 140 60 130 100 90 115

70 95 60 130 160 130 90

INSTITUTO SUPERIOR MONITOR


39
WWW.ISMONITOR.AC.MZ
76 90 68 90 51 80 150

160 85 70 88 51 75 51

160 150 140 98

Com base nos dados apresentados acima, responda as seguintes perguntas para
fortalecer os conhecimentos que você adquiriu nesta disciplina:

a) Elabore uma Distribuição de Frequência (use k=7 e h=16);

b) Elabore o polígono de frequência;

c) Uma residência para ter boa iluminação deve consumir mais de 99 kWh.
Quantas residências têm má iluminação, observando a tabela?

Você deve responder as questões apresentadas antes de consultar a solução que é


apresentada a seguir a este parágrafo.

SOLUÇÃO:
a) A tabela de frequência é apresentada a seguir.

Tabela 6. Distribuiçãoo de frequência de consumo de energia

Classes fi Fa xi

51  67 14 14 59

 6 7  8 3 9 23 75

8 3  9 9 11 34 91

 9 9  1 1 5 4 38 107

1 1 5  1 3 1 8 46 123

1 3 1  1 4 7  4 50 139

1 4 7  1 6 3  10 60 155

INSTITUTO SUPERIOR MONITOR


40
WWW.ISMONITOR.AC.MZ
Total  f i  60 - -

b) Em seguida, apresentamos a histograma e polígono de frequência.

16

14 P o líg o n o d e fr e q u ê n c ia

12 H is to g r a m a
F r e q u ê n c ia

51 67 83 99 11 5 131 147 1 6 3 C o n su m o (k W h )

Figura 13. Polígono de frequência e histograma do consumo de energia

c) Com você pode observar da tabela de frequência (Tabela 8), existem 34 residências
com má iluminação, ou seja, com consumo de energia inferior a 99 Kwh.

EXEMPLO ANALÍTICO
O seguinte histograma foi construído com base numa pesquisa do tempo de serviço dos
empregados de uma determinada empresa:

R e la ç ã o d o n ú m e r o d e e m p r e g a d o s p o r te m p o d e S e r v iç o

8
N ú m e ro d e E m pr e g a d o s

0
0 6 12 18 24 30

T e m p o d e s e r v iç o s ( a n o s )

Figura 14. Distribuição do tempo de serviço

Determine:

INSTITUTO SUPERIOR MONITOR


41
WWW.ISMONITOR.AC.MZ
a) O número de classes.

b) A frequência total.

c) O limite inferior da primeira classe.

d) O limite superior da primeira classe.

e) A amplitude de variação (h) da primeira classe.

f) A frequência da primeira classe.

g) A frequência relativa da primeira classe.

h) O ponto médio da primeira classe.

i) O limite inferior da quarta classe.

j) O limite superior da quarta classe.

k) A amplitude de variação (h) da quarta classe.

l) O ponto médio da quarta classe.

m) A frequência da quarta classe.

n) A frequência relativa da quarta classe.

SOLUÇÃO
a) Podemos ver do gráfico acima que existem 5 classes que são: [0;6[, [6;12[, [12;18[,
[18;24[ e [24;30[

b) A frequência total é de 25. Note que a frequência da primeira classe é de 3, a da segunda


é 6, da terceira 7, da quarta 4 e da quinta 5. Para obter a frequência total basta somar as
frequências de todas as classes (Observe atentamente ao gráfico).

c) O limite inferior da primeira classe é de 0 (zero).

d) O limite superior da primeira classe é de 6.

e) A amplitude de variação (h) da primeira classe é de 6 = 6 - 0. A amplitude de variação é


dada pela diferença entre os limites superior e inferior da classe.

INSTITUTO SUPERIOR MONITOR


42
WWW.ISMONITOR.AC.MZ
12%  3 / 25   100%
f) A frequência relativa da primeira classe é de . A frequência
absoluta da primeira classe é de 3 enquanto 25 representa a frequência total.

60
 3
g) O ponto médio da primeira classe é dado por 2 .

h) O limite inferior da quarta classe é 18.

i) O limite superior da quarta classe é 24.

j) A amplitude de variação (h) da quarta classe é 6.

k) O ponto médio da quarta classe é 21.

l) A frequência da quarta classe é de 4.

m) A frequência relativa da quarta classe é de 16%.

EXERCÍCIOS CONTINUAÇÃO
1. Foi feito um estudo a 100 empresas moçambicanas, com o propósito de saber quais
delas podem participar no mercado livre da SADC. As mesmas foram classificadas a
nível da SADC em empresas da classe baixa (B), média (M) ou Alta (A) segundo a
quantidade e qualidade de produtos ou serviços que oferecem ao mercado. Sendo que
uma empresa participa se for da classe alta e foram obtidos os seguintes dados
tabelados:

Classe da empresa fi fr

Baixa (B) 80 0.8

Média (M) 18 0.18

Alta (A) 2 0.02

a) Construa o gráfico que melhor representa os dados e justifique a escolha do


mesmo.

INSTITUTO SUPERIOR MONITOR


43
WWW.ISMONITOR.AC.MZ
2. Utilizando a tabela de frequências abaixo, construa o diagrama de barras e o
polígono de frequências (utilize as frequências relativas).

Xi Freq. abs. Freq. rel.

12 4 0.20

13 8 0.40

14 4 0.20

15 3 0.15

16 1 0.05

Total 20 1.00

3. Utilizando a tabela de frequências abaixo, construa um histograma de frequências


absolutas e comente sobre a forma de distribuição dos dados.

I X fi X i

1  0  5 10 2,5

2 5  1 0 15 7,5

3 1 0  1 5  25 12,5

4 1 5  2 0  12 17,5

5  2 0  2 5 8 22,5

6  25  30 5 27,5

INSTITUTO SUPERIOR MONITOR


44
WWW.ISMONITOR.AC.MZ
CORRECÇÃO DO EXERCÍCIO
1. Para representar graficamente uma variável qualitativa com menos de 6 categorias
recomenda-se o uso de um gráfico circular. Os ângulos correspondentes às frequências
dadas na tabela são calculados da seguinte forma:

fi  360
0

xi 
n

Portanto, obteremos:

80  360 18  360 2  360


x1   288 x2   64, 8 x3   7, 2
0 0 0

100 ; 100 ; 100

Donde se obtém o seguinte gráfico circular:

Alta (A)
2%

Média (M)
18%

Baixa (B)
80%

2. Com base nos dados da tabela, obteremos os gráficos abaixo apresentados. A linha
tracejada, que une os extremos das barras, representa o polígono de frequência.

INSTITUTO SUPERIOR MONITOR


45
WWW.ISMONITOR.AC.MZ
0.5

0.4
Frequencia relativa

0.3

0.2

0.1

0
12 13 14 15 16

Diagrama de barras Poligono de frequencia

3. O histograma apresentado a seguir, mostra que existe uma concentração de valores


em torno dos valores centrais. Portanto, a forma de distribuição dos dados é simétrica.

INSTITUTO SUPERIOR MONITOR


46
WWW.ISMONITOR.AC.MZ
BIBLIOGRAFIA
 REIS, Elizabeth. Estatística Descritiva. Silabo, Lisboa, 1994.

 KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. Editora


McGraw-hillLtd, 1982.

 STEVENSON, William J. Estatística aplicada à Administração. Habra, São Paulo,


Brasil.

 MULENGA, Alberto. Introdução à Estatística. Maputo, 2004.

Outros sítios na internet:

http://www.rh.com.br

http://www.eventosrh.com.br

http://www.sebraepr.com.br/

INSTITUTO SUPERIOR MONITOR


47
WWW.ISMONITOR.AC.MZ

Você também pode gostar