Você está na página 1de 44

Estatística Descritiva

Curso: Eletricidade Indústrial


Módulo: Resolver problemas de estatística
Código do Módulo: UC HG034002171
Nivel IV
Nivel:
Formador: Ego, dr Esmail Henriques

Nome de formando/a: ____________________________


Número:___
Turma:_____

Beira , setembro de 2022

P á g i n a 1 | 44
Compilado Por: Esmail Henriques
Índice

1. Habilidades de estudo 3
1.2. Precisa de apoio? 3
1.3. Avaliação 3
2. Introdução à estatística 4
2.2. Fases do método estatístico: 4
2.3. Um pouco de historia da estatística 5
2.4. Importância da estatística 6
3. Conceitos básicos da estatística 8
3.1. Conceitos de população e amostra 9
3.1.1.tipos de amostragem 9
3.2.tipos de variáveis 11
4. Distribuição de frequências e gráficos 15
4.1. Tabela de frequências 15
4.2. Distribuição de frequências 15
5. Gráficos de distribuição de frequências 21
6. Medidas de tendência central 25
7. Anexos 40
7.1. Auto avaliação 40

P á g i n a 2 | 44
Compilado Por: Esmail Henriques
1. HABILIDADES DE ESTUDO
Caro estudante \ formandos!
Para frequentar com sucesso este módulo terá que buscar através de uma leitura cuidadosa das
fontes de consulta a maior parte da informação ligada ao assunto abordado. Para o efeito, no fim
de cada unidade \ resultados de aprendizagem apresenta-se uma sugestão \ dúvidas de livros para
leitura complementar.
 Antes de resolver qualquer tarefa ou problema, o estudante \ formandos deve certificar se
de ter compreendido a questão colocada;
 É importante questionar se as informações colhidas na literatura são relevantes para a
abordagem do assunto ou resolução de problemas;
 Sempre que possível, deve fazer uma sistematização das ideias apresentada no texto.
Desejamos - lhe muitos sucessos!

1.2. PRECISA DE APOIO?


Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso de dúvida numa matéria
tente consultar os manuais e Docentes \ formadores disponíveis na instituição onde se encontra.
Se tiver dúvidas na resolução de algum exercício, procure estudar os exemplos semelhantes
apresentados no manual. Se a dúvida persistir, consulte seus colegas que entendera a matéria. Se
a dúvida persistir, veja a resolução do exercício.
Sempre que julgar pertinente, pode consultar o tutor que está à sua disposição na tua instituição.
Não se esqueça de consultar também colegas da escola que tenham compreendido ou feito a
cadeira de Estatística, vizinhos e até estudantes de universidades que vivam na sua zona e tenham
ou estejam a fazer cadeiras relacionadas com Estatística.

1.3. AVALIAÇÃO
O Módulo de Estatística terá 4 avaliações que deverá ser feito na instituição onde se encontra.
A avaliação visa não só informar-nos sobre o seu desempenho nas lições, mas também estimular-
lhe a rever alguns aspectos e a seguir em frente.
Durante o estudo deste módulo o estudante será avaliado com base na realização de avaliação,
caso se não alcança terá que reavaliação ou autoavaliação previstas em cada resultado de
aprendizagem ou unidade.

P á g i n a 3 | 44
Compilado Por: Esmail Henriques
2. INTRODUÇÃO À ESTATÍSTICA

2.1. OBJECTO DA ESTATÍSTICA


De uma forma sintética, pode-se dizer que a Estatística é um conjunto de técnicas apropriadas
para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. E tem por
objectivo a análise e avaliação numérica de observações.
Os computadores e calculadoras são meios excelentes para trabalhar com Estatística.
Assim, a Estatística é mais um método do que uma teoria, pois o seu objectivo fundamental é
descrever fenómenos e não tanto explicá-los. O método estatístico na medida em que utiliza a
linguagem de números, é um método quantitativo.
Num estudo estatístico, normalmente segue-se um conjunto de passos que designamos por fases
do método estatístico para facilitar o estudo estatístico.

2.2. FASES DO MÉTODO ESTATÍSTICO:


a) Definição do problema - a primeira fase consiste na definição e formulação do problema
a ser estudado. O investigador deve ainda analisar outros estudos feitos sobre o mesmo
tema.
b) Planificação - definido o problema, é preciso determinar um processo para o resolver e
em especial, como obter informações sobre a variável em estudo. É nesta fase que se
decide pela observação de toda população ou de uma amostra e a calendarização das
actividades a realizar.
c) Recolha de dados - os dados podem ser recolhidos através de:
 Questionário;
 Entrevista;
 Observação;
 Experimentação;
 Pesquisa bibliográfica, etc.
d) Organização ou classificação de dados - consiste em “resumir” os dados através da sua
contagem e agrupamento. Deste modo, obtém-se um conjunto de números que possibilita
distinguir o comportamento do atributo estatístico.
e) Apresentação dos dados - há duas formas de apresentação que não se excluem
mutuamente:
 Apresentação por tabelas;
P á g i n a 4 | 44
Compilado Por: Esmail Henriques
 Apresentação por gráficos.
Estas formas de apresentar dados, permitem sintetizar grandes quantidades de dados,
tornando mais fácil a compreensão do carácter em estudo e permitindo uma futura
análise.
f) Análise e interpretação dos dados - é a mais importante e delicada do estudo estatístico,
pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o
problema. Nesta fase, ainda é possível, por vezes, “arriscar” alguma generalização, a qual
envolverá sempre algum grau de incerteza.
Ao estudo estatístico interessam os fenómenos não deterministas cujos resultados envolvem
alguma incerteza (inflação, resultados de uma eleição, …).
Os fenómenos deterministas ou causais (queda de um móvel, a resistência a rotura de um
material, …), para os quais existe uma lei matemática que os define, não serão naturalmente
estudados em Estatística.

2.3. UM POUCO DE HISTORIA DA ESTATÍSTICA


A origem de Estatística remota a tempos muito antigos da nossa história e começou por tratar de
assuntos de Estado. A palavra Estatística tem origem na palavra em latim status, traduzida como
o estudo do Estado e significava, originalmente, uma colecção de informação de interesse para o
estado sobre população e economia. Essas informações eram colectadas objectivando o resumo
de informações indispensáveis para os governantes conhecerem suas nações e para a construção
de programas de governo
Há indícios de que por volta do ano 3000 a.c. já se faziam censos na Babilónia, na China e no
Egipto com o propósito de cobrar impostos e para fins militares.
O livro quarto do Antigo Testamento refere que Moisés foi instruído pelo profeta a fazer um
levantamento dos homens de Israel que estivessem aptos a guerrear.
Na época do Imperador César Augusto foi ordenada a realização de um censo em todo o Império
romano no primeiro ano da nossa era (na região entre Douro e Guadiana).
Apesar da sua origem remota, é apenas no séc. XVII que a Estatística começa a ser considerada
uma disciplina autónoma. Para esta autonomia, muito contribuiu a acção do alemão Herman
Conring (1606 - 1681) ao introduzir o seu estudo na universidade de Helmstadt, no que foi
continuado por Godofred Achenwall (1719-1772) e por Schlozer (1735-1809).

P á g i n a 5 | 44
Compilado Por: Esmail Henriques
No Séc. XVII, surge também a escola inglesa. John Graunt (1620-1674) e William Petty (1623-
1687) dois dos seus mais destacados representantes, preocuparam-se com o estudo numérico dos
fenómenos sociais e políticos numa primeira tentativa de determinarem leis quantitativas capazes
de exemplificarem tais fenómenos. A Graunt se deve a primeira investigação estatística sobre a
mortalidade, como consta de uma memória que apresentou á Real Sociedade de Londres, em
1661.
Nesse estudo, Graunt concluiu que nasciam mais crianças do sexo masculino do que do sexo
feminino, que as mulheres tendiam a viver mais tempo do que os homens e que o número de
mortes (excepto durante as epidemias) se mantinha sensivelmente constante de ano para ano.
Na Alemanha, o Pastor Sussmilch (1707-1767) conduziu um estudo sobre Demografia, que
colocou como o precursor da Estatística enquanto meio indutivo de investigação.
O passo decisivo para a fundamentação teórica da inferência estatística encontra se associado ao
desenvolvimento do cálculo das probabilidades.

2.4. IMPORTÂNCIA DA ESTATÍSTICA


Nos nossos dias, a Estatística assume uma importância decisiva a diversos níveis.
A importância da Estatística pode ser vista através da sua utilização ao nível do Estado, de
Organizações Sociais e profissionais, do Cidadão comum e ao nível científico.
Ao nível do Estado, hoje em dia quase todos as decisões importantes que se tomam são
acompanhadas de estudos estatísticos e o mesmo se pode dizer relativamente á justificação da
adequação ou não das políticas seguidas por diferentes governos.
O grau de importância atribuído a Estatística, neste caso, é tão grande que praticamente todos os
países possuem organismos oficiais destinados a realização de estudos estatísticos - Instituto
Nacional de Estatística (INE).

No que respeita as organizações sociais e Profissionais, tem se vindo a assistir a um aumento do


uso da Estatística. Relativamente as Organizações Sociais, empresas, sindicatos, organizações de
assistência social, etc. Todas elas conduzem a sua acção recorrendo mais ou menos a Estatística.
Por exemplo, uma empresa quando lança um novo produto indaga pessoas acerca desse produto
com o fim de determinar índices de potenciais compradores.
No que concerne aos grupos profissionais, são também cada vez maiores as exigências na
utilização de Estatística. Muitas vezes tal utilização acompanha diversas fases do seu trabalho,
que vão desde a planificação passando pela execução e terminando na análise dos resultados.
P á g i n a 6 | 44
Compilado Por: Esmail Henriques
Destaca-se, ao nível das organizações, o aparecimento recente e o grande incremento de empresas
e profissões ligadas a publicidade e técnicas de marketing, nas quais a Estatística desempenha um
papel central.

A Estatística é também responsável pelo desenvolvimento científico em geral. Para além da sua
aplicabilidade nas Ciências Naturais, na Medicina, na Agronomia e na Economia, a Estatística
constitui um suporte de cientificidade para as ciências humanas e sociais. É assim que ciências
como a Sociologia, a Psicologia, a História e a Pedagogia têm beneficiado de consideráveis
desenvolvimentos e de aumento de credibilidade pública com a utilização de meios estatísticos.

Exercícios
1. Descreve o objecto de estudo de estatística;
2. Dê pelo menos dois exemplos de utilização de estatística no seu dia-a-dia
3. Que procedimentos devem ser observados num estudo estatístico?
4. Numa página, fundamente a importância do estudo da Estatística na sua
área\especialidade?

P á g i n a 7 | 44
Compilado Por: Esmail Henriques
3. CONCEITOS BÁSICOS DA ESTATÍSTICA

ESTATÍSTICA – é uma técnica que trata da COLETA, APRESENTAÇÃO,


TRATAMENTO E ANÁLISE DOS DADOS, tendo como objectivo a GERAÇÃO DE
INFORMAÇÃO para a tomada de decisão ou para a compreensão do fenómeno.

DADOS INFORMAÇÃO
12 12 15 15 17 Média
17 17 18 18 18 Mediana
18 19 19 19 19 Moda
19 19 20 20 21 Quartil, Decil e Percentil

Noção Popular da Estatística Gráficos e Tabelas


 Campo que organiza e descreve os dados experimentais.
 Campo que refere a análise e interpretação.
(Relação entre Estatística Descritiva e Estatística Inferencial): Para analisar e
interpretar é preciso organizar e descrever.

Por isso a Estatística subdivide-se em:

Estatística Descritiva
Estatística Indutiva (Inferencial)

A Estatística Descritiva (dedutiva): consiste em métodos para organizar e resumir informação


ou ainda, é a parte da estatística que procura somente descrever e analisar um certo grupo, sem
tirar conclusões ou inferências sobre um grupo maior.
Estatística descritiva ou dedutiva inclui a construção de gráficos, quadros, tabelas, e o cálculo de
várias medidas descritivas como média, variação, moda, mediana, variância, desvio padrão,
quartís, decís, percentís, etc.

A Estatística Indutiva (estatística Inferencial)refere-se o estudo de técnicas que possibilitam a


extrapolação (ilação ou inferência), a um grande conjunto de dados, das informações e
conclusões obtidas a partir dos subconjuntos de valores, usualmente de dimensão muito menor. A

P á g i n a 8 | 44
Compilado Por: Esmail Henriques
inferência estatística só se aplica para casos em que partimos do estudo duma amostra para tirar
conclusões sobre a população.
Como essa inferência não pode ser absolutamente certa, a linguagem da probabilidade é muitas
vezes usada, no estabelecimento das conclusões.

Relação entre Estatística descritiva e estatística indutiva

Quase sempre é necessário invocar técnicas da estatística descritiva para organizar e resumir a
informação obtida de uma amostra antes de levar a cabo uma análise inferencial. Além disso, a
análise descritiva preliminar de uma amostra revela frequentemente as características que
conduzem a escolha (ou para reconsideração da escolha) do método de inferência apropriado.

3.1. CONCEITOS DE POPULAÇÃO E AMOSTRA


População ou Universoé a totalidade dos objectos concebíveis de uma certa classe em
consideração.

Unidade Estatística - é a designação dada a cada elemento que constitui a população.

Amostra são os objectos seleccionados da população. Se esses objectos são seleccionados de tal
maneira que cada objecto tem a mesma chance de ser seleccionado do que o outro, temos uma
amostra aleatória.

3.1.1.Tipos de amostragem
De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória.
O método de amostragem não aleatório consiste em seleccionarmos entidades através de escolha
pessoal.
As amostras não aleatórias incluem:
1) As de opinião quando as entidades são escolhidas porque compõem uma amostra
representativa (os habitantes de duas freguesias podem ser usados como representativos
dos eleitores de uma zona mais ampla do país, por exemplo);
2) As de conveniência quando escolhemos as entidades apenas estas estarem mais próximas
de nós (escolhemos os alunos de uma turma quando pretendemos obter a opinião de todos os
alunos de uma escola);
3) As de quota quando os elementos que compõem a amostra são de determinadas
características (se soubermos que os consumidores de um determinado produto são 60% do
sexo feminino, podemos dizer a um inquiridor que esteja à porta de um supermercado para
P á g i n a 9 | 44
Compilado Por: Esmail Henriques
entrevistar 60 pessoas do sexo feminino e 40 do sexo masculino, cabendo-lhe a decisão de
escolher quem entrevista).

Porque dependem de escolha pessoal, as amostras não aleatórias podem efectivamente não ser
representativas de uma população, sendo difícil o cálculo do erro amostral. Para ultrapassarmos
este problema, as amostras aleatórias deixam a escolha ao acaso, tendo em princípio cada
elemento da população a mesma probabilidade de ser escolhido.

Há quatro tipos de amostragens aleatórias.


A primeira delas é a chamada amostra aleatória simples de tamanho n onde não só cada
elemento da população tem as mesmas hipóteses de ser escolhido, como também qualquer
conjunto de tamanho n pode ser escolhido.
Exemplo: Pretende-se uma amostra de 20 alunos de uma escola, atribui-se um número a cada um
dos alunos da escola e, seguidamente, escolhe-se ao acaso 20 desses números.

O segundo tipo de amostragem é a amostragem estratificada. Neste tipo de amostragem, as


entidades são agrupadas em estratos segundo características físicas ou materiais. Para assegurar
que todos os estratos da população estudantil afectados por determinado diploma sejam
considerados, escolhem-se, por exemplo, uma amostra aleatória de estudantes de cada um dos
tipos de ensino: básico, secundário e superior. Uma única amostra aleatória simples não poderia
garantir esta representação de estudantes dos três tipos de ensino.
Exemplo: Na selecção de 30 alunos de uma escola, considerando cada ano de escolaridade como
estrato, escolher-se-ia em cada um desses anos um determinado número de alunos por um dos
processos anteriores. O número de alunos a escolher em cada ano, seja, em cada estrato deve ser
proporcional ao número dos alunos desse ano.
Se a escola, com 600 alunos, 150 são da ACV3EI, 100 são da ACV4EI e 50 são da ACV5EI
poder-se-ia para amostra
 15 Alunos da ACV3EI
 10 Alunos da ACV4EI
 5 Alunos da ACV5EI
O que significa que em cada estrato tem se 10% de alunos

P á g i n a 10 | 44
Compilado Por: Esmail Henriques
Um terceiro tipo de amostragem é a chamada amostragem por cachos. Aqui, as entidades
são classificadas em grupos ou cachos e é seleccionada uma amostra aleatória de cachos. Um
censo (de toda a população) é então conduzido dentro dos cachos seleccionados.

Por fim, que é quarta chama-se a amostra sistemática, os elementos da amostra, são escolhidos a
partir de uma regra estabelecida.
Exemplo: Para seleccionar uma amostra de 30 alunos de uma escola com 600 alunos, depois de
numerados todos, pode-se escolher um aluno de 20 em 20 a partir do primeiro aluno seleccionado
e escolhido ao acaso de entre o primeiro grupo de 20 alunos. Supondo que o número 3 foi
seleccionado, tem-se para a amostra: 3, 23, 43, 63, ……, 563, 583.

Censo- o estudo estatístico onde se trabalha com todos os elementos da população. Caso
contrário denomina-se Sondagem.

3.2.TIPOS DE VARIÁVEIS
Variável – é o atributo ou característica que se pretende estudar.
Pode-se por exemplo, registrar a idade das pessoas ao casar, a estatura ou peso de indivíduos, o
rendimento mensal dos trabalhadores de uma certa empresa, o número de empregados
dispensados, por mês, numa grande empresa, etc.
Conforme a natureza dos dados as variáveis estatísticas podem ser: Qualitativas e
Quantitativas.

Qualitativas: as que exprimem uma qualidade, não podendo ser mensuráveis. E podem ser:
 Ordinais: é uma variável qualitativa na qual a ordem das categorias faz sentido. Exemplo,
estudantes podem avaliar a efectividade dos professores, ordenando nas categorias de,
mau, médio, bom ou excelente. Aqui uma categoria é superior que a imediatamente
anterior. Outros exemplossão: comportamento, Aproveitamento Pedagógico
 Nominais: é uma variável qualitativa na qual não é possível estabelecer uma ordem
natural entre os dados.
Exemplo: as variáveis como Turma (A ou B), sexo (masculino ou feminino), Fuma
(sim ou não), o tipo de literatura preferida (romances, livros literários, etc.), o estado
civil (solteiro, casado, viúvo e divorciado).

A variável será qualitativa quando resultar de uma classificação por tipos ou atributos, como nos
seguintes exemplos:

P á g i n a 11 | 44
Compilado Por: Esmail Henriques
a) População: Alunos de uma universidade, Variável: sexo (masculino ou feminino).
b) População: Moradores de uma cidade, Variável: tipo de habitação (casa, apartamento,
barco, etc.).
c) População: Peças produzidas por uma máquina, Variável: qualidade (perfeita ou
defeituosa).
d) População: Óbitos em um hospital, nos últimos cinco anos, Variável: causa mortes
(moléstia cardiovasculares, cânceres, etc).

Quantitativas: as mensuráveis (que podem ser atribuídos números) e podem ser:


 Discretas: assumem um número finito ou infinito numerável de valores, isto é, é uma
variável que assume valores pontuais.
Exemplos: a ida ao médico, o número de irmãos, o número de sapato que uma pessoa
calça, nº de defeitos (0, 1, 2, ...), etc.
 Contínuas (intervalo): assumem um número infinito não numerável de valores, isto é,
variáveis estatísticas que podem assumir teoricamente qualquer valor entre duas
observações.
Exemplo: o tempo gasto para chegar a escola, a altura dos residentes de um bairro, o
número de metros percorridos por um atleta durante certo período de tempo em uma pista
circular, X não será certamente uma variável quantitativa discreta, etc.
Alguns exemplos de variáveis quantitativas discretas são:
a) População: habitações de uma cidade, Variável: número de banheiros.
b) População: casais residentes em uma cidade, Variável: número de filhos.
c) População: aparelhos produzidos em uma linha de montagem, Variável: número de
defeitos por unidade.
d) População: Bolsa de valores de São Paulo, Variável: número de acções negociadas.
Alguns exemplos de variáveis quantitativas contínuas são:
a) População: estação meteorológica de uma cidade, Variável: precipitação pluviométrica
durante um mês.
b) População: pregos produzidos por uma máquina, Variável: comprimento.
c) População: propriedades agrícolas do Brasil, Variável: produção de algodão.
d) População: indústrias de uma cidade, Variável: índice de liquidez.
e) População: pessoas residentes em uma cidade. Variável: idade.

P á g i n a 12 | 44
Compilado Por: Esmail Henriques
EXERCÍCIOS:

1. Defina População.
2. Mencione 4 exemplos de população que pode ser estudado numa pesquisa.
3. Em palavras breves explica a diferença entre variáveis qualitativas e as quantitativas.
4. Em palavras breves explica a diferença entre variáveis quantitativas discretas e variáveis
quantitativas contínuas.
5. Abaixo apresenta-se uma lista de variáveis, classifique-as:
a) O valor monetário indicado num talão de depósito.
b) O aproveitamento pedagógico dos alunos de uma escola.
c) O meio de comunicação usado por uma Universidade para publicitar os seus serviços.
d) A dívida de uma pessoa ao banco.
e) Vida média dos televisores produzidos na China.
f) Comprimento de 100 parafusos produzidos por uma fábrica.
g) Quantidade de trigo que é gasto na confecção dum bolo.
h) As cores dos autocarros da TCO.
i) Número de filhos do Castigo.
6. Explique com um exemplo prático porquê a amostragem sem reposição é preferível do que a
amostragem com reposição.
7. Defina ou explique os seguintes conceitos:
a) Estatística descritiva.
b) Estatística Inferencial.
c) Amostra.
d) Censo.
e) Sondagem.
8. Supondo que ia fazer um estudo sobre cada um dos temas indicados, diga, justificando,
em quais deles utilizaria uma amostra:
a) Controlo de qualidade da educação oferecida pelas escolas privadas moçambicanas;
b) Aproveitamento dos alunos da turma 10ª A de uma Escola;
c) Análise do mercado para lançamento de uma nova pasta de dentes;
d) Estado sanitário dos ovos existentes num armazém;
e) Tipo de borboletas existentes num Paí
P á g i n a 13 | 44
Compilado Por: Esmail Henriques
3. Considerar a sequência do seguinte estudo:
a) Define-se uma amostra dos elementos de população;
b) Descrevem-se as variáveis para o estudo;
c) Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra;
d) Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas
estatísticas;
f) Qual dos passos referidos está dentro da Inferência Estatística?
4.Um promotor de vendas quer saber a opinião de mulheres empregadas sobre uma nova
política do governo que prevê escolaridade obrigatória até 7ª classe. Ela tem uma lista de
todas as mulheres que pagam quotas a um dos sindicatos. Ela envia um questionário a 100
destas mulheres escolhidas aleatoriamente. Destas, 68 preenchem e devolvem o questionário.
a) Qual é, neste caso, a população e amostra?
b) Acha que a amostra é representativa? Justifique.
5.Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de
televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, as
18h30min. Dois dias mais tarde, uma firma de pesquisa de mercados realizou um
levantamento telefónico para obter informações sobre os índices de respostas (percentagem
de espectadores que responderam vendo o comercial) e impressões sobre o comercial.
a) Qual é a população desse estudo
b) Qual é a amostra para esse estudo
c) Porque se usaria uma amostra nessa situação?

P á g i n a 14 | 44
Compilado Por: Esmail Henriques
4. DISTRIBUIÇÃO DE FREQUÊNCIAS E GRÁFICOS
OBJECTIVOS
 Recolher dados num estudo estatístico;
 Organizar dados estatísticos;
 Apresentar dados estatísticos numa tabela e num gráfico de distribuição de frequências
usando o pacote estatístico Excel ou Spss;
 Analisar e interpretar os dados descrevendo-os e tirar conclusões;
 Elaborar um relatório preliminar sobre o fenómeno estatístico observado.
4.1. TABELA DE FREQUÊNCIAS
Vamos dar em seguida, particular atenção a organização e apresentação dos dados,
nomeadamente `a elaboração de tabelas e gráficos
Para organizar e representar dados, usam-se tabelas e gráficos.

4.2. DISTRIBUIÇÃO DE FREQUÊNCIAS


Para que uma informação recolhida seja divulgada é necessário que esta seja organizada de modo
a ser percebida pelos leitores ou outros investigadores.
De uma geral uma distribuição de frequência é um tipo de tabela que condensa uma colecção de
dados conforme as repetições de seus valores.

Dados brutos - são os dados originais que ainda não estão numericamente organizados. É difícil
formar uma ideia exacta do comportamento do fenómeno, a partir de dados não ordenados.
Exemplo: Os dados a seguir correspondem ao consumo de energia de uma determinada família
num período de um ano (em Kw/h).
X = {145, 141, 142, 141, 142 143, 144, 141, 146, 150, 146, 150}.

Rol estatístico ou ROL – é uma lista em que os valores ou dados numéricos são ordenados de
forma crescente ou decrescente.
X - Rol = {141, 141, 141, 142, 142, 143, 144, 145, 146, 146, 150, 150}
Como se pode observar da nova série de dados de consumo de energia, já pode-se distinguir qual
é o valor mínimo bem como o consumo máximo.

Amplitude Total ou Range (At) – é a diferença entre o maior e o menor valor da série estatística
ou a diferença positiva entre os extremos do Rol estatístico.

P á g i n a 15 | 44
Compilado Por: Esmail Henriques
Quando os dados brutos se resumem, frequentemente costuma – se distribuir em classes ou
categorias e determina – se o número de casos pertencentes a uma das classes ou o número de
repetições de um determinado valor denominado frequência de classe ou do valor.

Uma apresentação em forma de tabela de dados categorizados ou com intervalo de classe e as


respectivas frequências é conhecida por distribuição de frequências.

Há dois tipos de distribuição de frequências: De dados não classificados ou não agrupados e


de dados ou valores classificados em classe.

 As distribuições de frequências não agrupadas são utilizadas quando temos poucas


observações ou dados e o número de valores ou modalidade apresenta repetições.
Se o número de dados observados for elevado é conveniente agrupar os dados em classes.

Tabela de frequências para dados simples (não agrupados em classes)


Suponhamos que numa turma da ACV4EI do instituto industrial e comercial da beira
pretendíamos fazer um estudo estatístico sobre as idades (em anos) dos formandos/as.
E neste caso registamos: 16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15, 17, 14, 15, 15, 15, 14, 16, 15,
14, 14, 15, 17.
A variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17.

Tabela 1: Distribuição das idades da turma


Idade (em anos) Xi Contagem Frequência absoluta fi
13 // 2
14 //// // 7
15 //// //// 9
16 /// 3
17 // 2
Total - 23

A tabela acima representa a frequência absoluta ou efectivo (fi) de um valor Xi da variável, pois
indica o número de vezes que esse valor foi observado.
Sabemos da tabela que 7 formandos da turma têm 14 anos, 3 formandas têm 16 anos, etc.
A partir da frequência absoluta (fi), podemos calcular outras frequências tais como:
 Frequência relativa (fri) de um valor Xida variável, é o quociente entre a frequência
absoluta do valor Xi da variável e o número total de observações.
P á g i n a 16 | 44
Compilado Por: Esmail Henriques
=

 Frequência relativa em percentagem (fri%) de um valor X da variável, é o quociente


entre a frequência absoluta do valor Xi da variável e o número total de observações vezes
100%.

= × %

 Frequência absoluta acumulada (Fi) é a soma das frequências absolutas de todos


valores anteriores a Xi com frequência absoluta de Xi.
 Frequência relativa acumulada (Fri) do valor Xi, é a soma das frequências relativas de
todos valores anteriores a Xi com frequência relativa de Xi.
 Frequência relativa acumulada em percentagem (Fri%) é a soma das frequências
relativas de todos valores anteriores a Xi com frequência relativa de Xi Vezes 100%.

Tabela 2: Distribuição das frequências das idades da turma


Idade Frequência Frequência Frequência Frequência Frequência Frequência
(em anos) Absoluta relativa relativa em Absoluta Relativa relativa
Xi fi percentagem Acumulada Acumulada acumulada
(fri%) Fi Fri em
=
percentagem
(Fri%)

13 2 2 9% 2 0.09 9%
= 0,09
23
14 7 7 30% 9 0.39 39%
= 0,30
23
15 9 9 39% 18 0.78 78%
= 0,39
23
16 3 3 13% 21 0.91 91%
= 0,13
23
17 2 2 9% 23 1 100%
= 0,09
23
Total N = 23 23 100% ______ _____ _____
=1
23

P á g i n a 17 | 44
Compilado Por: Esmail Henriques
Nesta tabela, encontram-se respostas para as seguintes questões:
1. Qual é o número de alunos com idade inferior ou igual a 14 anos?
Resp: Há 9 formandos com 14 anos ou menos;
2. Qual é a percentagem de formandas com 15 anos?
Resp: há 39% de alunos com 15 anos;
3. Quantos formandos têm 17 anos?
Resp: há 2 formandas com 17 anos;
4. Qual é a percentagem de formandos com idade inferior a 16 anos?
Resp: 78% das formandas têm menos de 16 anos;
5. Qual é a percentagem de formandos com mais de 15 anos?
Resp - 22% (13% + 9%) das formandas da turma têm mais de 15 anos;
6. Qual é o número total das formandas da turma?
Resp: o número total das formandas da turma é 23

Tabela de frequências para dados agrupados ou tabulados em classes


Se no lugar de estudarmos a variável idade dos alunos, fossemos estudar a variável altura dos
alunos e tivéssemos:
1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,661,73 1,53 1,61 1,63 1,56
1,55 1,57 1,64 1,60 1,51 1,68

Também pode-se usar o agrupamento de dados em classes de variáveis discretas se tivermos


tantos valores diferentes para variável Xi.
Não existe nenhuma fórmula universalmente aceite para determinar o número de classes a
considerar.
A tabela de Truman L. Kelley que estabelece o número de classes (k) em função do número total
de observações (n) pode constituir uma ajuda.
N 5 10 25 50 100 200 500 1000
K 2 4 6 8 10 12 15 15

No caso das alturas podemos considerar 6 classes, pois n = 23.

P á g i n a 18 | 44
Compilado Por: Esmail Henriques
Todas as classes devem ter a mesma amplitude e para isso calcula-se:
 1º Amplitude total = limite superior (Ls) - limite inferior (Li) = 1,73-1,48 = 0,25.

Ls  Li 0,25
 2º Amplitude de classe    0,042
k 6
Pode, então, considerar – se 0,05 como amplitude de cada classe e 1,45 como limite inferior da
primeira classe.
Obs: Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado) como limite
inferior da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe.
Deste modo, a definição da amplitude das classes e do limite inferior da primeira classe devem
ser estabelecidos para que cada valor da variável estatística pertença exactamente a uma classe.
Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos.
K=1+3,3log (n) e ainda, k  n , sendo n, o número de observações.

Tabela 3: Distribuição das alturas dos alunos


Alturas (em m) Contagem Fi
[1,45; 1,50[ // 2
[1,50; 1,55[ //// 4
[1,55; 1,60[ //// 5
[1,60; 1,65[ //// // 7
[1,65; 1,70[ /// 3
[1,70; 1,75[ // 2
Total ____ N= 23

P á g i n a 19 | 44
Compilado Por: Esmail Henriques
Tabela 4: Distribuição de frequências das alturas dos alunos
Alturas (em Frequência Frequência Frequência Frequência Frequência Frequência
m) Absoluta relativa relativa em Absoluta Relativa relativa
Classes fi percentagem Acumulada Acumulada acumulada em
(fri%) Fi Fri percentagem
=
(Fri%)

[1,45; 1,50[ 2 2 9% 2 0,09 9%


= 0,09
23

[1,50; 1,55[ 4 4 17% 6 0.26 26%


= 0,17
23
[1,55; 1,60[ 5 5 22% 11 0.48 48%
= 0,22
23
[1,60; 1,65[ 7 7 18 0,78 78%
= 0,30
23
30%
[1,65; 1,70[ 3 3 21 0.91 91%
= 0,13
23
13%
[1,70; 1,75[ 2 2 9% 23 1 100%
= 0,09
23

Total N= 23 23 100% ______ ________ _________


=1
23

Nesta tabela encontram-se as respostas para as seguintes questões:


1 Qual é o número de alunos com alturas maiores ou iguais a 1,65m?
Resp: Há 5 alunos com altura de 1,65m ou mais.
2. Qual é a percentagem dos alunos maiores ou iguais a 1,55m?
Resp: 74% dos alunos têm alturas iguais a 1,55 ou mais;
3. Quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m?
Resp: há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m;
4. Qual é a percentagem dos alunos que têm uma altura de 1,60m ou compreendida entre
1,60m e 1,65m?
Resp: 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m.

P á g i n a 20 | 44
Compilado Por: Esmail Henriques
5. GRÁFICOS DE DISTRIBUIÇÃO DE FREQUÊNCIAS
Os gráficos constituem uma outra forma de representar dado
dados.
s. Comparativamente as tabelas, os
gráficos são mais atractivos e facilitam a apreensão da mensagem.

Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas
situações. Neste estudo referir
referir-se-ão: gráficos de barras, histograma,
stograma, polígono de frequência se
gráfico circular.
Gráficos de Barras
Os gráficos de barras utilizam-se
utilizam essencialmente para dados simples (não agrupados). Estes
gráficos são empregue muita das vezes para estabelecer comparações.
No caso de variável discreta
reta é usual desenhar gráficos: de barras, circular ou pictograma.
A partir dos dados da tabela de frequências das idades dos formandos/as do instituto industrial e
comercial da beira,, vamos construir o gráfico de barras.
barr

formandos Idade dos formandos de ACV4EI


9
8
7
6
5
4
3
2
1
0
13 14 15 16 17
Idade(Xi)

Histograma
stograma ou diagrama em colunas
Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do
gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas (horizontal)
representam-se
se as classes e no eixo das ordenadas (vertical) as frequências.

P á g i n a 21 | 44
Compilado Por: Esmail Henriques
Distribuicão das Alturas dos formandos da ACV4EI
ACV
8

0
[1,45;1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ [1,70;
[ 1,75[altura

Polígono de Frequências
Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da
classe e sua respectiva frequência absoluta simples correspondente (no histograma).

Distribuicão das Alturas dos formandos da ACV


ACV4EI
8
Números de formandos

6
4
2
0
[1,45; 1,50[
1 [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65;; 1,70[ [1,70; 1,75[
Alturas

Gráficos Circulares
lares (sectograma)
Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes
são proporcionais `a frequência correspondente.
O gráfico circular costuma-se
se utilizar quando o número de categorias para a variável é peque
pequeno
(normalmente menor ou igual a seis
seis-6)
6) e, é especialmente adequado para estabelecer
comparações entre diferentes valores do atributo em estudo.
A amplitude de cada sector é determinada pela frequência relativa.
Na tabela seguinte foram observadas 54 pess
pessoas
oas relativamente a cor dos olhos.
Cor dos olhos Azul Verde Cinzenta Cinzenta

Efectivos 10 5 19 20

P á g i n a 22 | 44
Compilado Por: Esmail Henriques
Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo correspondente a
cada classificação.
Cor dos olhos Efectivos Percentagem Ângulos (amplitude em graus)
(fi)
Azul `10 10/54=0,185… ou 18,5% 0,185x360o=66,66…=67º

Verde 5 5/54=0,093 …ou 9,30% 0,093x360o = 33,33=33º

Cinzenta 19 19/54=0,352… ou 35,2% 0,352x360o=126,66...=127º …

Castanha 20 20/54=0,370 …ou 37,0% 0,370x360o = 1360o =133,33º


…=133º
N=54 Total = 360º

Distribuição da cor dos olhos de 54 pessoas

Cor dos olhos de 54 pessoas

Azul
19%
castanha Verde
37% 9%

Cinzenta
35%

Exercícios
1. Considera a seguinte distribuição de frequências, relativas as comissões ganhas no último mês
pelos vendedores de uma dada empresa:
Comissões [0;2[ [2;4[ [4;6[ [6;8[ [8;10[ [10;12[ [12;14[
(em centenas de contos)
No de trabalhadores 2 3 7 16 7 3 2

Construa o histograma, o polígono de frequências e polígono de frequências acumuladas.

P á g i n a 23 | 44
Compilado Por: Esmail Henriques
2. Inquéritos realizados em 20 residências de diversas universidades de um determinado país
trevelaram os seguintes valores para o número de estudantes de gestão por residência:
No de estudantes [0-10 [ [10-20 [ [20-30 [ [30-40 [
No de Residências 2 4 9 5
a) Encontre as frequências absoluta, relativa, absoluta acumulada e relativa acumulada;
b) Construa o histograma;
3. Os vencimentos mensais, em mil meticais, dos 40 funcionáriosde uma empresa são os
seguintes:
18 18 20 22 21 18 19 20 23 18 19 20
21 18 17 19 20 18 22 19 18 24 20 18
19 18 22 21 20 19 17 18 21 18 18 19
18 18 18 18
a) Indique a população, a variável e a unidade estatística desta distribuição;
b) Elabore um quadro de distribuição de frequências;
c) Construa um gráfico de barras que defina esta distribuição;
d) Elabore um relatório de 2 linhas sobre esta distribuição.

P á g i n a 24 | 44
Compilado Por: Esmail Henriques
6. MEDIDAS DE TENDÊNCIA CENTRAL
MEDIDAS DE TENDÊNCIA CENTRAL

Apesar das tabelas estatísticas e das representações gráficas nos darem uma ideia clara da
distribuição de frequências da variável estudada, torna-se necessária simplificar ainda mais o
conjunto de dados, de forma a caracterizar a distribuição por um número reduzido de medidas
(parâmetros) que evidenciem o que demais significativo existe no conjunto.
Estes parâmetros podem agrupar-se em três tipos:
 Medidas de posição ou de localização (ou de tendência central);
 Medidas de dispersão ou de variabilidade;
Vamos estudar em primeiro lugar as medidas de posição ou de localização.
Essas medidas indicam-nos valores típicos a volta dos quais os dados se distribuem. Essas
subdividem-se em duas partes, que são:
 Medida de tendência central – Média, Moda e Mediana.
 Medida de separação (ou medidas de ordem) – os quartis e decís.

MEDIDA DE TENDÊNCIA CENTRAL

1. Média Aritmética ( x )
A média aritmética, ou daqui para diante simplesmente média, é a medida de tendência central
mais utilizada, porque, além de ser fácil de calcular, tem uma interpretação familiar e
propriedades estatísticas que a tornam muito útil nas comparações entre populações e outras
situações que envolvem inferências. Uma vantagem da média é que ela leva em conta todos os
valores no seu cálculo, uma desvantagem é que ela é afetada por valores extremos.

a) Média Aritmética - dados não agrupados numa tabela


Sejam x1, x2, x3, ..., xn, portanto, “n” valores da variável X. A média aritmética simples de X
representada por x é definida por:
n

x  x 2  x3  ...  x n x i
x
x 1  i 1
Ou simplesmente x 
n n n
Exemplo:
Calcular a média aritmética simples do conjunto de números seguinte:
X = {3, 6, 9, 12, 15, 18}
Resolução:
P á g i n a 25 | 44
Compilado Por: Esmail Henriques
3  6  9  12  15  18 63
x   10,5
6 6

b) Média Aritmética – dados agrupados numa tabela


Sejam x1, x2, x3, ..., xk, os valores da variável X associados as suas frequências absolutas f1, f2, f3,
..., fk, respectivamente. A média aritmética ponderada de X representada por x é definida por:
k

x  f  x 2  f 2  x3  f 3  ...  x k  f k x i  fk
x i  fi
x 1 1  i 1
Ou simplesmente x 
n n n

Exemplo:
Determinar a média aritmética dos dados constantes da seguinte tabela:
xi fi xi  f i Resolução:
3 6 18
Olhando para a fórmula x 
x i  fi
, podemos fazer o cálculo da média
5 4 20 n
aritmética acrescentando uma coluna na tabela (coluna dos produtos
10 5 50
xi  f ai ), depois adicionamos e substituímos na fórmula teremos:
12 2 24
x 
 x  fa

112
 6 , 59
Total 17 112 n 17

^
2. Moda ( M o ou X )

a) Moda para dados não - agrupados numa tabela de classes


Numa distribuição de frequncias, Moda é o valor que apresenta maior frequência, seja ela
absoluta simples ou relativa simples.
Exemplo 1:
Xi 3 5 10 12 Total
fi 6 4 5 5 17
Mas existem casos em que numa tabela de frequência existem dois ou mais valores que
apresentam maior frequência, neste caso estamos perante duas ou mais modas, que são os valores
que apresentam esta maior frequência.

P á g i n a 26 | 44
Compilado Por: Esmail Henriques
Exemplo 2:
Considere a série de dados: 9, 8, 7, 10, 12, 11, 10, 13, 10, 15, 10
Rol: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15
 Amodal – serie de dados sem valores repetidos.
7, 8, 9, 10, 11, 13, 15, 18, 20, 21
 Unimodal – com apenas uma moda. Um único valor repete-se mais vezes.
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
 Bimodal – com apenas duas modas. Dois valores repetem-se mais vezes.
7, 8, 9, 10, 10, 10, 11, 11, 11, 15
 Trimodal – com pelo menos três modas.
9, 9, 9, 10, 10, 10, 11, 11, 11, 15

Exemplo 3:
xi fi

3 8
5 5 Nessa distribuição, verificamos que o elemento 3 e o

10 8 elemento 10 apresentam fi=8 que por sinal é a maior


frequência, logo estamos perante duas modas 3 e 10.
12 2
Total 23
Se uma distribuição não apresenta nenhuma moda (caso em que todas as fi são iguais) diz-se que
estamos perante uma distribuição amodal.
No caso em que temos uma, duas ou mais modas diz-se que estamos perante uma distribuição
unimobal, bimodal ou multimodal, respectivamente.

b) Moda para dados agrupados numa tabela de classes


Já vimos anteriormente que para dados não agrupados numa tabela de classes, moda é o valor
que apresenta maior frequência, seja ela absoluta ou relativa. O termo moda foi utilizado pela
primeira vez por Karl Pearson em 1895.
Para a determinação da moda para dados agrupados numa tabela de classes iremos nos basear na
fórmula de Czuber.

P á g i n a 27 | 44
Compilado Por: Esmail Henriques
1
M o  Li  .hi Onde:
1   2

Li – Limite inferior da classe modal (classe que apresenta maior frequência absoluta ou maior
correcção se as classes tiverem amplitudes diferentes).
 1 - diferença entre a frequência absoluta da classe modal ( f mo ) e a frequência absoluta da

classe imediatamente anterior a classe modal ( f ant ).

 2 - diferença entre a frequência absoluta da classe modal ( f mo ) da frequência absoluta da classe

imediatamente posterior ( f post ).

hi– amplitude da classe modal.


Nota Importante: esta não é a única fórmula para determinação da moda para dados
agrupados numa tabela de classes.

Tarefa: pesquise as outras fórmulas.

Exemplo 1:
Determine a moda para a seguinte distribuição:
Classes f ai

[5, 10[ 5 Observando a tabela, nota-se que a classe modal é [15, 20[

[10, 15[ 3 visto que apresenta maior frequência.

[15, 20[ 8 1 (8  3) 5
M o  Li  .hi  15  * 5  15  *5
1   2 (8  3)  (8  6) 5 2
[20, 25[ 6
25
[25, 30[ 5  15   18,57
7
[30, 35[ 4
 31
Se as classes da tabela tivessem amplitudes diferentes,  1 e  2 significarão respectivamente,
diferença entre a correcção da classe modal ( q mo ) e a correcção da imediatamente classe anterior

a classe modal ( q ant ) e diferença entre a correcção da imediatamente classe posterior a classe

modal ( q post ) e correcção da classe modal ( q mo ).

P á g i n a 28 | 44
Compilado Por: Esmail Henriques
Correcção ( qi )

É o quociente entre frequência absoluta ( f ai ) e a amplitude da classe ( hi ), i. e.,

f ai
qi 
hi
Exemplo 2:
Determine a moda dos dados constantes da seguinte tabela:
Classes f ai qi

[5, 10[ 5 5
5 1

[10, 14[ 3 3
4  0,75

[14, 19[ 8 8
5  1,6

[19, 25[ 9 9
6  1,5

[25, 32[ 5 4
7  0,57143

[32, 36[ 4 4
4 1

 34
Para encontrar a moda nesta distribuição temos que calcular as correcções. Estes cálculos podem
ser efectuados directamente na tabela (veja na tabela acima, 3ª coluna). Depois de preencher a
coluna das correcções, identificamos a classe modal (aquela que apresenta maior correcção).
Neste caso a classe modal é [14, 19[.
Agora vamos aplicar a fórmula para determinar a moda:
1 (1,6  0,75) 0,85 4,25
M o  Li  .hi  14  * 5  14  * 5  14   18,47
1  2 (1,6  0,75)  (1,6  1,5) 0,85  0,1 0,95
~
3. Mediana ( M d ou x )

Mediana é o valor que ocupa a posição central, dividindo os dados em duas partes iguais,
correspondendo a cada uma 50% dos dados.

a) Determinação da Mediana para dados não agrupados numa tabela de classes


Exemplo: para os dados 2, 6, 8, 2, 9, 12, 2, 6, 8, 6, 9, 12, 9
É importante saber que para determinarmos a mediana primeiro temos que fazer o ROL (colocar
os dados em ordem crescente ou decrescente). Rol:
P á g i n a 29 | 44
Compilado Por: Esmail Henriques
Posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª 13ª
Elemento 2 2 2 6 6 6 8 8 9 9 9 12 12
~
Neste exemplo, vê-se que as duas setas apontam paro mesmo elemento, logo x  8
Mas, veja agora para este exemplo:
Considere os dados 2, 6, 8, 2, 9, 12, 2, 6, 9, 6, 9, 12, 9, 13. Determine a mediana.
Posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª 13ª 14ª
Elemento 2 2 2 6 6 6 8 9 9 9 9 12 12 13
Neste exemplo, considera-se mediana como a média aritmética dos dois valores centrais,
~ 89
isto é, x   8,5
2
Mas às vezes trabalha-se com um número muito elevado de valores, onde temos que organizar os
dados numa tabela.
Exemplo 1:
Determine a mediana para a distribuição de frequências seguinte:
xi fi

3 8
Olhando para esses dados torna-se difícil dizer qual é a mediana.
5 5
Mostraremos alguns procedimentos para a determinação da mediana.
10 8
12 2
Total 23
Para determinar a mediana temos que ter em consideração as seguintes fórmulas:

~ x n  x n 1
2 2 n
1º caso: se n for par, x  onde x n e x n 1 lêem-se, valor que ocupa a posição e
2 2 2 2
n
 1 respectivamente.
2
~
n 1
2º caso: se n for ímpar, x  X n 1 onde X n 1 lê-se, valor que ocupa a posição .
2 2 2
n n 1
Veja que há uma diferença entre 1 e .
2 2
Para o último exemplo acima (tabela), temos n=23 ímpar, logo a fórmula a usar será,:

P á g i n a 30 | 44
Compilado Por: Esmail Henriques
xi fi Fac ~
x  X n 1 mas para encontrar o valor que ocupa a posição X n 1 que
3 8 8 2 2

5 4 12 X 231  X 24  X 12 , ou seja, é o 12º valor.


é o mesmo que dizer 2 2
10 8 20
Com base neste valor, vamos completar a coluna das Fac para
12 3 23
identificar a 1ª Fac maior ou igual a 12 e a partir dessa Fac indicamos
Total 23
~
o valor de xi correspondente a Mediana. Logo x  5
Tarefa:
Determine a mediana para a distribuição de frequências seguinte:
xi fi

3 8
5 4
10 7
12 5
Total 24

3.1. Determinação da Mediana para dados agrupados numa tabela de classes


Já vimos como determinar a mediana para dados isolados, ou seja, dados não agrupados em
classes.
Agora veremos como determinar a mediana para dados agrupados em classes.
Para a determinação da mediana para dados agrupados numa tabela de classes, segue-se os
seguintes procedimentos:
n
1. determinar
2
2. Identifica-se a classe mediana a partir das frequências absolutas acumuladas (a classe que
n n
apresenta primeira f ac  , isto é, identificar a primeira f ac  ).
2 2
n
~  Fac1
3. Aplicar a fórmula: x  L i  2 * hi
fi

Onde:
Li – Limite inferior da classe mediana.
P á g i n a 31 | 44
Compilado Por: Esmail Henriques
f ac1 - Frequência absoluta acumulada até a classe anterior a classe mediana.

hi - Amplitude da classe mediana.

f i - Frequência absoluta da classe mediana.

Exemplo 1:
Determinar a mediana da seguinte distribuição:
Classes f ai f ac

[5, 10[ 5 5
[10, 15[ 3 8
[15, 20[ 8 16
[20, 25[ 6 22
[25, 30[ 5 27
[30, 35[ 4 31
 31

Para a determinação de valores separatrizes (Mediana, Quartís, Decís, Centís ou Percentís) temos
que preencher na tabela uma coluna das frequências absolutas acumuladas. (3ª coluna da tabela
acima).
Implementação dos passos:
n 31
1º Passo-   15,5
2 2
2º Passo - olhando para a coluna das f ac de cima para baixo, observa-se que o primeiro valor

n
maior que  15,5 é o 16. Este 16 está na linha onde aparece a classe [15, 20[, esta é a nossa
2
classe mediana.
3º Passo - Aplica-se da fórmula
f ac1  8 e f ai  8

n
 f ac1
~
2 15,5  8 7.5 37,5
x  Li  * hi  15  * 5  15  * 5  15   19,6875  19,69
f ai 8 8 8

P á g i n a 32 | 44
Compilado Por: Esmail Henriques
MEDIDASDE DISPERSÃO
Nesta lição, você deverá prestar muita atenção aos seguintes termos econceitos:
 Tabela de cálculos auxiliares
 Desvio-médio, variância, desvio-padrão e coeficientes de variação

Desvio - médio

 Para dados não agrupados


n

x
i 1
i x
Dm 
n

 Para dados agrupados e ponderados


m

 fi x
i 1
i x
Dm 
n

N.B. quanto maior for o desvio- médio, maior é o afastamento dos valores observados em
relação à média ou seja, maior é a dispersão dos dados.
Exemplo: Seja x= 2,5,8,15,20  , calcular Dm.

x
 xi  2  5  8  15  20  10
n 5
2  10  5  10  8  10  15  10  20  10
Dm  6
5
Variância
Os matemáticos procuram uma fórmula que nos permite avaliar a dispersão relativamente à
média sem que aparecesse o símbolo do valor absoluto; isto é, uma fórmula em que o
aparecimento de números negativos foi resolvido com «o elevar ao expoente 2»; isto é: (xi- x )2.
A variância de um conjunto de dados x1, x2,...., xn, representa se por  2 ou S2 , quando se refere a
população e amostra respectivamente. E calcula-se:
Para dados não agrupados
2
 n 
n n
  xi 
n n

 xi  x   xi  x  xi   i 1 
2 2 2 2
x i
2
 n
População: 2  i 1
 i 1
x ; Amostra: S 2  i 1
 i 1
n n n 1 n 1

P á g i n a 33 | 44
Compilado Por: Esmail Henriques
Para dados agrupados e ponderados
m m

 fi * xi  x 
2 2
 fi * x i
2
População:  2  i 1
 i 1
x ;
n n
2
 m 
m m
  fi * xi 
    fi * xi 2   i 1 
2
fi * xi  x
n
Amostra: S 2  i 1
 i 1

n 1 n 1

DESVIO- PADRÃO
É a raiz quadrada positiva da variância e representa-se por  ou S, para população e amostra
respectivamente.
Para dados não agrupados

n n

 xi  x 
2 2
 xi
População:   i 1
 i 1
 x2
n n

n n
( xi ) 2
 xi  x 
2 2 i 1

i 1
 xi
i 1

n
Amostra: S  
n 1 n 1

Para dados ponderados e agrupados em classe


m m

   2 2
fi * xi  x  fi * xi
População:   i 1
 i 1
 x2
n n
2
 m 
m m
  fi * xi 
   fi * xi 2   
2 i 1

i 1
fi * xi  x 
i 1 n
Amostra: S  
n 1 n 1

O desvio- padrão é a medida de dispersão mais usada.


Para grande valor (n>30) não há praticamente diferença entre as duas definições de  2 e S2.
quando necessária melhor estimativa use sempre S2 para variância e S para o desvio -Padrão.

P á g i n a 34 | 44
Compilado Por: Esmail Henriques
Coeficiente de variação
A variação ou dispersão real, determinada a partir do desvio-padrão, ou qualquer outra medida de
dispersão, é denominada dispersão absoluta.
Dispers a~oabsoluta
Dispersão relativa 
Media
Se a dispersão absoluta é o desvio-padrão  e a média é a aritmética x , a dispersão relativa é
denominada coeficiente de variação de Pearson (CVp) ou de dispersão, dado por:
 S
CVp   100 % ou CVp   100 %
x x
É mais utilizado quando desejamos comparar diversas grandezas com unidades de medidas que
podem ser iguais ou diferentes. Ou ainda quando apresentam médias diferentes, embora suas
unidades de medidas sejam iguais.
Exemplo:
Suponha que determinado que determinado fornecedor A, de parafusos tenha enviado ao
Departamento de compras de uma empresa uma amostra de 2000 parafusos, com medidas de seu
comprimento em mm variando entre 101 e 113mm.O Departamento de compras efectuou uma
análise em suas médias e calculou seu respectivo desvio-padrão, encontrando as seguintes
especificações:
 Comprimento médio do parafuso: 107,9mm
 Desvio-padrão do comprimento do parafuso: 2,72mm

Admitindo-se um fornecedor B, que apresentou um lote deste mesmo parafuso com o mesmo
número de peças, com média x  108 mm e desvio-padrão S=1,08mm, qual é o lote que você
escolheria se fosse o comprador?
Resolução:
Fornecedor A: Fornecedor B:
2,72mm 1,08mm
CVp   0,0252  2,52% CVp   0,01  1,00%
107,9mm 108mm
Resp: iria escolher o lote do fornecedor B que apresenta menor dispersão relativa do que o lote do
fornecedor A.

P á g i n a 35 | 44
Compilado Por: Esmail Henriques
7. Quartís ( Qc ) c=1, 2, 3

Definição: são valores separatrizes que dividem os dados em quatro (4) partes iguais,
correspondendo a cada uma 25%.
Já vimos como determinar os quartís para dados isolados, ou seja, dados não agrupados em
classes.
Agora nos interessa determinar os quartís para dados agrupados numa tabela de classes.
Q1 = 1º quartil, deixa abaixo de si 25% dos elementos.
Q2 = 2º quartil, coincide com a mediana, deixa abaixo de si, 50% dos elementos.
Q3 = 3º quartil, deixa abaixo de si, 75% dos elementos.
Para a determinação dos quartís para dados agrupados numa tabela de classes, segue-se os
seguintes procedimentos:
cn
1º - determinar
4
2º - Identifica-se a classe mediana a partir das frequências absolutas acumuladas (a classe que
cn cn
apresenta primeira f ac  , isto é, identificar a primeira f ac  ).
4 4
cn
 f ac1
3º - Aplicar a fórmula: Qc  Li  4 * hi
f ai

Onde:
Li – Limite inferior da classe Quartil desejado.
f ac1 - Frequência absoluta acumulada até a classe anterior a classe quartil.

hi - amplitude da classe Quartil (Qc).

f ai - Frequência absoluta da classe Quartil (Qc).

Exemplo:
Determinar o primeiro quartil (Q1) e o terceiro quartil (Q3) dos dados constantes da tabela acima:
Resolução
Determinação de Q1 (c=1)
n 31
1º Passo:   7,75
4 4
2º Passo: O primeiro valor das facmaior que 7,75 é 8. Então a classe [10, 15[ é a classe Q1.

P á g i n a 36 | 44
Compilado Por: Esmail Henriques
n
 f ac1
3º Passo: Aplica-se a fórmula: Q1  Li  4 * hi
f ai

n
 f ac1
4 7,75  5 13,75
Q1  Li  * hi  10  * 5  10   14,5833333  14,58
f ai 3 3
Determinação de Q3 (c=3)
3  n 3  31
1º Passo:   23,25
4 4
2º Passo: O primeiro valor das facmaior que 23,25 é 27. Então a classe [25, 30[ é a classe Q3.
3n
 f ac1
3º Passo: Aplica-se a fórmula: Q3  Li  4 * hi
f ai

3 n
 f ac1
4 23,25  22
Q3  Li  * hi  25  * 5  25  1,25  26,25
f ai 5
Este valor significa que 75% dos dados estão abaixo de 26,25 visto que quartís dividem os dados
duma distribuição em quatro (4) partes iguais.

Tarefa: Leitor determine Q2. Compare o resultado obtido com a mediana dos dados da mesma
tabela.

8. Decís ( Dc ) c = 1, 2, 3, ..., 9

Definição: são valores separatrizes que dividem os dados em Dez (10) partes iguais,
correspondendo a cada uma 10%.
Como você já deve ter percebido, a fórmula neste caso também é semelhante às separatrizes
anteriores. Ei-la:
cn
1º Passo: Calcula-se em que c = 1, 2, 3, 4, 5, 6, 7, 8 e 9.
10
2º Passo: Identifica-se a classe Dc pela fac.
cn
 f ac1
3º Passo: Aplica-se a fórmula: Dc  Li  10 * hi
f ai

P á g i n a 37 | 44
Compilado Por: Esmail Henriques
Exemplo:
Determinar o terceiro Decil (D3) dos dados constantes na tabela acima:
3  n 3  31
1º Passo: Calcula-se   9,3
10 10
2º Passo: O primeiro valor das facmaior que 9,3 é 16. Então a classe [15, 20[ é a classe D3.
3 n
 f ac1
3º Passo: Aplica-se a fórmula: D3  Li  10 * hi
f ai

3n
 f ac1
10 9,3  8 6,5
D3  Li  * hi  15  * 5  15   15,8125  15,81
f ai 8 8

Este valor significa que 30% dos dados estão abaixo de 15,81.

Tarefa: Leitor determine D1, D5, D7. Compare o resultado de D5 com o valor da mediana. Diga o
que observou?

9. Centís ou Percentís ( Dc ) c = 1, 2, 3, ..., 9

Definição: são valores separatrizes que dividem os dados em cem (100) partes iguais,
correspondendo a cada uma 1%.
Como você já deve ter percebido, a fórmula neste caso também é semelhante às separatrizes
anteriores. Ei-la:
cn
1º Passo: Calcula-se em que c = 1, 2, 3, ...,99.
100
2º Passo: Identifica-se a classe Pc pela fac.
cn
 f ac1
3º Passo: Aplica-se a fórmula: Pc  Li  100 * hi
f ai

Exemplo:
Determinar o sexagésimo quarto Percentil (P64) dos dados constantes na tabela acima:

P á g i n a 38 | 44
Compilado Por: Esmail Henriques
64  n 64  31
1º Passo: Calcula-se   19,84
100 100
2º Passo: O primeiro valor das facmaior que 19,84 é 22. Então a classe [20, 25[ é a classe P64.
3º Passo: Aplica-se a fórmula:
64  n
 f ac1
P64  Li  100 * hi
f ai

64  n
 f ac1
19,84  16 3,84 19,2
P64  Li  100 * hi  20  * 5  20  * 5  20   23,2
f ai 6 6 6

Este valor significa que 64% dos dados estão abaixo de 23,2.

Tarefa: Leitor determine P35, P50, P75. Compare os resultados de P50 e Q2, P75 e Q3. Diga o que
observou?

Caros estudantes\Formandos resolvam as avaliações e trabalhos apresentados


no anexo

P á g i n a 39 | 44
Compilado Por: Esmail Henriques
7. ANEXOS
7.1. AUTO AVALIAÇÃO

UNIVERSIDADE CATÓLICA DE MOÇAMBIQUE INSTITUTO


DE ENSINO À DISTÂNCIA
1º ANO - CURSO DE BIOLOGIA / 2022 1ª ACTIVIDADE DE
ESTATÍSTICA

O instituto Nacional de Estatística(INE) levou a cabo pela primeira vez no ano 2020, uma
actividade de fixação de placas informativas sobre o número de habitantes a cada ProvÍncia e
principal fronteiras, no âmbito de divulgação dos resultados finais do IV recenseamento Geral da
População e habitação 2017. A populacao projectada por sexo em todo pais em 2021 foi num
total de 30.832.244 habitantes dos quais 14.885.787 Sexo Masculino e 15.946.457 do sexo
Feminino. (FONTE: ine.gov.mz)

Proque a estatistica é uma ciência que faz parte em tudo que envolve a nossa vida pessoal e
profissional de um modo geral. “Porque estudar estatistica na Biologia”

Parte I:
1. -Numa página, fundamente a importância do estudo da Estatística no Curso de Biologia.
2. - Apresente alguns exemplos da sua aplicabilidade na prática das actividades no cotidiano.
3. Em quantas partes se divide a estatística e quais são as áreas de estudo de cada uma delas?
4. Com base na afirmação divulgada pelo INE referente aos números de habitantes feita acima,
identifique o tipo de estudo feito segundo as características variáveis estudadas.
5. Dê 2 exemplos de cada, para Estatística Variável Quantitativa Discreta e contínua
6. Quais sãos as Medidas de tendência Central e Medidas de Dispersão

Parte II:
1. De uma pauta onde estavam registadas os resultados de um teste de estatística e cuja as notas
atribuidas variam de 7 a 14, registaram se as seguintes classificações:
11, 8, 11,8, 12, 14, 9, 11, 10, 13, 12, 9, 11, 10, 9, 8, 11 ,8 , 18, 10, 10, 10.

P á g i n a 40 | 44
Compilado Por: Esmail Henriques
a) Calcule a Moda, Média, Mediana, Variação e desvio padrão
b) Determine a tabela de frequências (absoluta, relativa, absoluta acumulada e relativa acumulada.
c) Contrua o histograma

2. O quadro de distribuição abaixo representa as alturas de 200 jovens,


Altura Xi
(em cm) ni
160-165 8
165-170 15
170-175 10
175-180 40
180-185 90
185-190 20
190-195 15
195-200 2

b) Classe da Mediana
c) Classe Modal
d) Ponto médio da classe
e) Amplitude da classe

Epifania Chaves
Abril de 2022

P á g i n a 41 | 44
Compilado Por: Esmail Henriques
Instituto de Ciências de Saúde de Nampula
A.C.S1 de Introdução de Bioestatística
Curso: SMI - Nivel Médio Turma: 6
Docente: dr. Tocoloa Data: 20/05/2009
=====================================================================
1) Considere a seguinte afirmação: “Um grupo de 300 jogadores de andebol foi
aleatoriamente escolhido em todas as províncias de Moçambique, para estudar o problema
de lesões.”
a) Indique a população, amostra e a unidade estatística.
b) Indique como seria feita a amostra casual simples.
2) As idades dos funcionários de uma escola são as seguintes:
32 54 34 45
45 35 54 32
54 45 32 35
45 54 45 35

a) A partir destes dados, construam uma tabela de frequências de dados simples.


b) Construir um gráfico de barras.
3) Registou-se o número de bebes nascidos na maternidade de um hospital em cada um dos
dias do mês de Agosto, tendo-se obtido os seguintes valores. Com log 30 = 1,477.

3 1 2 3 0 2 4 3 4 2
3 2 1 2 2 0 4 3 1 1
4 3 3 2 1 3 2 0 3 2
a) Construa uma tabela de frequência em classe.
b) Faça o respectivo histograma.
4) Interrogaram-se 16 casais acerca do seu número de filhos, tendo-se obtido os seguintes
valores: 1 0 2 1 3 2 1 2 3 4 0 1 1 2 2 4
a) Calculem a média aritmética.
b) Calculem a mediana.
c) Indique a moda.

Fim
Boa sorte

P á g i n a 42 | 44
Compilado Por: Esmail Henriques
UNIVERSIDADE CATÓLICA DE MOÇAMBIQUE
Instituto de Ensino à Distancia
Curso de Educação Física 2020

1º Trabalho de Estatística

PARTE I
Com base em conhecimentos relativos a estatística, responde as seguintes questões
1. Explique:
1.1.A importância do estudo de estatística no curso de Educação Física. (0,75)
1.2. A importância de uso de tabela e gráficos na estatística. (0,75)
1.3. A importancia da sondagem e, de um exemplo concreto para área de Educação Física. (0,75)

2. Diferencie:
2.1. Amostragem aleatória e Amostragem estratificada. (0,75)
2.2. Estatatística Descritiva e Estatística Inferencial. (0,75)
2.3. Variável ordinal e variável discreta. (0,75)
2.4. Variável contínua e variável nominal. (0,75)

PARTE II
1. Na tabela abaixo, estão contidas amostras de notas de três estudantes do curso de
Educação Física.
A 10 13 9 12 5 17
B 10 10 13 11 11 11
C 18 12 9 05 20 02

1.1. Determine a média, o desvio padrão e o coeficiente de variação das notas de cada candidato.
(2,0)
1.2. Qual é o candidato com notas mais homogêneas? (0,75)

P á g i n a 43 | 44
Compilado Por: Esmail Henriques
PARTE III

Alturas (em 1. Os dados ao lado são referentes a altura de uma parte de estudantes do
Fi
cm) curso de Educação Física.
[160; 165[ 3 1.1. Construir a tabela (1,5)
[165; 170[ 12 1.2. Qual é a percentagem de estudantes com menos de 175cm? (0,5)
[170; 175[ 13 1.3. Qual é a percentagem de estudantes com altura maior ou igual a 175 cm? (0,5)
[175; 180[ 10 1.4. Determine a média, a mediana e a moda (czuber). 3,0)
[180; 185[ 4 1.5. Qual é o valor de Q2, D8 e P90. (1,5)
[185; 190[ 2 1.6. Determine o desvio padrão e o coeficiente de variação dos pesos dos

[190; 195[ 2 estudantes. (2,0).

Elaborado por: Nilton Maumane

P á g i n a 44 | 44
Compilado Por: Esmail Henriques

Você também pode gostar