Você está na página 1de 35

ESCOLA SECUNDÁRIA DE NAMPULA

TRABALHO DE EM GRUPO DE MATEMÁTICA

Tema: Estatística

CLASSE: 10ª

TURMA: B1 /2

Docente:
_______________

NAMPULA, AGOSTO DE 2023


ESCOLA SECUNDÁRIA DE NAMPULA

TRABALHO DE EM GRUPO DE MATEMÁTICA

Nomes dos elementos do grupo: 10ª Classe, Turma: B1 /2

Escola Secundária de Nampula

Nampula, Setembro de 2023


Índice
INTRODUÇÃO...............................................................................................................................4

1. ESTATÍSTICA............................................................................................................................5

1.2. CONCEITO DE POPULAÇÃO E AMOSTRA.......................................................................6

1.3. APLICAÇÕES DA ESTATÍSTICA.........................................................................................6

1.4. CARACTERÍSTICAS DA INFORMAÇÃO ESTATÍSTICA.................................................7

1.5. FASES DO MÉTODO ESTATÍSTICO...................................................................................7

1.5. ESTATÍSTICA NAS EMPRESAS..........................................................................................8

2. ESTATÍSTICA DISCRITIVA....................................................................................................9

2.1 ORGANIZAÇÃO DE DADOS ESTATÍSTICOS....................................................................9

TIPOS DE VARIÁVEIS.................................................................................................................9

2.2 COLECTA DE DADOS..........................................................................................................11

3. DISTRIBUIÇÃO DE FREQUENCIAS....................................................................................12

3.1 COMPONENTES BÁSICAS DE UMA TABELA................................................................12

3.2 DISTRIBUIÇÃO DE FREQUÊNCIA....................................................................................13

3.3 APRESENTAÇÃO DE TABELAS........................................................................................16

3.3.2. VARIÁVEIS QUANTITATIVAS......................................................................................17

3.4 GRÁFICOS ESTATÍSTICOS.................................................................................................21

3.5 RECOLHA DE DADOS.........................................................................................................21

3.6 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS.............................................................21

3.6.1. GRÁFICO DE SECTORES................................................................................................21

3.6.2. DIAGRAMA DE BARRAS................................................................................................24

4.1 GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS..........................................................26

4.1.1 HISTOGRAMA....................................................................................................................26

4.1.2. POLÍGONO DE FREQUÊNCIA........................................................................................27


4.1.3 GRÁFICO DE FREQUÊNCIA ACUMULADA OU OGIVA............................................28

4.1.4 DIAGRAMA DE RAMO-E-FOLHAS................................................................................28

4.2 DISTRIBUIÇÕES SIMÉTRICAS...........................................................................................31

1.1 MÉDIA ARITMÉTICA NÃO PONDERADA.......................................................................32

1.2 MÉDIA ARITMÉTICA PONDERADA.................................................................................32

1.2.1. DADOS AGRUPADOS SEM INTERVALOS DE CLASSE.............................................32

1.3. MEDIANA.............................................................................................................................33

1.3.1. MEDIANA PARA DADOS NÃO AGRUPADOS.............................................................33

1.3.2. MEDIANA PARA DADOS AGRUPADOS.......................................................................33

1.4. MODA....................................................................................................................................34

1.4.1. MODA PARA DADOS AGRUPADOS.............................................................................34

CONCLUSÃO...............................................................................................................................35
Introdução
O presente trabalho é de carácter avaliativo e em grupo, visa abordar conteúdos relacionados
com o tema de Estatistica.

Sendo este trabalho plural (em grupo) é praticamente de investigação e sem esquecer dizer que é
da disciplina de Matematica. E este trabalho tem como objectivo de aumentar o conhecimento do
aluno e também objectivo de ser avaliado com o docente. Esperamos que goste do trabalho.

E o trabalho está estruturado da seguinte forma:

 Capa
 Contracapa
 Introdução;
 Desenvolvimento;
 Conclusão; e
 Bibliografia.
1. Estatística
1.1. Objecto da Estatística e breve nota histórica sobre a sua evolução na vida moderna

Estatística pode ser definida como o ramo da Matemática aplicada que fornece um conjunto de
métodos científicos de colecta, organização, resumo, descrição, análise e interpretação de dados
visando estudar e medir os fenómenos colectivos, bem como a utilização dos mesmos na tomada
de decisões.

A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de
eventos, estudos e experimentos, que tem por objectivo obter, organizar e analisar dados,
determinar as correlações que apresentem, tirando delas suas consequências para descrição e
explicação do que passou e previsão e organização do futuro.

1.2. Conceito de população e amostra


População ou Universo é a totalidade dos elementos que apresentam pelo menos uma
característica em comum no objecto de estudo, isto é, o conjunto de todos os itens, objectos,
coisas ou pessoas a respeito das quais a informação é desejada para a solução de um problema.

Amostra é um subconjunto ou parte das unidades estatísticas seleccionadas por um método


cuidadosamente concebido e projectado a partir de uma população.

As inferências sobre a população baseadas na amostra podem não ser absolutamente certas.
Portanto, o uso da Teoria de Probabilidade se torna indispensável para apresentar as conclusões.

1.3. Aplicações da estatística


A estatística tem basicamente duas finalidades: descrever os fenómenos e suas características e
fazer predições sobre as ocorrências futuras de certo fenómeno em condições semelhantes
àquelas em que ele ocorreu no passado.

Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já
que eles nos capacitam a responder a um vasto número de questões, entre outras as seguintes:

• Como os Cientistas avaliam a validade de novas teorias?


• Como os investigadores testam a eficiência de novas drogas?

• Como os Demógrafos prevêem o tamanho da população do mundo em qualquer tempo futuro?

• Como pode um Economista verificar se a mudança actual no Índice de Preços ao Consumidor


(IPC) é a continuação de uma tendência secular, ou simplesmente um desvio aleatório?

• Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas
algumas centenas de eleitores.

1.4. CARACTERÍSTICAS DA INFORMAÇÃO ESTATÍSTICA


A informação estatística é um instrumento ao serviço do desenvolvimento de uma realidade. É
um meio, não um fim porque ela está ao serviço do utilizador de dados estatísticos –
governantes, gestores, homens de negócios, sociólogos, investigadores, etc.

Pela natureza da informação estatística ela deve obedecer as seguintes características: Qualidade,
Actualidade e Utilidade.

1.5. FASES DO MÉTODO ESTATÍSTICO


Para realizarmos uma pesquisa estatística, é preciso seguir algumas etapas para se obter o melhor
resultado possível. Tais etapas ou fases devem ser bem definidas antes da pesquisa, pois qualquer
falha em alguma dessas fases poderá trazer graves problemas tais como a repetição da pesquisa
ou invalidação da mesma.

Podemos dividir o método estatístico em seis fases, abaixo descritas:

i. Definição do problema: você deve saber exactamente aquilo que pretende investigar. Para tal
o problema e os objectivos da investigação devem ser claramente definidos.

ii. Planeamento: logo no início de qualquer investigação você deve procurar responder as
seguintes perguntas, entre outras questões: Que dados deverão ser obtidos? Que tipo de
amostragem será usada? Que instrumento será usado para a colecta de dados?Qual será o
tamanho da amostra? Qual será o cronograma das actividades? Quais serão os custos
envolvidos?
iii. Colecta de dados: esta corresponde a fase operacional da pesquisa. É o registo sistemático de
dados, com um objectivo previamente determinado;

iv. Apuramento e limpeza dos dados: nesta fase você deve fazer uma análise exploratória dos
dados para identificar valores extremos, valores estranhos, e erros na recolha e digitação dos
dados. Para além disso, você deve resumir os dados através de sua contagem e agrupamento,
resultando em tabulação de dados;

v. Apresentação dos dados: Há duas formas de apresentação, que não são mutuamente
exclusivas, nomeadamente apresentação tabular e apresentação gráfica. A apresentação tabular é
a apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado.
Enquanto a apresentação gráfica dos dados numéricos constitui uma apresentação geométrica
permitindo uma visão rápida e clara do fenómeno;

vi. Análise e interpretação dos dados: Corresponde a última fase do trabalho estatístico e é a
mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja
finalidade principal é descrever o fenómeno sem pretender tirar conclusões de carácter mais
genérico (estatística descritiva). Na estatística indutiva, os resultados obtidos da análise de uma
amostra da população servem de base para como o apoio da teoria da probabilidade, se possa
inferir, estimar ou induzir as leis de comportamento da população da qual a amostra foi tirada.

1.5. ESTATÍSTICA NAS EMPRESAS


A direcção de uma empresa, de qualquer tipo, incluindo privadas e governamentais, exige de seu
administrador a importante tarefa de tomar decisões. Neste processo de tomada de decisões, o
conhecimento e o uso da Estatística facilitam ao administrador o seu tríplice trabalho de
organizar, dirigir e controlar a empresa.

Por meio de sondagem, de colecta de dados e de recolha de opiniões, podemos conhecer a


realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, assim
como as expectativas da comunidade sobre a empresa. Fazendo o uso das ferramentas
Estatísticas, também podemos estabelecer metas e objectivos com maior possibilidade de serem
alcançados no curto, médio ou longos prazos. Decisões estatísticas são aquelas tomadas com
base em informações amostrais. “O executivo de negócios é por profissão, um tomador de
decisão.

A tomada de decisões é o núcleo da responsabilidade administrativa. O administrador deve


constantemente decidir o que fazer, quem deve fazer, quando, onde e, muitas vezes, como fazer.
O homem de hoje, em suas múltiplas actividades, deve fazer uso de processos e técnicas
estatísticos. Só estudando-os evitaremos o erro das generalizações apressadas a respeito de
tabelas e gráficos apresentados em jornais, revistas e televisão.

2. ESTATÍSTICA DISCRITIVA
A colecta de dados estatísticos tem crescido muito nos últimos anos em todas as áreas de
pesquisa, especialmente com o aparecimento dos computadores e surgimento de softwares cada
vez mais sofisticados.

A área de Estatística Descritiva compreende às seguintes tarefas:

1) Encontrar um método apropriado de recolha de dados numéricos eficientemente para um dado


problema.

2) Determinar um formato eficiente, tal como uma apresentação tabular, para a organização dos
dados de uma forma sistemática e ordenada, de maneira que a informação fornecida pelos dados
possa ser observada com grande facilidade e precisão.

3) Apresentar dados numéricos, sejam organizados ou não, de forma que as características e o


comportamento dos dados sejam facilmente revelados. Tais apresentações são feitas por meio de
métodos gráficos.

2.1 ORGANIZAÇÃO DE DADOS ESTATÍSTICOS

Tipos de variáveis
Existem diversos tipos de variáveis que podem ser utilizadas em um estudo estatístico. É
importante compreender o conceito matemático de variável. Variável é uma abstracção que se
refere a um determinado aspecto do fenómeno.
Variável é a característica de interesse que é medida em cada elemento da amostra ou
população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis
podem ter valores numéricos ou não numéricos. As variáveis são normalmente representadas
porsímbolos ou letras maiúsculas, tais como X , Y ou Z .

Variáveis quantitativas: são as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido. As variáveis quantitativas
podem ser contínuasou discretas.

Variáveis quantitativas contínuas: características mensuráveis que assumem valores em uma


escala contínua, para as quais valores decimais fazem sentido. Usualmente devem ser medidas
através de algum instrumento. Exemplos: peso, altura, tempo, e pressão arterial.

Variáveis quantitativas discretas: Correspondem a características mensuráveis que podem


assumir apenas um número finito ou infinito contável de valores. Sendo assim, somente fazem
sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos,
número de bactérias por litro de leite, número de cigarros fumados por dia.

Variáveis qualitativas(ou categóricas): são as características que não possuem valores


quantitativos, mas, ao contrário, são definidas por variáveis categóricas, ou seja, representam
uma classificação dos indivíduos. Elas podem ser nominaisou ordinais.

Variáveis qualitativas nominais: são variáveis qualitativas para as quais não existe ordenação
dentre das categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio.

Variáveis qualitativas ordinais: são variáveis qualitativas para as quais existe uma ordenação
entre as categorias. Exemplos: Nível de escolaridade (1o, 2o, 3o graus), estágio da doença
(inicial, intermediário, terminal), mês de observação (Janeiro, Fevereiro, Dezembro).

Uma variável originalmente quantitativa pode ser colectada de forma qualitativa. Por exemplo, a
variável idade, quando medida em anos completos, é quantitativa contínua. Mas, se a variável
idade for classificada em faixas etárias (tais como 0 a 5 anos, 6 a 10 anos, etc.), é qualitativa
ordinal. Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se
trabalhamos com o valor obtido na balança, mas qualitativa (ordinal) se a classificarmos em
categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).
2.2 COLECTA DE DADOS
Após a definição do problema a ser estudado e o estabelecimento do planeamento da pesquisa
(forma pela qual os dados serão colectados, cronograma das actividades, custos envolvidos,
exames das informações disponíveis, delineamento da amostra, etc.), o passo seguinte é a colecta
de dados, que consiste na busca ou aplicação dos dados das variáveis, componentes do fenómeno
a ser estudado. Os dados podem ser classificados como:

• Dados primários: quando são publicados pela própria pessoa ou organização que os tenha
recolhido. Ex: tabelas do censo demográfico do Instituto Nacional de Estatística (INE).

• Dados secundários: quando são publicados por pessoa ou organização que não os tenha
recolhido. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico
extraídas do INE.

A colecta de dados pode ser directa ou indirecta.

A colecta de dados é directa quando os dados são obtidos na fonte originária. Os valores assim
compilados são chamados de dados primários, como, por exemplo, dados obtidos em pesquisas
de opinião pública, vendas registadas em notas fiscais da empresa, contagem do número de
carros que passa por dia em um cruzamento, etc.

A colecta de dados é indirecta quando os dados obtidos provêm de colecta directa. Os valores
assim complicados são denominados de dados secundários, como, por exemplo, o cálculo do
tempo de vida média, obtido pela pesquisa, nas tabelas demográficas publicadas pelo Instituto
Nacional de Estatística – INE, utilização de dados publicados pelo Instituto Nacional de
Meteorologia, etc.

Quanto ao tempo, a colecta de dados pode ser classificado como:

 Contínua: quando se realiza permanentemente (registos de nascimento, óbitos, casamentos,


etc.);
 Periódica: quando é feita em intervalos de tempo (recenseamento demográfico, censo
industrial) e
 Ocasional: quando efectuado sem época preestabelecida. (registo de casos de certo tipo de
doença rara).
Objectivando a eliminação de erros capazes de provocar futuros enganos de apresentação e
análise, procede-se a uma revisão crítica dos dados, suprimindo os valores estranhos ao
levantamento.

3. DISTRIBUIÇÃO DE FREQUENCIAS
A análise estatística se inicia quando um conjunto de dados se torna disponível de acordo com a
definição do problema da pesquisa. Um conjunto de dados, seja de uma população ou de uma
amostra, contem muitas vezes um número muito grande de valores. Além disso, esses valores, na
sua forma bruta, encontram-se muito desorganizados. Os dados precisam então ser organizados
e apresentados em uma forma sistemática e sequencial por meio de tabelas ou gráficos.

3.1 COMPONENTES BÁSICAS DE UMA TABELA


Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:

o Título: Conjunto de informações, as mais completas possíveis, localizadas no topo da tabela,


normalmente respondendo às perguntas: O quê? Onde? Quando?
o Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.
o Coluna indicadora: Parte da tabela que especifica o conteúdo das linhas.
o Linhas: Rectas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem nos seus cruzamentos com as colunas.
o Casa ou célula: Espaço destinado a um só número.
o Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as
notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados.
Exemplo:

Moçambique – Estimativa de População

1970 93.139
1971 95.993
1972 98.690
1973 101.433
1974 104.243
1975 107.145
1976 110.124
Fonte: INE

3.2 DISTRIBUIÇÃO DE FREQUÊNCIA


Distribuição de frequências é uma tabela em que os dados são agrupados com as suas respectivas
frequências absolutas. Nesta secção, você ira estudar com algum detalhe as distribuições de
frequências porque estas representam o tipo de tabela mais importante na área de Estatística
Descritiva. Dados Brutos: são os dados originais que ainda não se encontram numericamente
organizados.

Exemplo:

os dados brutos a seguir apresentados correspondem as idades dos funcionários da empresa


Monitorilandia.

24 21 34

23 25 21

22 36 31

28 26 25

35 22 31

21 30 26

23 32 25

33 25 35

34 26 33

24 33 31

Rol estatístico ou simplesmente Rol é uma lista em que os valores ou dados numéricos são
dispostos em uma determinada ordem, crescente ou decrescente. Usando os dados das idades dos
funcionários da Monitorlandia, obteríamos o seguinte rol estatísticos:

21 25 31
21 25 32

21 25 33

22 26 33

22 26 33

23 26 34

23 28 34

24 30 35

24 31 35

25 31 36

Amplitude total ou “range” ( A) é obtida pela diferença entre o maior e o menor valor
observados. Com base no exemplo anterior, 36 21 15 A= − = .

Número de classes (K ): De modo a interpretar melhor o que esses números exprimem, os


intervalos (classes) devem ser, preferencialmente, igualmente espaçados. O número de classes
depende do número de observações (n) e do grau de dispersão dos dados.

Matematicamente, o número de classes é dado por:

K=
{√5nPara n ≤25
para n>25

Por exemplo, para 49 n= , o numero de classes é definido como sendo K= √ 49=7 .

Amplitude das classes (h): A especificação da largura do intervalo é uma consideração


importante. Intervalos muito grandes resultam em um número reduzido de classes de intervalo, e
vice-versa. A amplitude das classes é dada pela seguinte relação

Amplitude A
h =
Numero de classes n
Assim como no caso do número de classes (K ), a amplitude das classes (h) deve ser aproximada
por excesso para o maior número inteiro. Assim, se K =6,4 , você deve arredondar para K = 7
ou, se h =1,7 você deve arredondar para h = 2 .

Limites das classes: Existem diversas maneiras de expressar os limites das classes. A seguir são
listadas algumas das maneiras para expressar os limites de classes:

a) [20,23] : compreende todos os valores entre 20 e 23. Nesta denotação, o 20 representa o limite
inferior da classe, enquanto o 23 denota o limite superior da classe;

b) [20,23[ : compreende todos os valores entre 20 e 23, excluindo o 23;

c) ]20,23] : compreende todos os valores entre 20 e 23; excluindo o 20. Nesta unidade, usar-se-á
a forma expressa no exemplo b.

Ponto médio da classe ( Xi) é a média aritmética entre o limite superior e o limite inferior de
uma determinada classe.

Assim, se a classe for [23 ,20], o ponto médio desta classe será dado como

20+ 23
Xi= =21 ,5
2

Frequência absoluta simples f i ou f (.)é o número de vezes que um determinado elemento


aparece na amostra, ou, o número de elementos pertencentes a uma determinada classe. Usando a
informação das idades dos funcionários da Monitorlandia apresentado no exemplo anterior,
f ( 21 )=3 . Isto significa que existem 3 funcionários com 21 anos de idade. Usando os dados
apresentados no exemplo, você deve verificar que de facto existem 3 funcionários com 21 anos
de idade.

Frequência absoluta acumulada ( f i) representa a soma das frequências absolutas simples dos
valores iguais ou inferiores a determinado valor.

Frequência relativa f r denota a percentagem de um determinado valor na amostra. A frequência


relativa de um determinado valor é dada por
fi
f r= ×100 %
n

n
n=∑ f i=f 1 + f 2 +…+ f n
i−1

Onde:

Frequência relativa acumulada ( f r) é a soma das frequências relativas dos valores iguais ou
inferiores ao um determinado valor.

3.3 APRESENTAÇÃO DE TABELAS


3.3.1. Variáveis Qualitativas A apresentação dos dados estatísticos na forma de tabelas consiste
na reunião ou agrupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los
de modo ordenado, simples e de fácil percepção e com economia de espaço. Suponha-se que se
pretende estudar a marca de computadores portáteis preferida pelos estudantes do ensino
superior. Para alcançar este objectivo, foram entrevistados 35 estudantes. Com base nas
entrevistas foram obtidos os seguintes dados:

COMPAQ COMPAQ IBM TOSHIBA


TOSHIBA COMPAQ IBM IBM

FUJITSU COMPAQ COMPAQ TOSHIBA

ACER FUJITSU TOSHIBA ACER

FUJITSU IBM COMPAQ ACER

HP ACER IBM FUJITSU


COMPAQ COMPAQ IBM FUJITSU

IBM TOSHIBA ACER COMPAQ


TOSHIBA IBM ACER

Para construir a tabela de frequências deve-se proceder à contagem do número de vezes que cada
uma das marcas é mencionada pelos estudantes. Você deve verificar que a marca COMPAQ foi
mencionada 9 vezes. Portanto, este valor representa a frequência absoluta da marca para
COMPAQ. Por outro lado, a frequência relativa desta marca é dada por
9
×100=25 , 7 %
35

A tabela de frequências para os dados apresentados acima é representada na tabela abaixo. Esta
tabela de frequência permite-nos saber a distribuição das preferências dos 35 elementos da
amostra relativamente às marcas de computadores portáteis.

Marca de PC Frequencia absoluta ( Frequencia relativa ( f r) %


f i)
COMPAQ 9 25.7
HP 1 2.9
TOSHIBA 6 17.1
ACER 6 17.1
IBM 8 22.9
FUJITSU 5 14.3
Somatório (∑ ¿ 35 100

Esta tabela representa a distribuição das preferências dos estudantes entrevistados em termos de
marcas de computadores portáteis. A tabela mostra que com cerca de 26% dos estudantes,
COMPAQ é a marca de computador mais preferida, seguida da IBM com 23%.

3.3.2. Variáveis Quantitativas


No caso de variáveis quantitativas discretas, desde que o espaço amostral não tenha dimensões
muito elevadas, o procedimento utilizado para construir tabelas de frequências é idêntica ao que
foi apresentado para as variáveis qualitativas. Exemplo: Suponhamos o seguinte conjunto de
dados:

14 13 11 15

16 13 15 13

11 12 15 14
14 13 13 12

12 14 12 16

12 14 17

14 14 13

Para representar a distribuição de frequências desses dados, você deve primeiro verificar quais
são os possíveis valores observados para a variável de interesse. Esses possíveis valores da
variável de interesse são colocados na primeira coluna da tabela de frequências. Enquanto o
número de repetições de cada um dos possíveis valores da variável de interesse são colocados na
segunda coluna da tabela de frequências. Usando os dados do exemplo acima apresentado, a
distribuição de frequências será representada da seguinte tabela:

Valor fi fr Fi Fr
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000

TOTAL 26 1,0000
Mas quando tratamos de variáveis quantitativas contínuas os valores observados devem ser
tabulados em intervalos de classes. Para a determinação dessas classes não existe uma regra pré
estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada.
Suponhamos que o volume de milho produzido, em uma determinada região seja dado pela
tabela a seguir:
Ano Milho (1000 t) Ano Milho (100 t)
1 280 10 365
2 305 11 280
3 320 12 375
4 330 13 380
5 310 14 400
6 340 15 371
7 310 16 390
8 340 17 400
9 369 18 370

Você deve saber que alguns passos devem ser seguidos para a tabulação de frequências de dados
que se referem a uma variável quantitativa contínua, como é o caso de nosso anterior exemplo.

1) Definir o número de classes. O número de classes não deve ser muito baixo nem muito alto.
Um número de classes pequeno gera amplitudes de classes grandes o que pode causar distorções
na visualização dos dados. Um número de classes grande gera amplitude de classes muito
reduzidas. Foram definidas regras práticas para a determinação do número de classes, sendo que
este deve variar entre 5 e 20 (5 para um número muito reduzido de observações e 20 para um
número muito elevado). Se n representa o número de observações (na amostra), o número de
classes, K , é calculado como sendo K= √ n . No caso do exemplo anterior temos, sabemos que
n= 18, portanto K= √ 18=4 ,2

2) Calcular a amplitude das classes. Uma vez conhecidos o número de classes e a amplitude
total dos dados, a amplitude das classes por ser calculada.

3) Preparar a tabela de selecção com os limites de cada classe. Na tabela abaixo,


apresentamos para os dados do nosso exemplo os limites inferiores e superiores de cada uma das
5 classes de frequência.

Classe Limite inferior Limite Superior

1 280 304
2 304 328
3 328 352
4 352 376
5 376 400

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior da
classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observação seja exactamente
igual ao valor do limite de classe deve-se estabelecer um critério de inclusão. Para evitar esse
tipo de dificuldade normalmente se estabelece que o limite superior de cada classe é aberto (e
consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe
não inclui o valor de seu limite superior, com excepção da última classe.

4) Agrupar os dados por classe de frequência. A partir da listagem de dados se determina para
cada um deles a sua classe de frequência. Em seguida, se calcula as frequências de cada uma das
classes.

De acordo com o nosso exemplo, teremos:

Classes Frequencia absoluta ( f i) Frequencia relativa ( f r) %


[280 – 304[ 2 0,11 (11 %)
[304 – 328[ 4 0,22 (22 %)
[328 – 352[ 3 0,17 (17 %)
[352 – 376[ 5 0,28 (28 %)
[376 – 400[ 4 0,22 (22%)
Total 18 1,00 (100 %)

3.4 GRÁFICOS ESTATÍSTICOS


O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objectivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do
fenómeno em estudo. Apesar do grande impacto visual, a representação gráfica de um fenómeno
deve obedecer a certos requisitos fundamentais para ser realmente útil:
▪ Simplicidade: o gráfico não deve ter detalhes de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma análise com erros.

▪ Clareza: o gráfico deve possibilitar uma correcta interpretação dos valores representativos do
fenómeno em estudo.

▪ Veracidade: o gráfico deve expressar a verdade sobre o fenómeno em estudo. Você deve ser
muito cuidadoso ao fazer e interpretar representações gráficas pois o uso indevido de gráficos
pode induzir a uma leitura falsa dos dados que estão sendo analisados, chegando mesmo a
confundir o leitor. Este problema de interpretação está, muitas vezes, relacionado com a
construção de escalas.

3.5 RECOLHA DE DADOS


Principalmente devido ao uso de computadores, é muito comum nos dias de hoje realizarem-se
pesquisas que resultam na colecta de uma grande variedade de dados que devem ser analisados.
Muitas vezes, torna-se muito difícil entender os dados recolhidos caso estes não estejam
devidamente resumidos.

3.6 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS


Dois tipos de gráficos podem ser usados para representar as variáveis do tipo qualitativas,
nomeadamente os de sectores e os de barras.

3.6.1. GRÁFICO DE SECTORES


Os gráficos de sectores, mais conhecidos como gráficos de pizza ou torta, são construídos
dividindo-se um círculo (pizza) em sectores (fatias). Cada sector representa uma categoria e o
seu tamanho é proporcional à frequência relativa da categoria representada por este mesmo
sector.

Esta variável mostra a distribuição de número de estudantes por sexo.

Sexo Frequência absoluta ( f i) Frequência relativa ( f r) %


Feminino 12 55
Masculino 10 45

Total 22 100

Nas tabelas de frequência, como o próprio nome diz, apresentam as frequências com que
ocorrem cada uma das categorias da variável de interesse comparativamente ao total.

Para construir gráficos de sectores, devemos primeiro calcular a proporção de cada categoria no
círculo. Para o exemplo da variável sexo, usando a frequência relativa, a contribuição
proporcional dos estudantes do sexo feminino é dada por:

100% −−−−−−360º

55%−−−−−− x

Você deve provavelmente saber que um círculo corresponde a 360 graus o que é equivalente a
frequência relativa total (100%). Com base na frequência absoluta, a contribuição dos estudantes
do sexo feminino é dada por:

22−−−−−− 360

12 −−−−−− x

55 % ×360 °
O valor de x é obtido através do uso da regra de três simples, ou seja, x= =196 ° ou,
100 %
55 % ×360 °
x=
25 %

Com ajuda do transferidor e compasso, desenhamos um círculo e medimos 1960 que


correspondem a fatia do número de estudantes do sexo feminino.

100% −−−−−−360º 22 −−−−−− 360

Ou

45%−−−−−− x 12 −−−−−− x
Calculamos o x e obtemos a fatia correspondente ao número de estudantes do sexo masculino.
Antes de proceder com a leitura, você deve calcular a porção do círculo correspondente aos
estudantes do sexo masculino. Depois de calculados as fatias correspondentes a cada uma das
categorias, o gráfico de sectores pode ser ilustrado como:

Masculino
10
Feminino 45%
12
55%

Figura 1. Gráfico de sectores para variável sexo

Através da Figura 1, fica mais fácil perceber que o número de estudantes do sexo feminino é
maior que o número de estudantes do sexo masculino. Como esta figura contém toda a
informação apresentada na Tabela , esta figura pode substituir esta tabela com a vantagem de
tornar a análise dessa variável mais atraente.

Para além de variáveis qualitativas, os gráficos de sectores também podem ser usados para
ilustrar graficamente variáveis quantitativas desde que estas estejam organizadas em classes
(categorizadas).

Tabela 2. Distribuição de frequência da variável idade

Faixa etária (anos) Frequência absoluta ( f i) Frequência relativa ( f r) %


[18 - 22 [ 11 50,0
[22 – 26[ 6 27,3
[26 - 30 [ 2 9,1
[30 - 34 [ 1 4,5
[34 - 38 [ 2 9,1
Total 22 100,0
3.6.2. DIAGRAMA DE BARRAS
Uma alternativa ao gráfico de sectores é o gráfico de barras como o da Figura 3.

Ao invés de dividirmos um círculo, dividimos uma barra. Note que, em ambos os gráficos, as
frequências relativas das categorias devem somar 100%.

Fe-
menino
Sexo

Masculino

0 1 2 3 4 5 6 7 8 9 10
Frequencia relativa

Figura 2.Frequência relativa para a variavel sexo

Uma situação diferente ocorre quando desejamos comparar a distribuição de frequências de uma
mesma variável em vários grupos, como por exemplo, a frequência de estudantes do sexo
feminino em quatro regiões do país.

Se quisermos usar o gráfico de sectores para fazer essa comparação, devemos fazer quatro
gráficos, um para cada região com duas fatias cada um. Uma alternativa é a construção de um
gráfico de barras (horizontal ou vertical) como ilustrado na Figura 4, com uma barra para cada
região. Assim, podemos representar a frequência de estudantes do sexo feminino de cada região.
60

50
Frequência relativa

40

30

20

10

0
Norte Centro Sul

Figura 3. Frequência relativa dos estudantes do sexo feminino por região

A ordem dos grupos pode ser qualquer, ou aquela mais adequada para a presente análise.
Frequentemente, encontramos as barras em ordem decrescente, já antecipando nossa intuição de
ordenar os grupos de acordo com a sua frequência para facilitar as comparações. Caso a variável
fosse do tipo ordinal, a ordem das barras seria a ordem natural das categorias, como na tabela de
frequências.

A Figura 4 mostra um gráfico de barras que pode ser usado para comparar a distribuição de
frequências relativas de uma mesma variável em vários grupos. Este gráfico também representa
uma alternativa ao uso de vários gráficos de sectores, sendo, na verdade, a junção de três
gráficos, num só gráfico.

Pobres

Nao pobres

Total

0 20 40 60 80 100 120

Figura 4. Distribuição de frequência relativa da variável raça em varios grupos (pobres e nao
pobres)
Observação: Este tipo de gráfico só deve ser usado quando não houver muitos grupos a serem
comparados e a variável em estudo não tiver muitas categorias (de preferência, só duas como
ilustrado na Figura acima).

Através desse gráfico, podemos observar que a população moçambicana total, em 1960, dividia-
se quase que igualmente entre brancos e negros, com uma pequena predominância de brancos.
Porém, quando nos restringimos às classes menos favorecidas economicamente, essa situação se
inverte, com uma considerável predominância de negros, principalmente na classe da população
considerada indigente, indicando que a classe socioeconómica influencia a distribuição de negros
e brancos na população moçambicana de 1960.

4.1 GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS

4.1.1 HISTOGRAMA
É um gráfico de colunas justapostas que representa uma distribuição de frequência para dados
contínuos ou uma variável discreta quando esta apresentar muitos valores distintos.

No eixo horizontal são dispostos os limites das classes segundo as quais os dados foram
agrupados enquanto o eixo vertical corresponde às frequências absolutas ou relativas das
mesmas.

Quando os dados são distribuídos em classes de mesma amplitude, Figura 5 (a), todas as colunas
apresentam bases iguais com alturas variando em função das suas frequências absolutas ou
relativas. Neste caso, a área de cada rectângulo depende apenas da sua altura enquanto no caso
de dados agrupados em classes de dimensões diferentes, como mostra a Figura 5 (b), a área de
cada coluna já não é mais proporcional à sua altura.
38 40
34 35
30
30
26
22 25

18 20

15

10

0
(a) Amplitude iguais

45
40
35
30
25
20
15
10
5
0
(b) Amplitude desiguais

Figura 6.Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM

4.1.2. POLÍGONO DE FREQUÊNCIA


É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abcissas
correspondentes aos pontos médios de cada classe e as ordenadas, às frequências absolutas ou
relativas dessas mesmas classes.

O polígono de frequência é um gráfico que deve ser fechado no eixo das abcissas (Figura 8).
Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e
outra à direita, ambas com frequências zero. Tal procedimento permite que a área sob a linha de
frequências seja igual à área do histograma.

Uma das vantagens da aplicação de polígonos de frequências é que, por serem gráficos de linhas,
permitem a comparação entre dois ou mais conjuntos de dados por meio da superposição dos
mesmos.

45
40
35
30
25
20
15
10
5
0
Figura
8. Polí-
gono de
fre-
quência
com
base na
idade
dos
alunos
da dis-
ciplina
Inferên-
cia Es-
tatística
do
curso de
Estatís-
tica da
UEM

4.1.3 GRÁFICO DE FREQUÊNCIA ACUMULADA OU OGIVA


Histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da
frequência acumulada. Permite descrever dados quantitativos por meio da frequência acumulada.
A ogiva é um gráfico de linha que une os pontos cujas abcissas são os limites superiores das
classes, e, ordenadas suas respectivas frequências acumuladas.

4.1.4 DIAGRAMA DE RAMO-E-FOLHAS


O diagrama Ramo-e-Folhas, criado por John Tukey, é um procedimento utilizado para armazenar
os dados sem perda de informação. É utilizado para se ter uma ideia visual da

distribuição dos dados. Cada valor observado, i x , da variável X , deve ter no mínimo dois
dígitos e a variável pode ser tanto quantitativa discreta como contínua.

Para construir o diagrama de Ramo-e-Folhas, cada número deve ser dividido em duas partes. A
primeira parte é denominada por ramo enquanto a segunda é denominada por folha. O ramo
consistirá de um ou mais dígitos iniciais se o valor da variável for um número inteiro e do
número inteiro, se o valor da variável for um número com decimais. Nas folhas, colocam-se os
dígitos restantes se o valor observado for número inteiro ou caso contrário, as decimais.

A Tabela 4 apresenta o Ramo-e-Folhas correspondente a variável idade do aluno. Você deve


notar que o primeiro ramo (o ramo correspondente ao digito 1) mostra que existem 2 alunos com
18 anos de idade e 1 aluno com 19 anos de idade. Por outro lado, o ultimo ramo (o ramo
correspondente ao digito 3) mostra que existem 3 alunos com idade igual ou superior a 30 anos:
o primeiro aluno tem 30 anos, o segundo tem 35 anos enquanto o terceiro tem 37 anos de idade.

Ramo Folha Frequência


1 889 3
2 0 0 0 0 0 0 1 1 2 3 4 5 55 6 9 16
3 057 3
O estudante deve ter notado que o ramo correspondente ao dígito 2 tem muitas folhas. Neste
caso, a opção é dividir este ramo em dois: as folhas de 0 a 4 pertencerão a uma linha e as folhas
de 5 a 9 pertencerão à outra linha. Neste caso, a segunda linha do ramo deve ser discriminada por
um sinal de asterisco no seu expoente, como apresentado:

Ramo Folha Frequência


1 889 3
2 00000011234 11
2* 5 55 6 9 5
3 05 7 3
Depois de ter aprendido diferentes maneiras de apresentar os dados graficamente, você deve
pegar numa caneta e folha de papel para aprofundar os seus conhecimentos.

Actividade: construa um gráfico adequado para os dados abaixo apresentados referentes às


idades de ursos em meses.

8 19 57 81

9 20 57 82

11 44 57 83
17 45 58 100

17 53 70 104

Para visualizar a distribuição dos valores de idade, usaremos um diagrama de ramo-e folhas, já
que um histograma resumiria mais ainda algo que já está resumido. Podemos organizar os dados,
separando-os pelas dezenas, uma em cada linha, como apresentado na Figura 10 abaixo.

0 89

1 1779

2 0

4 45

5 37778

7 0

8 123 Legenda

9 5 3 = 53 meses

10 04 10 4 = 104

Figura 10. Distribuição da idade dos ursos

ASPECTOS GERAIS

Alguns histogramas apresentam formas que, pela frequência com que surgem, merecem
referência especial. Assim, as distribuições mais comuns apresentadas pelos dados são:

• Distribuições simétricas

• Distribuições enviesadas
4.2 DISTRIBUIÇÕES SIMÉTRICAS
Diz se que os dados tem uma distribuição simétrica quando o gráfico (histograma) dos dados
frequências têm uma forma aproximadamente simétrica, relativamente a uma classe média.

Um caso especial de uma distribuição simétrica é aquele que sugere a forma de um "sino" e que
é apresentado por amostras provenientes de Populações "Normais".

Distribuições simétricas
70
60
50
40
30
20
10
0
Figura 11. Distribuições simétricas

4.3 DISTRIBUIÇÕES ENVIESADAS

A distribuição das frequências tem uma forma acentuadamente assimétrica, apresentando valores
substancialmente mais pequenos num dos lados relativamente ao outro como mostrado na figura:

16

14

12

10

0
enviesada para a direita enviasada para a esquerda
MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal
denominação pelo facto de os dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais. Existem muitos tipos de medidas de tendência central. Dentre elas as mais
comuns são:

• A média;

• A mediana;

• A moda.

Cada medida de tendência central tem as suas vantagens e desvantagens que dependem dos
dados e do propósito da questão em estudo.

1.1 MÉDIA ARITMÉTICA NÃO PONDERADA


Para um conjunto de dados, podemos definir vários tipos de médias. Quando desejamos conhecer
a média dos dados não agrupados, determinamos a média aritmética simples. A média é definida
como a soma das observações dividida pelo número de observações.

Se tivermos, por exemplo, n valores, temos:

∑ xi
x + x + …+ x n i=1
X= 1 2 =
n n

1.2 MÉDIA ARITMÉTICA PONDERADA


No cálculo da média aritmética não ponderada todos os valores observados foram somados
atribuindo-se o mesmo peso a todas observações. Agora veremos uma nova forma de calcular a
média.

1.2.1. DADOS AGRUPADOS SEM INTERVALOS DE CLASSE


Para melhor entender o cálculo da média aritmética ponderada para dados agrupados sem
intervalos de classe, consideremos um exemplo numérico.
1.3. MEDIANA
A mediana, Me, de um conjunto ordenado de dados é definida como sendo o valor central (ou
“valor do meio”) desse conjunto de dados, dispostos em ordem crescente, deixando metade dos
valores acima dela e outra metade dos valores abaixo dela.

1.3.1. MEDIANA PARA DADOS NÃO AGRUPADOS

Número impar de observações Quando o número de observações é ímpar, existe apenas um valor
central que é a mediana. Para exemplificar o cálculo da mediana quando temos um número ímpar
de observações, considere o seguinte conjunto de dados.

{2,0;3,3;2,5;5,6;5,0;4,3;3,2}

Para calcular a mediana, devemos primeiro ordenar os dados em ordem crescente.

{2,0;2,5;3,2;3,3;4,3;5,0;5,6}

O valor central é 3,3. Então, a mediana é 3,3.

Número par de observações

Quando o número de observações é par, existem dois valores centrais, a mediana é a média
aritmética simples dos valores centrais.

A mediana pode ser formalmente definida como o valor que divide a série de tal forma que no
mínimo 50 % dos itens são iguais ou menores do que ela, e no mínimo 50 % dos itens são iguais
ou maiores do que ela.

1.3.2. MEDIANA PARA DADOS AGRUPADOS


O método usado é o da interpolação utilizando-se a distribuição de frequência acumulada ou
ogiva. Inicialmente determina-se a classe que contém a mediana. Essa será a classe cuja
frequência acumulada relativa correspondente a seu limite inferior é menor que 0,50 (ou 50 por
cento) e a frequência acumulada relativa correspondente a seu limite superior é maior que 0,50
(ou 50 por cento).
1.4. MODA
A moda, Mo, de um conjunto de dados é o valor que ocorre com maior frequência, ou seja, é o
valor mais comum num conjunto de dados. Para o caso de valores individuais, a moda pode ser
determinada imediatamente através da observação directa do rol de dados ou da frequência
absoluta dos dados. Para um determinado conjunto de dados, a moda pode não existir, e caso
exista, pode não ser única. Em seguida, apresentamos alguns exemplos ilustrativos.

A moda é a única medida de tendência central que faz sentido no caso de variáveis qualitativas.
Assim, a categoria dessas variáveis que aparecem com maior frequência é chamada de categoria
modal.

1.4.1. MODA PARA DADOS AGRUPADOS


a) Dados sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor
da variável que tem maior frequência.

b) Dados com intervalos de classe

No caso em que temos dados agrupados em classes (distribuição de frequências), primeiramente


é necessário identificar a classe modal, aquela que apresenta a maior frequência.

Por definição, podemos afirmar que a moda, no caso de dados agrupados com intervalos de
classe, é o valor dominante que está compreendido entre os limites inferior e superior da classe
modal.

O método mais simples para o cálculo da moda consiste em considerar o ponto médio da classe
modal como a moda. A moda obtida através deste método é denominada por moda bruta.
Conclusão
Nesta parte conclusiva importa salientar que o tema de Estatística foi-se finalizando com breve
abordagem.

Com a ternura, amor e carinho da disciplina de Matemática, fizemos o nosso trabalho com muita
atenção a fim de ganhar muita informação tais quais o nosso trabalho apresenta.

Com a mesma consideração esperamos que o seja bem-vindo nas mãos de quem vai apreciar
(Professor).

No entanto, esperamos a boa percepção assim como resultado.

Você também pode gostar