Você está na página 1de 20

Índice

Introdução..........................................................................................................................3

Dados agrupados...............................................................................................................4

Representação na tabela de frequência..........................................................................4

Passos para construir a tabela de Frequência.................................................................4

Exemplo de algumas tabelas de frequência...................................................................7

O gráfico estatístico...........................................................................................................9

Tipos de Medidas de tendência Central.......................................................................10

MÉDIA........................................................................................................................10

MEDIANA......................................................................................................................12

FICHA DE EXERCÍCIOS..............................................................................................16

População.....................................................................................................................16

Variável........................................................................................................................16

Variáveis Qualitativa.......................................................................................................16

Variáveis nominais: não existe ordenação dentre as categorias......................................16

Conclusão........................................................................................................................17

Referência Bibliográfica..................................................................................................18
2

Introdução

No presente trabalho falarei de uma forma resumida em torno dos dados agrupados,
onde no tema teremos os seus respetivos exemplos uma definição simples para facilitar
a compreensão, o trabalho ao todo é constituído basicamente por 18 páginas onde as 15
primeiras falam em torno dos dados agrupados, a sua representação gráfica e a sua
representação na tabela de frequência e por final falarei das medidas. As últimas páginas
estão recheadas de exercícios.
3

Dados agrupados
Suponhamos que alguém vai á rua e pergunta às pessoas o número de filhos que cada
pessoa tem. E as pessoas respondem:

A primeira pessoa diz ter 1;

A segunda pessoa diz ter 5;

A terceira pessoa diz ter 0;

A quarta pessoa diz ter 1;

A quinta pessoa diz ter 0

A sesta pessoa diz ter 4.

Se olharmos esses dados notará que eles não estão agrupados nos colocamos de acordo
com a ordem que fomos perguntar as pessoas. Então para agrupar faremos o seguinte:

X Y
0 2
1 2
4 1
5 1
Na tabela acima mostra um agrupamento dos dados. Na tabela dos x mostra o número
de folhos que as pessoas na rua disseram ter, e na dos y representa quantas pessoas tem
esse número de filhos que cada pessoa tem. Isso constitui um agrupamento de dados.

Representação na tabela de frequência


Uma distribuição de frequência é um método de se agrupar dados em classes de modo a
fornecer a quantidade (e/ou a percentagem) de dados em cada classe Com isso ,
podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os
valores individuais. Uma distribuição de frequência (absoluta ou relativa) pode ser

Apresentada em tabelas ou gráficos.

Passos para construir a tabela de Frequência


1º Coletar os dados, que são os dados brutos.

2º Montar o rol, isto é, uma tabela de contagem (ou marcação) da variável, em ordem
crescente ou decrescente, com suas respetivas repetições ou frequências.
4

Rol

3º Determinar o número de classes (k) que a tabela de frequência deverá ter:

4º Determinar a amplitude total dos dados (A ou AT):

5º Determinar o tamanho do intervalo de cada classe (h), isto é, a amplitude de cada


intervalo de classe:

6º Determinar os tipos de intervalo de classes, que podem ser:

a) Intervalo semifechado à esquerda – o elemento à esquerda está excluído do intervalo


de classe ( ).

b) Intervalo semifechado à direita – o elemento à direita está excluído do intervalo de


classe ( ).

c) Intervalo fechado – os dois valores, li e o ls, pertencem ao intervalo de classe (


).

d) Intervalo aberto – os dois valores, li e o ls, não serão contados nesse intervalo de
classe ( ).

7º Montar a Tabela: podemos (sugestão) iniciar o primeiro limite inferior (li) de classe
com a menor observação (mínimo) do Rol e, a partir daí, ir sempre adicionando a
amplitude (h) para obter o limite superior (ls) até que o número de classes (k) se esgote.
5

Obs.
(1) A Tabela não pode ser fechada nas laterais e internamente, portanto, deixe-a sem
linha e coluna visível.

(2) Caso os dados não se distribuam pelas classes, podemos aumentar a amplitude do
intervalo ou coletar mais informações.

Tabela de Frequência

Onde:
li(1) significa limite inferior da 1ª classe e ls(1) limite superior da 1ª classe e assim
sucessivamente;
f(k) é a frequência absoluta da k-ésima classe.

Ao iniciar a primeira classe, devemos escolher qual o tipo de intervalo é o mais


conveniente, de modo que todos os dados do Rol estejam distribuídos pelas classes, não
se perdendo nenhuma informação.

8º Após estabelecer os limites de classes, devemos fazer as contagens de quantos


elementos pertencem a cada intervalo de classe, que são as frequências absolutas (fi) , 1
i k. Devemos sempre tomar cuidado para nunca deixar a primeira classe e a última
sem nenhuma contagem de observação. Quanto às intermediárias, podem ter frequência
zero.

9º Com isso, agrupamos os dados em forma de classes, adotando, aqui, que todas as
classes devam ter o mesmo tamanho (h). Na prática, porém, podemos agrupar os dados
de acordo com a necessidade e/ou conveniência, sem que todas as classes tenham
necessariamente o mesmo tamanho.

10º Estabelecer os outros elementos que compõem as colunas da Tabela:

a) Ponto médio (PM): PM = (li + ls) / 2 – que será o representante de sua classe;
6

b) Frequência relativa (fr): fr = fi / n;

c) Frequência percentual (fp): fp = fr * 100 %;

d) Frequência acumulada (fa);

e) Frequência relativa acumulada (fra);

f) Frequência percentual acumulada (fpa);

g) E outras não mencionadas.

Exemplo de algumas tabelas de frequência


Adotemos o conjunto de dados que represente a população ordene em ordem crescente
ou decrescente.

Calcular amplitude das classes

Essa será obtida conhecendo-se o número de classes e amplitude total de dados.


7

valor maximo−valor minimo


Amplitude de classes=
numero de classes

430−280
Amplitude de classes = =30
5

Limite das classes

•[x,y) – intervalo de entre x (fechado) atéy (aberto)

Frequentemente temos que “arredondar “a amplitude das classes e, consequentemente,


arredondar também os limites das classes.

Como sugestão, podemos tentar, se possível, um ajuste simétrico nos limites das classes
das pontas (i.e., primeira e última) nas quais, usualmente, a quantidade de dados é
menor.

Ponto médio das classes

xk= Linferior+ ( Lsuperior–Linferior) / 2

Frequências absolutas Distribua os eventos ou ocorrência por suas respetivas classes


Frequências acumuladas Some as ocorrências de dados cumulativamente às classes
Observação importante: muito útil representar as frequências em termos percentuais ao
total de amostras0,06DadosClasseFrequênciaFrequência.

O gráfico estatístico – é uma forma de apresentação de dados estatísticos, cujo


objectivo é produzir, no investigador ou no público em geral, uma impressão mais
rápida e viva do fenómeno em estudo, já que já que os gráficos falam mais rápido a
compreensão que as series. O gráfico de barras constrói-se colocando no eixo horizontal
os valores observados e no eixo vertical a frequência absoluta ou relativa
correspondente.
8

Medidas de tendência central (para dados agrupados)

A maioria dos dados apresenta uma tendência de se concentrarem em torno de um ponto


central.

As medidas de tendência central são valores que, de certa forma, e de maneira


condensada, trazem consigo informações contidas nos dados estatísticos.

Elas funcionam como uma espécie de “medidas-resumo”, pois nos passam a ideia do
comportamento geral das observações estudadas. Podemos dizer ainda que elas são
como valores de referência, em torno dos quais, os outros se distribuem.

Nesse contexto, salienta-se a necessidade de abordar a diferença entre dois termos


bastante utilizados no estudo de medidas de tendência central, os parâmetros e as
estatísticas.

Parâmetros: Os dados recebem esta nomenclatura quando estão associados aos dados
populacionais.

Estatísticas: Estes dados recebem essa nomenclatura Quando são calculados.


9

Dados obtidos através de uma pesquisa realizada em todo o mundo se tratam de


parâmetros. Entretanto, se realizarmos a pesquisa apenas no Brasil, tem-se dados
estatísticos, pois, o Brasil representa uma amostra de todo o mundo.

Tipos de Medidas de tendência Central


Existem vários tipos de medidas utilizadas como medidas de tendência central. Todavia,
abordaremos as mais utilizadas:

• Média;

• Moda e

• Mediana.

MÉDIA
Média Aritmética, ou simplesmente média, é uma medida que funciona como o ponto
de “equilíbrio” de um conjunto de dados, é representada pela letra grega, quando seu
cálculo é feito a partir de todos os valores de uma população.

Se usarmos dados amostrais para obtê-la, a mesma é referida como ̅ (ler-se “Xis barra”).

1º Caso: Para dados isolados ou não tabelados

A média é a soma de todos os valores analisados, dividida pela quantidade de valores


analisados.

X 1+ X 2+ X 3+… Xn
X=
n

Ex: Suponha que suas notas em uma seleção para um curso de aperfeiçoamento foram
5,6; 4,8; 8,0; 8,6; 6,8; 9,4. Então, se todas têm o mesmo peso, sua média será:

5,6+4,8+ 8.0+8,6+6,8+ 9,5 43,2


X= = =7,2
6 5

Observe que para calcular a média nós somamos todos os valores e dividimos pela
quantidade desses valores.

2º Caso: Para dados organizados em uma tabela de frequências

Frequênci Pontuação
10

a
4 6 24
6 8 48
8 5 40
9 5 45
10 3 30
Total 27 187

Neste caso, a média é dada da seguinte forma:

4.6+6.8+ 8.5+9.5+10.3 187


X= = =6.92
6+8+ 5+5+3 27

Observe que para calcular a média, nós multiplicamos a pontuação pela sua respetiva
frequência. Para o Cálculo da média, somam-se essas multiplicações e divide pelo
somatório das frequências.

3º Caso: Para dados agrupados em intervalos de classe.

Na tabela abaixo, pode-se observar três intervalos de classe. Cada intervalo possui uma
frequência e um ponto médio.

O ponto médio é obtido através da soma do limite superior com o limite inferior,
dividida por dois. Para classe 1 tem-se:

4+ 6 10
Xi= = =5
2 2

Observação:

A média é afetada por valores extremos.

O que isso quer dizer?

Para calcular a média, é necessário somarmos todos os dados da série, ou seja, essa
medida leva em conta todas as observações. Por isso, quando temos uma situação em
que aparecem alguns valores, ou muito baixo, ou muito alto, se comparados com os
demais elementos da série, a média é influenciada por eles. Onde 4 e 6 correspondem,
respetivamente, ao limite inferior e superior da primeira classe.
11

MEDIANA
Mediana ( ) é definida como o valor que ocupa a posição central em um conjunto de
dados ordenados.

A mediana não é influenciada por valores extremos, visto que ela é uma medida
essencialmente vinculada à posição que ocupa no conjunto ordenado.

Para encontrar a mediana em um conjunto qualquer de dados estatísticos, precisamos


conhecer a posição que ela ocupa em relação aos elementos ordenados desse conjunto.

Para tal, devemos considerar duas situações para as quais adotaremos distintos
procedimentos.

1ª Situação: Dados agrupados ou tabelados

Inicialmente, precisamos construir o rol, ou seja, os valores do conjunto de forma


ordenada. Esta ordenação pode ser em ordem crescente ou decrescente. Em seguida,
devemos calcular o elemento mediano ().

O é a posição que a mediana ocupa no conjunto ordenado.

Para obtermos a mediana, precisamos primeiramente analisar o número de elementos do


conjunto (), identificando se este número é par ou ímpar.

A seguir veremos como proceder em cada situação.

 Sen for ímpar:

Quando n é ímpar haverá apenas um valor central no conjunto ordenado, cuja posição é

n+1
calculada pela fórmula: EMd=
2

MODA

Por definição, a moda de um conjunto de dados é o valor que aparece mais vezes, ou
seja, é aquele que apresenta a maior frequência.

Pode ocorrer de dois ou mais valores apresentarem a mesma frequência, nestes casos,
teremos distribuições bimodais (duas modas), trimodais ou multimodais.
12

Também é possível acontecer que todos os elementos tenham apresentado exatamente o


mesmo número de ocorrências. Isso significa que não há moda, pois nenhum dado se
destacou. Dessa forma, o conjunto é, então, chamado amodal.

Dentre as três medidas de tendência central, a moda é a única que pode ser usada
quando as variáveis são qualitativas nominais.

Ex.: Se distribuíssemos os alunos de engenharia por sexo e obtivéssemos que 70% são
meninos, poderíamos dizer que a moda é o sexo masculino, pois essa categoria
apresentou a maior frequência.

Para obtermos a moda ( ) faremos uma simples inspeção em relação às repetições dos
valores.

No caso das tabelas, observaremos as frequências absolutas simples (). Procuramos,


então, qual(is) o(s) valor(es) que apresenta(m) o maior número de ocorrências
(repetições). Este(s) valor(es) é (são) denominado(s) moda.

Medidas de tendência central

Seja X uma variável aleatória cujos valores numéricos são: x1, x2, ..., xn..

As medidas de tendência central têm a finalidade de dar informações resumidas sobre os


dados, que são:

 Média ( ) – É o elemento de tendência central da Tabela de Frequência. O seu


cálculo consiste em somar o produto do ponto médio (PM, que indicaremos por
xi), multiplicado pela frequência (PM*fi = xi* fi) e dividido pelo tamanho da
amostra.

Lê-se somatória de xi* fi para i = 1, ..., k dividida por n.

Assim, temos que:


13

 Moda (mo) – para encontrar o valor modal, primeiramente, devemos selecionar


a classe com a maior frequência (classe modal) e, depois, aplicar a fórmula de
King, a seguir, para determinar o seu valor:

Onde:
fpost – frequência da classe posterior à classe modal
fant – frequência da classe anterior à classe modal

Obs: Existem outras maneiras de encontrar o valor modal.

 Mediana (md) – tem o mesmo conceito dos dados não-agrupados, isto é, é o


valor que deixa 50% das observações à sua esquerda ou ponto de corte de 50%.
Para determinarmos o valor mediano, primeiramente, devemos encontrar a
classe que contém esse valor mediano, através da fórmula (n+1) / 2 e, depois,
compará-lo na frequência acumulada. Determinada a classe, utilizaremos a
seguinte fórmula para encontrar o valor mediano:

Onde:
fa.ant – frequência acumulada anterior à classe mediana

Medidas de dispersão

As medidas de dispersão têm a finalidade de encontrar um valor que resuma a


variabilidade dos dados:

 Variância (Var(X) = S2) – é uma boa medida de dispersão, mas de difícil


interpretação. É a soma das distâncias de cada número em relação à média
elevada ao quadrado, multiplicada pela sua respetiva frequência absoluta (fi) e
dividida Por (n-1):
14

Onde: xi equivale ao ponto médio, o representante de classe.

 Desvio padrão (d.p.(X) = S) – mede o grau de afastamento de um conjunto de


dados em relação à sua média; seu cálculo é a raiz quadrada da variância:

 Coeficiente de variação (c.v.(X)) – é uma medida de dispersão relativa. Se


desejarmos saber se a dispersão é muito grande em relação à média, calculamos
o coeficiente de variação:

Obs.: Estamos admitindo que a média da amostra ( ) Esteja próxima do valor da média
populacional ( ) e que a variância da amostra (S 2) esteja próxima da variância
populacional ( 2), o mesmo valendo para o desvio padrão amostral (S). A divisão por
(n-1) funciona melhor quando estamos procurando estimar a variância ou o desvio
padrão de uma população com base em uma amostra. A Estatística também prova que é
um estimador não-viciado.
15

FICHA DE EXERCÍCIOS
1.populacão- conjunto de elementos com uma ou mais características comuns.
Geralmente representa-se por N.

População – é o conjunto de objetos, indivíduos ou resultados experimentais acerca do


qual se pretende estudar.

Variável - é qualquer característica comum aos elementos de uma população a qual se


possa atribuir um número ou uma categoria, podendo assumir valores diferentes de
unidade obrigacional.

Variáveis Qualitativa
As variáveis qualitativas são as características que não atribuem valores quantitativos.

Variáveis nominais: não existe ordenação dentre as categorias


Sexo dos estudantes de administração pública, cor dos olhos, variedade de verduras.

Variáveis ordinais: existe uma ordenação entre as categorias

Exemplos: nível de escolaridade ( 1̊,2̊,3̊ graus), classificações nas avaliações.

Variáveis quantitativas

As variáveis quantitativas são características que podem ser descritas por números,
sendo estas classificadas em contínuas e discretas.

Variáveis discretas a variável é avaliada em números que são resultados de contagens


e, por isso, somente fazem sentido números inteiros.

Variáveis continuas a variável é avaliada em números que são resultados de medições


e, por isso, podem assumir valores em casas decimais e devem ser medidas por meio de
algum instrumento. Exemplo: alturas de casas, classificações de avaliações.
16

Exercício 2

Populações finitas

a) Alunos do 1̊ ano no curso de Direito do ISPU


b) Conjunto de pessoas que nasceram no hospital provincial de pemba em
2003.
c) Extração, com reposição, de uma carta de baralho
d) Número de processos julgados por tribunal durante o ano judicial

Exercício 3

a) Finita
b) Infinita
c) Infinita
d) Finita

Exercício 4

Qualitativos: cores de cabelo, Sexo

Quantidades: raça, idade de uma pessoa, marca de um automóvel, temperatura de um


lugar.

Exercício 6

a) 10 Pessoas
b) Estado civil.

a) A população alvo são estudantes


b) O tamanho da amostra é de 50
c) A unidade estática é de 97

e.
Ordem Xi Fi Fr Fiac Fr%
01 0 5 5 0,1 10
02 7 4 9 0,08 8
03 10 5 14 0,1 10
04 14 3 17 0,06 6
05 15 8 25 0,16 16
06 16 6 31 0,12 12
07 17 6 37 0,12 12
18 8 45 0,16 16
08
09 19 5 50 0,1 10
∑ 50 1 100%
17

y
18
16 16 16
16
14
12 12
12
10 10 10
10
8
8
6
4
2
0
0 7 10 14 15 16 17 18 19

f Menos de uma hora de voo tem 5 alunos


Entre 15-18 horas de voo tem 28 alunos
Menos de 10 e mais de 7 horas têm 4 alunos
g Mais de 10 horas de voo 10%
Mais de 19 horas de voo 16%
Mais de 5 horas e menos de 15 horas 12%
Mais de 19 horas 100%
Complete a tabela

Ordem Filhos Fi Fiac Fr Fr%


01 0 25 25 0,16667 16,667
02 1 15 40 0,1 10
03 2 30 70 0,2 20
04 5 15 85 0,1 10
05 8 65 150 0,43333 43,333
Total 150 1 100
18

a) A variável em estudo são estudantes


b) Foram inqueridas 50 famílias
c) 70 Casais tem menos de 3 filhos
d) A percentagem dos com 2 filhos é de 20
e) A percentagem dos pais com menos de 5 filhos e mais de 0 filhos é de
56,667
19

Conclusão
Com o trabalho dado eu pude aprender muito sobre o tema referente ao dados agrupados
onde no tema tive a possibilidade de defini-la, dar alguns exemplos e as suas
representações estas que foram: representação na tabela de frequência e gráfica, também
falou de medidas onde nas medidas falei de 3 tipos nomeadamente: medida de tendência
central, medida de dispersão e medida de tendência não central. E conclui o trabalho
com exercícios. O trabalho foi concluído com sucesso espero que eu receba criticas
positivas tanto como negativa obrigado.
20

Referência Bibliográfica
DE FARIAS, Ana Maria Lima, Laurencel, SALSA, I. da S.; Moreira, J. A.; Pereira,
M.G.. Matemática e Realidade. Medidas de tendência central: média, mediana e
moda. Natal, RN: EDUFRN. POCINHO, Margarida, apontamentos da estatística
aplicada,2002.