Você está na página 1de 46

Estatística Descritiva

Medidas de Tendência Central

JD/CM _ 2022/2023 1
Objetivos da aula:
• Distinguir os conceitos de estatística
descritiva e as sua aplicações;
• Aplicar a estatística descritiva para realizar
análises de conjunto de dados;
• Avaliar os resultados dos dados, de modo a
poder caracterizar corretamente a amostra

JD/CM _ 2022/2023 2
Créditos da imagem: https://conteudo.hdrup.com/diagrama-de-dispersao
Medidas de Tendência Central

• As medidas de tendência central, indicam


um ponto, em torno do qual se distribuem
ou concentram os números do conjunto de
dados.

• Este tendem a estar localizado no centro da


distribuição dos dados.

JD/CM _ 2022/2023 4
Representação esquemática da forma da distribuição
de frequências e as posições relativas das medidas de
tendência central.

Voltaremos
aqui…
Medidas de
Tendência
Central

JD/CM _ 2022/2023 7
Média

• A média é o número total de valores de um conjunto de dados


dividido pelo número de valores.
• Para populações, a média é normalmente representada pela letra
grega µ(Mi), enquanto que para amostras, usa-se o símbolo x̄

• O processo usado para determinarmos o valor da média de um


conjunto de dados x1, x2, x3, …, xn depende da maneira como os
dados estiverem agrupados. Se não houver qualquer agregação, a
média é dada por

JD/CM _ 2022/2023 8
Resulta da soma da valores,
Como medida de tendência
central, só é válida quando a
distribuição dos valores se
simétrica em torno do seu
valor

JD/CM _ 2022/2023 9
σ𝑥
𝑥ҧ =
𝑛

Cálculo de média
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

JD/CM _ 2022/2023 10
Exemplo de
cálculo de média

JD/CM _ 2022/2023 11
Exemplo de cálculo de média

• Um estudante obteve a seguinte


classificação no teste numa cotação de 0-
a 10

• 0,2,4,6,10 – calcule a média das notas

JD/CM _ 2022/2023 12
Mediana_Md

• A mediana, Md, é a quantidade que divide em dois grupos com


igual número de observações
• É definida como o número que divide ao meio um conjunto
ordenado de dados
• Para encontrarmos a mediana, dispomos os dados segundo uma
ordem crescente ou decrescente e dividimos a meio este
conjunto de valores.
• Se tivermos um número ímpar de dados, a mediana é única e é
obtida pelo elemento que se encontra na posição central
• Se o número de valores for par e mediana é obtida pelo valor
médio entre os que estão no meio

JD/CM _ 2022/2023 13
Mediana_Md

• A mediana, Md, não é um valor matemático


• Em muitas situações a mediana é uma medida de tendência
central muito melhor que a média ( ex: em atributos medidos
com escala ordinais)

JD/CM _ 2022/2023 14
Cálculo da Mediana - Md

Por exemplo, se n = 9, a mediana é o valor que


se encontra na posição central
• 1,2,3,4,5,6,7,8,9,

JD/CM _ 2022/2023 15
Moda_mo
A moda_mo, de um conjunto de n valores x1,
x2, x3, …, xn é definida como o valor que
ocorre mais frequentemente no conjunto de
dados.

JD/CM _ 2022/2023 16
Moda_Mo

Exemplificando, se tivermos o seguinte conjunto de dados:


• 1 4 1 0 2 1 1 3 2 9 1 2 e construirmos a distribuição de frequência,
detetamos que o elemento que ocorre com maior frequência é o número 1,
que aparece 5 vezes. A moda, neste caso, é dada pelo valor 1.
• Em casos onde todos os valores ocorrem com a mesma frequência, a moda
não existe.
• Se dois valores têm a mesma frequência e esta for a maior frequência de
todo o conjunto de dados, dizemos que é bi-modal.
• Se estivermos a trabalhar com valores agrupados em classes, a classe modal
é a que obtiver maior frequência, e a moda é o ponto médio dessa classe.

JD/CM _ 2022/2023 17
Média/Mediana/Moda

Medida Definição Vantagens Desvantagens


Média Centro de distribuição de valores Reflete cada valor; É afetada por valores extremos
Possui propriedades matemáticas

Mediana Metade dos valores são maiores e Menos sensível a valor extremos Difícil de determinar quando há um
metade dos valores são menores como a média; grande número de dados

Moda Valor mais frequente Valor “típico” maior quantidade de Não se presta a análise matemática;
valores encontrados Pode não haver moda para certos
conjuntos de dados

JD/CM _ 2022/2023 19
Média – Mediana - Moda

JD/CM _ 2022/2023 20
Apresentação
de dados

JD/CM _ 2022/2023 21
Histogramas

• A apresentação do histograma depende muito do número de classes


considerado.
• Um número muito grande de classes produz um histograma com demasiada
irregularidade, enquanto um histograma com um número demasiado
reduzido de classes oculta a forma da distribuição (perde-se demasiada
informação).

JD/CM _ 2022/2023 22
Histograma

JD/CM _ 2022/2023 23
Histograma

JD/CM _ 2022/2023 24
Histograma
simétrico

JD/CM _ 2022/2023 25
Histograma
– “cauda à
esquerda”

JD/CM _ 2022/2023 26
Histograma
assimétrico
– “cauda à
direita”

JD/CM _ 2022/2023 27
Histograma
Bimodal

JD/CM _ 2022/2023 28
Histograma
multimodal

JD/CM _ 2022/2023 29
Histograma
achatado

JD/CM _ 2022/2023 30
Unimodal -
bimodal

JD/CM _ 2022/2023 31
Alguns
Exercícios

JD/CM _ 2022/2023 32
Exercício1
Exercício 1 - Resolução
Identifique o tipo de variável
a) quantitativa contínua
a) peso de pessoas
b) qualitativa (nominal)
b) marcas comerciais de um mesmo analgésico (mesmo
princípio ativo);
c) quantitativa contínua
c) temperatura de pessoas;
d) quantitativa contínua
d) quantidade anual de chuva na cidade do Porto;
e) qualitativa nominal
e) religião;
f) quantitativa discreta
f) número de dentes permanentes irrompidos em uma criança;
g) quantitativa discreta
g) número de bebés nascidos por dia em uma maternidade;
h) quantitativa contínua.
h) altura das crianças do pré-escolar.

JD/CM _ 2022/2023 33
Exercício 2
Pergunta: Converta as seguintes
proporções em percentagens: 0,09; 0,955;
0,33; 0,017
Resolução: Multiplique por 100, para obter:
9%; 95,5%; 33%;1,7%.

Pergunta: Converta as seguintes


percentagens em proporções: 35,5%;
53,1%;50%;46,57%.
Resolução: Basta dividir por 100, para
obter: 0,355; 0,531; 0,50; 0,4657

JD/CM _ 2022/2023 34
• De acordo com o CIAV – Centro de Informação Antivenenos
Categoria – INEM foram registados 23.647 casos de intoxicação
humana por animais venenosos. Desse total, 8.208 foram atribuídos
a escorpiões; 4.944, a serpentes; 4.661, a aranhas; e 5.834, a outros
Exercício 3 animais venenosos.

• Preencham os dados em falta na tabela

Animal

Escorpião 8.208 34,7


Serpente 20,91

4.661 19,71

Outros animais 5.834

Total 23.647
JD/CM _ 2022/2023
100,00 35
• De acordo com o CIAV – Centro de Informação Antivenenos
Categoria – INEM foram registados 23.647 casos de intoxicação
humana por animais venenosos. Desse total, 8.208 foram atribuídos
Exercício 3 : a escorpiões; 4.944, a serpentes; 4.661, a aranhas; e 5.834, a outros
animais venenosos.
Resolução • Preencham os dados em falta na tabela

Animal ni fi
Escorpião 8.208 34,7
Serpente 4.944 20,91
Aranha 4.661 19,71
Outros animais 5.834 24,67
Total 23.647 100,00
JD/CM _ 2022/2023 36
Exercício 4
• Num estudo para analisar a O número de sementes germinadas em cada vaso
taxa de germinação de um está registado é o seguinte:
certo tipo de cereal foram
semeadas cinco sementes
em cada um de 50 vasos
iguais com o mesmo tipo de
solo.

• Caracterize os dados;
• Apresente os dados numa
tabela
Exercício retirado de: (Neves, 2020) JD/CM _ 2022/2023 37
Exercício 4 - Resolução
a) Neste caso os dados são de natureza discreta, com um número pequeno de valores
distintos.

b) .

JD/CM _ 2022/2023 38
Classe
Exercício 5
20 – 30

30 – 40

40 – 50
Qual é o erro na distribuição de frequências dada ?
60 – 70

70 e mais

JD/CM _ 2022/2023 39
Resolução: Exercício 5

• Não está definido se os valores iguais aos extremos de classe estão ou não incluídos na

classe.

• Os intervalos se sobrepõem (por exemplo, de 20 a 30 e de 30 a 40; o valor 30 aparece

nos dois intervalos)

• Falta uma classe: de 50 a 60.

JD/CM _ 2022/2023 40
Exercício 6
• Um dos principais indicadores da poluição atmosférica nas
grandes cidades é a concentração de ozono na atmosfera.
Num dado Verão registou-se 78 valores dessa concentração
(em µ g / m3 ), numa dada cidade

a)Qual a natureza dos dados?


b)Represente os dados na tabela Exercício retirado de: (Neves, 2020)

JD/CM _ 2022/2023 41
Notas de Para dados de natureza contínua - como é este caso -
(ou quando temos dados de natureza discreta com
resolução… um elevado número de valores distintos) elabora-se a
tabela de frequências procedendo assim:

JD/CM _ 2022/2023 42
Notas de resolução

JD/CM _ 2022/2023 43
Temos: min(xi) = 1.1 max(xi) =
11.7

Notas de Pela regra de Sturges m ≈ 7.285


−→ considere-se m = 7
resolução amplitude das classes h = 1.51
−→ considere-se h = 1.5

(vimos que, com esta escolha,


será necessário considerar 8
classes para se incluírem todas
as observações)

JD/CM _ 2022/2023 44
a)Os dados são de natureza quantitativa continua
b).

Resolução
Exercício 6

JD/CM _ 2022/2023 45
BIBLIOGRAFIA

▪ Borges, R. B. et al. (2021). Power and Sample Size for Health Researchers: uma ferramenta para
cálculo de tamanho amostral e poder do teste voltado a pesquisadores da área da saúde. Clinical &
Biomedical Research, 40, 4. https://doi.org/10.22491/2357-9730.109542>.
▪ Guimarães, R.C.; Cabral, J.A.S. (2011). Estatística. Verlag Dashofer
▪ Hill, M.M., & Hill, A. (2016).Investigação por questionário. Edições Sílabo.
▪ Oliveira, A. G. (2014). Bioestatística Descodificada. Bioestatística, Epidemiologia e Investigação.
LIDEL.
▪ Vieira, S. (2016). Introdução à Bioestatística. Elsevier.

JD/CM - 2022-2023 46

Você também pode gostar