Você está na página 1de 37

UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO

FACULDADE DE CIÊNCIAS BIOLÓGICAS E SAÚDE


DEPARTAMENTO DE BIOLOGIA

BIOESTATÍSTICA

UNIVERSIDADE FEDERAL RURAL DO RIO DE


JANEIRO
• Professora: Me. INSTITUTO
Carolina GurskiDE
Olanda
QUÍMICA
• Contato: carol_gurski@yahoo.com.br
PROGRAMA DE PÓS-GRADUAÇÃO EM QUA

Rio de Janeiro
Ponto médio de classe

• É definido como o valor médio entre os limites


superiores e inferiores de uma determinada classe (i).

(𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟(𝐿𝑖 ) + 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟(𝐿𝑠 ))


𝑝𝑚𝑐𝑖 =
2

• Exemplo
(41 + 45)
𝑝𝑚𝑐𝑖 =
2
𝑝𝑚𝑐𝑖 = 43

2
Tipo de frequência

• Frequências simples ou absolutas (fi): são os valores que


realmente representam o número de dados de cada classe.
A soma das frequências simples é igual ao número total
dos dados da distribuição.

• Frequências relativas (fri): são os valores das razões entre


as frequências absolutas de cada classe e a frequência
total da distribuição. A soma das frequências relativas ́e
igual a 1 (100 %).

3
Tipo de frequência

• Frequências acumuladas: são somadas todas as


observações existentes na classe com as demais
observações das classes anteriores.
• A frequência absoluta acumulada pode ser denotada por Fac
.
• A frequência relativa acumulada pode ser denotada por FRi.

4
Exemplo
• Considere o conjunto de dados {3,5,1,6,2,4,3,5,2}.

• Ordenando esses dados em ordem crescente, obtemos {1,2,2,3,3,4,5,5,6}

• Agora, vamos calcular a frequência acumulada para cada valor:

• Para 1, a frequência acumulada é 1, pois há 1 observação menor ou igual


a 1.
• Para 2, a frequência acumulada é 3, pois há 3 observações menores ou
iguais a 2.
• Para 3, a frequência acumulada é 5, pois há 5 observações menores ou
iguais a 3.
• Para 4, a frequência acumulada é 6.
• Para 5, a frequência acumulada é 8.
• Para 6, a frequência acumulada é 9.

5
Exemplo
Abs. F. Relativa
Filhos F. Absoluta
Acumulada Relativa Acumulada

0 17 17 0,472 % 47,2 %

1 8 25 0,222 % 69,4 %

2 7 32 0,194 % 88,8 %

3 3 35 0,083 % 97,1%

5 1 36 0,027 % 99,8 %

Total 36 36 1,00 % 100

6
Densidade
• Descreve a distribuição de uma variável contínua. Ela
representa a frequência relativa dos valores de uma
variável em relação à sua unidade de medida.

𝑓𝑖
𝑑𝑖 =
∆𝑖

• A densidade de frequência é utilizada na construção do


gráfico histograma, que faz com que esse não fique
distorcido, quando se utiliza amplitude de classes
diferentes.

7
Medidas de Tendência Central

• São utilizadas para representar um conjunto de dados


como um todo, identificando as características
apresentadas pelo conjunto. As medidas de tendência
central estudadas aqui serão três:

• Média
• Mediana
• Moda

8
Medidas de Tendência Central
• Moda (Mo): representa o valor mais frequente de um conjunto
de dados, sendo assim, para defini-la basta observar a
frequência com que os valores aparecem.

• Mediana (Md): representa o valor central de um conjunto de


dados. Para encontrar o valor da mediana é necessário colocar
os valores em ordem crescente ou decrescente. Quando o
número elementos de um conjunto é par, a mediana é
encontrada pela média dos dois valores centrais. Assim, esses
valores são somados e divididos por dois.

• Média (Me): É a soma de todos os valores de um conjuntos de


dados, dividido pelo número de valores do conjunto.

9
Medidas de Tendência Central

• Calcule o valor da mediana da seguinte amostra de dados


(32, 27, 15, 44, 15, 32).

• 1° ordene os dados: 15, 15, 27, 32, 32, 44


• 2° Como essa amostra é formada por 6 elementos, que é
um número par, a mediana será igual a média dos
elementos centrais, (27 + 32)/2 = 29,5

• Caso a amostra fosse ímpar, ex. 15, 15, 27, 32, 32, 44, 45.
A mediana seria 32, nesse caso.

10
Gráficos

• Gráficos têm um papel fundamental na


organização de dados na estatística, com eles,
a interpretação desses dados torna-se mais
eficiente.

11
Gráficos
• Gráficos de Dispersão: Mostram a relação entre duas variáveis
numéricas, geralmente com pontos no plano cartesiano.

• Gráficos de Barras: Representam dados categóricos ou discretos


usando barras retangulares de comprimentos proporcionais aos
valores que estão sendo representados.

• Gráficos de Linhas: São usados principalmente para exibir


tendências ao longo do tempo ou em relação a outras variáveis
contínuas. Eles conectam pontos de dados com linhas retas ou
curvas.

• Gráficos de Pizza (ou Setores): Mostram a distribuição de uma


variável categórica em relação ao todo, representando as partes como
setores de um círculo.

12
Gráficos
• Histogramas: São semelhantes aos gráficos de barras, mas são
usados para representar a distribuição de uma variável numérica
contínua em intervalos (ou classes) de valores.

• Diagramas de Caixa (Box Plots): São usados para representar a


distribuição de uma variável numérica e exibem estatísticas
resumidas, como mediana, quartis e outliers*.

• Gráficos de Área: São semelhantes aos gráficos de linhas, mas a


área abaixo da linha é preenchida, o que pode ajudar a destacar a
magnitude da mudança ao longo do tempo.

• Gráficos de Rede (ou Diagramas de Rede): Mostram a relação


entre diferentes elementos de um sistema, muitas vezes em uma
estrutura de rede ou grafos.

* Pontos de dados que estão significativamente fora do padrão dos outros pontos de dados no conjunto de dados.

13
Gráficos

• Gráfico de dispersão • Gráfico de barras

14
Gráficos

• Gráfico de linhas • Gráfico de pizza

15
Gráficos

• Histograma • Boxplot

16
Gráficos

• Gráfico de Área • Gráfico de rede

17
Histograma
• O histograma é a representação visual de uma frequência
absoluta ou relativa da distribuição de dados
quantitativos. A altura da barra representa a frequência da
classe respectiva. A largura representa o tamanho da
classe.

18
Polígono de Frequência

• O polígono de frequência é uma representação gráfica


simples que conecta os pontos médios de cada intervalo ou
classe no eixo horizontal (eixo x) com as frequências
correspondentes no eixo vertical (eixo y).

• Ele é usado principalmente para suavizar a visualização da


distribuição de frequência em um histograma ou gráfico de
barras, destacando a tendência central dos dados.

• O polígono de frequência é útil para obter uma visão geral


rápida da distribuição dos dados, especialmente quando os
intervalos são relativamente largos.

19
Polígono de Frequência

• Para criar um polígono de frequência, você segue estas


etapas:

• Primeiro, construa um histograma ou um gráfico de


barras para representar as frequências dos valores.
• Em seguida, localize os pontos médios de cada intervalo
ou classe no eixo horizontal (eixo x) do histograma ou
gráfico de barras.
• Depois, no eixo vertical (eixo y), represente as
frequências correspondentes a esses pontos médios.
• Por fim, conecte esses pontos médios por meio de
segmentos de linha reta, criando o polígono de
frequência.

20
Simetria
• Indica se os dados estão distribuídos de forma
simétrica ou se há uma inclinação para a esquerda ou
para a direita em relação ao centro da distribuição.

• A linha que determina essa assimetria é a linha


vertical que passa pela média (ou mediana) dos
dados no histograma. Se a média estiver à direita da
mediana, o histograma é assimétrico para a direita;
se estiver à esquerda, o histograma é assimétrico
para a esquerda.

21
Simetria

22
Exercício
• Construa um histograma com os dados de altura de
alunos da turma de Bioestatística.

23
Exercício

24
Exercício

25
Percentil

• Percentil é uma medida estatística que divide


um conjunto de dados ordenados em 100 partes
iguais, representando a posição relativa de um
determinado valor dentro desses dados.

• É calculado como a porcentagem dos valores


que estão abaixo do valor desejado.

26
Percentil
• Organize os dados em ordem crescente:
Primeiro, ordene os dados do menor para o maior.

• Identifique a posição do valor desejado: Em


seguida, determine a posição do valor específico
que você está interessado dentro dessa lista
ordenada.

• Calcule o percentil: O percentil é calculado como


a porcentagem dos valores que estão abaixo do
valor desejado.

27
Percentil

𝑃𝑜𝑠𝑖çã𝑜 𝑑𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑥 𝑇𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎


𝑃𝑜𝑠𝑖çã𝑜 𝑑𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 =
100

28
Exemplo
• Calcule o valor, dos quais 25% são menores ou
iguais a ele, com os seguintes dados:

18, 19, 21, 21, 21, 22, 22, 22, 23, 23, 24, 27

25 𝑥 12 300
= =3
100 100

18, 19, 21, 21, 21, 22, 22, 22, 23, 23, 24, 27

• 25% da amostra tem no máximo 21 anos.

29
Quartil

• Os quartis são medidas estatísticas que dividem


um conjunto de dados ordenados em quatro
partes iguais.

• Eles são usados para entender a distribuição dos


dados e identificar pontos de corte importantes
que ajudam a resumir e analisar a variabilidade
dos dados.

30
Quartil
• Primeiro Quartil (Q1): Este é o valor que deixa 25%
dos dados abaixo dele e 75% acima dele. Ele também é
conhecido como o quartil inferior.

• Segundo Quartil (Q2): Este é o valor que deixa 50%


dos dados abaixo dele e 50% acima dele. É equivalente
à mediana dos dados e divide os dados em duas metades
iguais.

• Terceiro Quartil (Q3): Este é o valor que deixa 75%


dos dados abaixo dele e 25% acima dele. Ele também é
conhecido como o quartil superior.

31
Boxplot
• Boxplot, também conhecido como diagrama de caixa, é
um tipo de gráfico para ilustrar um conjunto dados.

• Por meio dele é possível fazer uma relação entre uma


variável quantitativa (numérica) e outra qualitativa
(categórica).

• O intervalo interquartil (IQR) é uma medida estatística


que descreve a dispersão dos dados em torno da
mediana. Ele é calculado como a diferença entre o
terceiro quartil (Q3) e o primeiro quartil (Q1):
IQR = Q3 − Q1

32
Boxplot
• O intervalo interquartil (IQR) é uma medida estatística
que descreve a dispersão dos dados em torno da
mediana. Ele é calculado como a diferença entre o
terceiro quartil (Q3) e o primeiro quartil (Q1):
𝐼𝑄𝑅 = 𝑄3 − 𝑄1

• Os limites são calculados da seguinte maneira: fórmula:

𝐿𝑠 = 𝑄3 + (𝐼𝑄𝑅 𝑥 1,5)

𝐿𝐼 = 𝑄1 − (𝐼𝑄𝑅 𝑥 1,5)

33
Boxplot

34
Boxplot - Construção

• Organize seus dados: Primeiro, organize os seus dados em


grupos ou categorias, se necessário. Certifique-se de ter uma
variável quantitativa que você deseja visualizar usando o
boxplot.

• Identifique os cinco números resumo:


• O mínimo (o menor valor dos dados).
• O primeiro quartil (Q1, o valor que deixa 25% dos dados
abaixo dele).
• A mediana (o valor que deixa 50% dos dados abaixo dele).
• O terceiro quartil (Q3, o valor que deixa 75% dos dados
abaixo dele).
• O máximo (o maior valor dos dados).

35
Boxplot - Construção
• Desenhe o boxplot:
• Desenhe um retângulo (ou "caixa") que vai do primeiro quartil
(Q1) até o terceiro quartil (Q3). Isso representa a faixa
interquartil (IQR).
• Desenhe uma linha do mínimo até Q1 e outra linha do máximo
até Q3. Essas linhas representam os valores mínimos e máximos
dos dados, excluindo os valores atípicos.
• Adicione pontos ou asteriscos para representar qualquer valor
atípico que esteja fora do intervalo definido pelo IQR.

• Interprete o boxplot: Após desenhar o boxplot, interprete-o. Você


pode analisar a tendência central (mediana), a dispersão (faixa
interquartil e amplitude total), e identificar valores atípicos, se
houver.

36
Exercício
• Construa um boxplot com os seguintes valores.

30 31 34 34 37
37 42 42 45 45
45 46 46 48 50
52 54 54 54 80

37

Você também pode gostar