Você está na página 1de 11

03/09/2021

Unidade de Ensino: 2
Competência da Unidade: Conhecer os fundamentos estatísticos
básicos necessários a formação do profissional da área de exatas.

Probabilidade e Resumo: Nesta unidade iremos compreender as medidas


separatrizes e sua utilização em estatística; construir e interpretar o
Estatística boxplot; utilizar as tabelas de frequência e os diagramas de
dispersão.
Métodos Tabulares e Métodos
Palavras-chave: Tabelas; gráficos; dispersão; correlação;
Gráficos
regressão.
Profª Drª Hallynnee Rossetto Título da Teleaula: Métodos tabulares e métodos gráficos
Teleaula nº: 2

1 2

Contextualizando

O que são medidas


separatrizes?

Como interpretar um
diagrama de dispersão?
Medidas separatrizes
e boxplot
Onde utilizar o coeficiente de
correlação linear?

Fonte: https://image.freepik.com/fotos-gratis/vista-superior-da-equipe-criativa-discutindo-graficos-de-
negocios-desenhados-em-canetas_1098-18798.jpg
Acesso em 17 jul. 2020.

3 4

Medidas separatrizes
Medidas separatrizes

Medidas que dividem uma distribuição em partes As separatrizes são valores que dividem a distribuição
percentualmente iguais. em um certo número de partes iguais:
A mediana caracteriza uma série de valores devido à sua  a mediana divide em 2 partes iguais;
posição central  separa a série em dois grupos que  os quartis dividem em 4 partes iguais;
apresenta o mesmo número de valores.
 os decis em 10 partes iguais;
Há outras medidas que estão ligadas à mediana.  e os centis em 100 partes iguais.
separatrizes.
os quartis; os decis; e os percentis.

(BERTOLO, 2011, p. 24)

5 6

1
03/09/2021

Quartis Quintis: Ao dividir a serie ordenada em cinco partes, cada uma


ficara com 20% de seus elementos.
Divide o conjunto de dados ordenados em 4 partes 20% 20% 20% 20% 20%
iguais, de 25% cada parte.
1/4 1/2 3/4 Decis: divide o conjunto de dados ordenados em 10 partes iguais,
cada parte com 10% dos valores do conjunto de dados.
25% 25% 25% 25% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

𝑖=1 𝑖 =2 𝑖=3
2° quartil 3° quartil
1° quartil Percentis: Ao dividir a série ordenada em cem
𝑖(𝑛 + 1)
partes, cada uma ficará com 1% de seus
𝑄 = elementos.
4

7 8

Exemplo Bloxpot
Determinar o primeiro quartil da amostra a seguir: É um gráfico muito útil na
43 45 45 49 53 56 56 58 64 65 67 68 68 71 73 73 76 78 comparação de distribuições, o qual
𝑖(𝑛 + 1) que ilustra os principais aspectos
𝑄 =
4 dela, tomando por base essas
1. (18 + 1) medidas robustas.
𝑄 = = 4,75
4

Dizemos que o 1º quartil está na posição 4,75, ou


seja, posição 5. Analisando a tabela, ocupa a
posição 5 que é 53.
Fonte: http://bit.ly/2SELKkm.
(CUNHA, 2018, p. 12) Acesso em: 15 fev. 2019.

9 10

Tabela

Um dos objetivos da estatística é sintetizar os valores


que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação das mesmas.

Tabelas de Tabela é uma maneira de apresentar de


forma resumida um conjunto de dados
frequências (SHIGUTI e SHIGUTI, 2006, p. 15).

11 12

2
03/09/2021

Construindo uma tabela de frequência


Tabela de frequência
Quantidade de
Idade
pessoas (𝒇𝒂 )
Indica a frequência observada (relativa ou absoluta). 18
Mostra a frequência com que cada observação aparece nos 20
dados. 23

 Frequência Simples ou Absoluta (𝒇𝒊 ) 25


26
é o valor que representa o número de dados de uma
29
Classe.
30
 Frequência Relativa (𝒇𝒓𝒊 ) 35
37
a razão entre as frequências simples e a
Total
frequência total.
CRESPO, 2020, p. 61)

13 14

Quantidade de
Idade pessoas (𝒇𝒂 ) Idade Frequência Frequência Frequência
18 (𝒙𝒊 ) absoluta 𝒇𝒂 relativa 𝒇𝒓 acumulada 𝒇𝒂𝒄
2
20 5 18 2
23 1 20 5
23 1
25 2
25 2
26 1 26 1
29 1 29 1
30 1 30 1
35 1 35 1
37 1 37 1
Total 15
Total 15

15 16

Idade Frequência Frequência Frequência


(𝒙𝒊 ) absoluta 𝒇𝒂 relativa 𝒇𝒓 acumulada 𝒇𝒂𝒄

18 2 13% 2
20 5 33% 7
23 1 7% 8
25 2 13% 10
26
29
1
1
7%
7%
11
12
Diagrama de
30 1 7% 13 dispersão
35 1 7% 14
37 1 7% 15
Total 15 100% 15

17 18

3
03/09/2021

O que é o diagrama de dispersão?


Como o diagrama de dispersão pode auxiliar
É um gráfico em que pontos no espaço cartesiano XY são usados para na interpretação de uma pesquisa?
representar simultaneamente os valores e a relação entre duas variáveis
quantitativas medidas em cada elemento do conjunto de dados.  Permite avaliar se existe ou não alguma relação
entre as duas variáveis de estudo;
 Indica o tipo de relação entre as duas variáveis;
 Indica a intensidade da relação (forte, fraca ou
moderada);
 Indica a natureza da relação(linear, exponencial,
...).

(LARSON e FARBER, 2004, p. 396)

19 20

Para o Diagrama de dispersão, utilizou-se as idades das


mulheres no eixo x e as massas musculares no eixo y.

Exemplo

Fonte: Ribeiro, 2015.

21 22

Como construir
uma tabela de
frequência com
classe desses
dados?
Construindo uma
tabela com classes

23 24

4
03/09/2021

1º passo: Número de Classes (k)


(1) Estabelecer a quantidade de classes ou 15 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 → 𝑘 = 15 = 3,87 ≅ 𝟒 𝒄𝒍𝒂𝒔𝒔𝒆𝒔
intervalos de agrupamento dos dados.
(2) Determinar a amplitude das classes.
2º passo: Amplitude das Classes (h)
(3) Enquadrar os dados nas classes, mediante
Maior valor  37
contagem, e apresentar os resultados
em uma tabela ou gráfico. Menor valor  18
𝐴𝑇 = 37 − 18 = 19

ℎ= = = 4,75 ≅ 5

25 26

Quantidade de
Idade pessoas (𝒇𝒂 )
18 2 3º passo:
20 5 Frequência Frequência Enquadrar os dados
23 1 Classe absoluta relativa nas classes,
25 2 fa fr mediante contagem.
26 1 18 |- 23
29 1 23 |- 28
4 classes
30 1 28 |- 33
35 1 33 |- 38
37 1
Total 15 Amplitude das classes - 5

27 28

Quantidade de
Idade alunos (𝒇𝒂 ) Frequência Frequência
18 2 Classe absoluta relativa
fa fr
20 5
23 1 18 |- 23 7 47%
25 2 23 |- 28 4 27%
26 1 28 |- 33 2 13%
33 |- 38 2 13%
29 1
30 1
Total 15 100%
Pressão sistólica
35 1
37 1
Total 15

29 30

5
03/09/2021

Captopril é um remédio destinado a baixar a pressão


sistólica. Para testar seu efeito, ele foi ministrado a 12 Para todos os pacientes, a pressão sistólica
pacientes, sendo aferida a pressão sistólica antes e depois depois do Captopril é menor do que antes da
da medicação. medicação. Como podemos “ver” estas
diferenças?

Os mesmos indivíduos foram utilizados nas duas


amostras e foi comparada a pressão sistólica antes
e depois.
(REIS e REIS, 2002, p. 30) (REIS e REIS, 2002, p. 30)

31 32

Coeficiente de
Correlação

33 34

Coeficiente de Correlação Correlação

Interpretar a correlação usando um diagrama de O objetivo do estudo da correlação é determinar (mensurar) o grau de
dispersão pode ser subjetivo. Uma maneira mais precisa relacionamento entre duas variáveis.
de se medir o tipo e a força de uma correlação linear
entre duas variáveis é calcular o coeficiente de
correlação.

(LIMA FILHO, 2013) Fonte: Larson (2010, p. 395)

35 36

6
03/09/2021

Correlação Coeficiente de Correlação Linear

O diagrama de dispersão nos fornece uma ideia do tipo e extensão do


relacionamento entre duas variáveis x e y.
Há um número que mede essa relação, chamado de coeficiente de
correlação.

Coeficiente de Correlação de Pearson

𝑛 ∑ 𝑥 . 𝑦 − ∑ 𝑥 . (∑ 𝑦 )
𝑟=
𝑛. ∑ 𝑥² − (∑ 𝑥 )² . 𝑛. ∑ 𝑦² − (∑ 𝑦 )²

Fonte: Larson (2010, p. 395)

37 38

Coeficiente de Correlação Exemplo

Tempo (min) Distância (m) 𝒙. 𝒚 𝒙𝟐 𝒚𝟐


(x) (y)
5 500 2500 25 250 000
10 1100 11000 100 1 210 000
15 1400 21000 225 1 960 000
20 1900 38000 400 3 610 000
50 4900 72500 750 7 030 000

Fonte: Ribeiro, 2015.

39 40

Exemplo
Tempo (min) Distância (m) 𝒙. 𝒚 𝒙𝟐 𝒚𝟐
(x) (y)
50 4900 72500 750 7 030 000

𝑟=
𝑛 ∑ 𝑥 . 𝑦 − (∑ 𝑥 )(∑ 𝑦 )
Coeficiente de
𝑛∑𝑥 − ∑𝑥 𝑛∑𝑦 − ∑𝑦
Determinação
4 × 72500 − 50 × 4900
𝑟= = 0,99
4 × 750 − (50 × 4 × 7030000 − (4900)

41 42

7
03/09/2021

Coeficiente de determinação Exemplo

É o valor “R² “ que informa se a reta de regressão está bem


ajustada aos dados. Tempo (min) Distância (m) 𝒙. 𝒚 𝒙𝟐 𝒚𝟐
(x) (y)
𝑛 ∑ 𝑥 . 𝑦 − (∑ 𝑥 )(∑ 𝑦 ) 5 500 2500 25 250 000
𝑟= 10 1100 11000 100 1 210 000
𝑛∑𝑥 − ∑𝑥 𝑛∑𝑦 − ∑𝑦 15 1400 21000 225 1 960 000
20 1900 38000 400 3 610 000
50 4900 72500 750 7 030 000
𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑅 =
𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙

43 44

Exemplo Interpretação de um coeficiente de determinação


Tempo (min) Distância (m) 𝒙. 𝒚 𝒙𝟐 𝒚𝟐 Exemplo: Se o coeficiente de correlação é 𝑟 = 0,99,
(x) (y)
então o coeficiente de determinação será:
50 4900 72500 750 7 030 000
𝑟 = 0,99 = 0,9801 = 98,01%

𝑛 ∑ 𝑥 . 𝑦 − (∑ 𝑥 )(∑ 𝑦 )
𝑟=
𝑛∑𝑥 − ∑𝑥 𝑛∑𝑦 − ∑𝑦 Isso significa que 𝟗𝟖,𝟎𝟏% da variação de y pode ser
explicada pela relação entre x e y. O restante (𝟏,𝟗𝟗%
da variação) não é explicada e é em razão de outros
4 × 72500 − 50 × 4900 fatores ou a erro da amostra.
𝑟= = 0,99
4 × 750 − (50 × 4 × 7030000 − (4900)

45 46

Associação a não causalidade

Suponha que encontremos uma associação ou correlação


entre duas variáveis A e B. Podem existir diversas
explicações do porquê elas variam conjuntamente,
incluindo:

Relação entre
 Mudanças em A causam mudanças em B;
 Mudanças em B causam mudanças em A; variáveis
 Mudanças em outras variáveis causam mudanças
tanto em A quanto em B.

47 48

8
03/09/2021

Tempo (x) Nota (y) x.y x2 y2


A tabela a seguir apresenta o tempo de estudo 3,0 4,5 13,5 9 20,25
de um aluno e sua nota em algumas provas. 7,0 6,5 45,5 49 42,25
2,0 3,7 7,4 4 13,69
Tempo (x) Nota (y) 1,5 4,0 6 2,25 16
3,0 4,5 12,0 9,3 111,6 144 86,49
25,5 28 184 208,25 178,68
7,0 6,5
2,0 3,7 𝑛 ∑ 𝑥 . 𝑦 − (∑ 𝑥 )(∑ 𝑦 )
𝑟=
1,5 4,0
𝑛∑𝑥 − ∑𝑥 𝑛∑𝑦 − ∑𝑦
12,0 9,3
Qual o tipo de correlação existente entre essas 5.184 − 25,5.28
𝑟=
duas variáveis? 5.208,25 − (25,5) . 5.178,68 − (28)

49 50

5.184 − 25,5.28
𝑟=
5.208,25 − (25,5) . 5.178,68 − (28)

920 − 714
𝑟=
1041,25 − 650,25 . 893,4 − 784
Regressão Linear -
𝑟=
206 Métodos dos Mínimos
391 . 109,4
Quadrados
206
𝑟= = 0,9960 Correlação Linear Positiva
206,82

51 52

Regressão Linear Método dos Mínimos Quadrados


O objetivo da regressão linear é fazer a análise estatística,
Estabelecemos que y é o valor
verificando a relação funcional de uma variável dependente
𝑆= ∆𝑆 = (𝑦 − 𝑦 )² da curva ajustada calculada por:
com uma ou mais variáveis independentes. 𝑦 = 𝑎𝑥 + 𝑏

Propõe uma função que tenta explicar a variação da variável


dependente pelas variáveis independentes.
Soma dos valores de ∆𝑆 para todas
as N medidas e traçar uma reta,
Ajuste de curvas pelo método dos tornando a soma de ∆Si mínima.
mínimos quadrados

53 54

9
03/09/2021

Coeficiente linear e angular da reta Exemplo

𝒏=𝟔
y é o valor da curva ajustada calculada por: 𝑦 = 𝑎𝑥 + 𝑏
𝑥 = 2568 𝑦 = 433308 𝑥 𝑦 = 187012932 𝑥

𝑛∑𝑥 𝑦 − ∑𝑥 ∑𝑦 = 1106470
𝑎=
𝑛∑𝑥 − ∑𝑥 𝑛∑𝑥 𝑦 − ∑𝑥 ∑𝑦
𝑎=
𝑛∑𝑥 − ∑𝑥
∑𝑥 ∑𝑦 − ∑𝑥 𝑦 ∑𝑥 6 187012932 − 2568 433308 9342648
𝑏= 𝑎= = = 𝟐𝟏𝟏, 𝟑𝟗
𝑛∑𝑥 − ∑𝑥 6 1106470 − 2568 44196

55 56

Um estudante de enfermagem conduz um estudo para


determinar se há uma relação linear entre os pesos dos
indivíduos (em libras) e o consumo diário de água (em onças). Os
dados são mostrados na tabela a seguir. Organize os dados no
diagrama de dispersão e descreva o tipo de correlação.
A relação entre peso e
o consumo diário de
água

(LARSON e FARBER, 2004, p. 396)

57 58

Recapitulando
O peso de uma pessoa não parece estar relacionado
com a quantidade de água que ela consome. Medidas separatrizes e São números que dividem a sequência
boxplot ordenada de dados em partes que contêm a
mesma quantidade de elementos. Boxpolt é
uma ferramenta gráfica que permite visualizar
a distribuição e valores discrepantes dos dados.

Tabela de frequência É uma tabela com o número de ocorrências ou


repetições de um dado.

Diagrama de dispersão É uma gráfico das representações de dados de


duas ou mais variáveis.

59 60

10
03/09/2021

Recapitulando

Coeficiente de Mede o grau da correlação entre duas


Correlação Linear variáveis.

Coeficiente de É uma medida de ajuste de um modelo


Determinação e estatístico linear generalizado.
Regressão Linear

Método dos mínimos É uma técnica de otimização matemática


quadrados que procura encontrar o melhor ajuste para
um conjunto de dados

61

11

Você também pode gostar