Você está na página 1de 49

Métodos

Matemáticos
Probabilidade e Estatística

Mariana Silva Ribeiro de Oliveira


• Unidade de Ensino: 3

• Competência da Unidade: Conhecer os elementos básicos da estatística


como processos de amostragem e medidas que nos auxiliam na
interpretação de dados.

• Resumo: Entender os conceitos básicos da estatística, medidas de


dispersão, posição, diagrama de dispersão e gráficos.

• Palavras-chave: Medidas, gráficos, diagrama e coeficientes.

• Título da Teleaula: Probabilidade e Estatística

• Teleaula nº: 3
Contextualização

https://bityli.com/IYbog
Conceitos básicos
A origem da palavra Estatística

• Está associada à palavra latina STATUS (Estado).

• Há indícios de que 3000 anos A.C. já se faziam


censos na Babilônia, China e Egito.

Taxação de impostos, alistamento militar,


cálculo de impostos, taxas de mortalidade,
demografia.
População e Amostra
População: Conjunto de indivíduos, ou objetos, que
apresentam em comum determinadas características.
Amostra: Parte (um subconjunto finito) representativa de
uma população.
População

Amostra

Fonte:https://bityli.com/qmjSr
Tipos de variáveis

Variável

Qualitativa Quantitativa

Nominal Ordinal Discreta Contínua


Fases do método estatístico
Definição do Problema

Planejamento

Coleta ou Levantamento dos Dados

Apuração dos Dados ou Sumarização

Apresentação dos Dados

Análise e Interpretação dos Dados


Processos de amostragem

Fonte: Ribeiro, 2015.


▪ Aleatória Simples

Probabilísticas ▪ Aleatória Sistemática


▪ Aleatória estratificada
▪ Conglomerados
▪ Acidental ou Esmo
Não
Probabilísticas ▪ Intencional
▪ Cotas

Os elementos da população não tem a


mesma probabilidade de serem
selecionados, assim não há garantia da
representatividade da população!
Quartis
• É cada um dos três valores que dividem uma distribuição de
frequências em quatro partes de frequências iguais.

• O primeiro quartil corresponde ao 25º percentil, o segundo


à mediana e o terceiro ao 75º percentil.

• A posição do quartil é dada por:

𝑖(𝑛 + 1)
𝑃𝑄𝑖 =
4
Atividade
Identifique qual a população e qual a amostra da
seguinte situação:

Uma pesquisa com 1.000 adultos nos Estados Unidos


descobriu que 17% preferem tirar férias nos meses de
inverno.
Atividade
Uma pesquisa com 1.000 adultos nos Estados Unidos
descobriu que 17% preferem tirar férias nos meses de
inverno.
População: coleção de todos os adultos nos Estados
Unidos.
Amostra: coleção dos 1.000 adultos entrevistados.
Medidas de posição
Medidas de posição
As medidas de tendência central têm o objetivo de
representar o ponto de equilíbrio ou o centro de uma
distribuição.
Em muitos casos, podem ser considerados valores típicos ou
representativos do conjunto.
As medidas mais utilizadas são:
• média aritmética;
• a mediana;
• a moda.
Média aritmética
A media aritmética (𝑥)ҧ é a medida de localização mais
conhecida e utilizada, pela sua facilidade de cálculo e de
compreensão aliada as suas propriedades matemáticas.
Resultado da divisão da soma de todos os valores da
amostra pela quantidade total de valores.

𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1
Exemplo

2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17

2 + 2 + 3+ . . +15 + 17 105
𝑥ҧ = = = 7,5
14 14
Mediana
A mediana (Md), é a medida que divide um conjunto de
dados ordenados em duas partes iguais: 50% dos
valores ficam abaixo e 50% ficam acima da mediana.
Em seguida conta-se até a metade deles:

▪ Para número ímpar de valores → mediana é o valor


do meio.
▪ Para amostras com número par de unidades a
mediana é a média dos dois valores centrais.
Exemplo
Mediana: o elemento que divide o conjunto de dados ao meio → 𝑀𝑑

n é ímpar: a posição da mediana pode ser encontrada


𝑛+1
utilizando a relação:
2
n é par: a mediana será a média aritmética dos valores
𝑛 𝑛
que ocupam as posições de ordem: 𝑒 + 1
2 2

2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17
Moda
A moda (Mo) é o é o valor de maior ocorrência num
conjunto de dados.
É a única medida que pode não existir e, existindo, pode
não ser única.
Um conjunto de dados pode:
▪ não apresentar moda;
▪ apresentar uma moda;
▪ apresentar duas modas (bimodal);
▪ apresentar três modas (trimodal);
▪ apresentar mais modas (polimodal).
Exemplo

Calcular a moda para as idades dos candidatos à


presidência de um clube desportivo:

65, 87, 49, 58, 65, 65, 67, 83, 87, 79.

Observe que, Mo = 65 (aparece 3 vezes).


Situação-problema

Os valores abaixo representem as massas (em kg) de 10


unidades de determinado produto selecionadas
aleatoriamente em uma linha de produção, em determinado
momento:

7,56; 7,64; 5,81; 10,80; 10,07; 7,85; 9,29; 10,34;


10,16; 10,95.

Determine o peso médio desse produto, a mediana e moda.


Resolvendo

Média
7,56 + 7,64 + 5,81 + 10,80 + 10,07 + 7,85 + 9,29 + 10,34 + 10,16 + 10,95
𝑥ҧ =
10

90,47
𝑥ҧ =
10
𝑥ҧ ≅ 9,05
Mediana
Para amostras com número par de unidades a mediana é
a média dos dois valores centrais
9,29 + 10,07
𝑀𝑑 =
2
19,36
𝑀𝑑 = → 𝑀𝑑 = 9,68
2

5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95
Moda
Distribuição não apresenta moda → amodal.

5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95
Medidas de dispersão
DISPERSÃO

Absoluta Relativa

Coeficiente
Amplitude Desvio Variância
de Variação
(A) Padrão (S) (s²)
(CV)
Amplitude (A)

A amplitude total é a diferença entre o maior e o menor valor


analisado em uma variável em ordem crescente ou
decrescente.

𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Exemplo
A 80 80 80 80 80 80
B 76 77 78 79 80 81

𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

𝐴𝑇 𝐴 = 80 − 80 = 0

𝐴𝑇 𝐵 = 81 − 76 = 5
Variância
• Variância é a média aritmética dos quadrados dos desvios
de cada valor em relação à média: proporciona uma
mensuração da dispersão dos dados em torno da média.

• É uma das medidas de dispersão mais importantes.

Variância Amostral

σ 𝒙−𝒙
ഥ 𝟐
𝟐
𝑺 =
𝒏−𝟏
Desvio padrão
Desvio padrão é a raiz quadrada positiva da variância,
apresentando a mesma unidade dos dados e da média,
permitindo avaliar melhor a dispersão.

Amostral

σ 𝒙−𝒙
ഥ 𝟐
𝑺= 𝑺𝟐 =
𝒏−𝟏
Coeficiente de variação
É a medida relativa de dispersão útil para fazer comparação
em termos relativos do grau de concentração. É calculado
pela relação entre o desvio padrão (s) e a média x da média
de séries distintas.

Amostral

𝒔
𝑪𝑽 = × 𝟏𝟎𝟎

𝒙
Situação-problema
Ana fez um levantamento sobre a idade de alguns filhos
dos funcionários de uma indústria. Observe o resultado:

Idade 𝒇𝒊
𝒙𝒊 Considerando esses dados,
8 2 determine a variância, desvio
12 3 padrão e o coeficiente de
13 5 variação.

෍ 𝑓𝑖 = 10
Resolvendo
2.8 + 3.12 + 5.13
ഥ=
𝒙 = 11,7
10

Idade 𝒇𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ
𝒙𝒊 − 𝒙 𝟐 ഥ 𝟐 . 𝒇𝒊
𝒙𝒊 − 𝒙
𝒙𝒊
8 2 -3,7 13,69 27,38
12 3 0,3 0,09 0,27
13 5 1,3 1,69 8,45

෍ 𝑓𝑖 = 10 ഥ 𝟐 . 𝒇𝒊 ≅ 36,1
෍ 𝒙𝒊 − 𝒙
Idade 𝒇𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ
𝒙𝒊 − 𝒙 𝟐 ഥ 𝟐 . 𝒇𝒊
𝒙𝒊 − 𝒙
𝒙𝒊
8 2 -3,7 13,69 27,38
12 3 0,3 0,09 0,27
13 5 1,3 1,69 8,45

෍ 𝑓𝑖 = 10 ഥ 𝟐 . 𝒇𝒊 ≅ 36,1
෍ 𝒙𝒊 − 𝒙

σ 𝑥 − 𝑥ҧ 2 36,1 𝒔
𝑆2 = = = 4,01 𝑪𝑽 = × 𝟏𝟎𝟎
𝑛−1 10 − 1 ഥ
𝒙
2
𝐶𝑉 = × 100
11,7
𝑆= 𝑆2 = 4,01 ≅ 2 𝐶𝑉 = 17,1%
Diagrama de
dispersão
Diagrama de dispersão
O diagrama de dispersão é um gráfico em que pontos no
espaço cartesiano XY são usados para representar
simultaneamente os valores de duas variáveis
quantitativas medidas em cada elemento do conjunto de
dados.
Coeficiente de Correlação
Apesar do diagrama de dispersão nos fornecer uma ideia
do tipo e extensão do relacionamento entre duas
variáveis x e y, há um número que mede essa relação,
chamado de coeficiente de correlação.

Coeficiente de Correlação de Pearson

𝑛 σ 𝑥𝑖 . 𝑦𝑖 − σ 𝑥𝑖 . (σ 𝑦𝑖 )
𝑟=
𝑛. σ 𝑥²𝑖 − (σ 𝑥𝑖 )² . 𝑛. σ 𝑦²𝑖 − (σ 𝑦𝑖 )²
Fonte: Ribeiro, 2015.
Coeficiente de determinação
• As variações da variável Y são 100% explicadas pelas
variações da variável X, não ocorrendo desvios em
torno da função estimada.
• Por outro lado, se 𝑅2 = 0 , isto quer dizer que as
variações de Y são exclusivamente aleatórias e
explicadas pelas variações de outros fatores que não
X.
• Se R2 for igual a 1, isto significa que todos os pontos
observados se situam “exatamente” sobre a reta de
regressão → ajuste perfeito.
Atividade
Ao se realizar um estudo para determinar a relação entre
os salários diários recebidos (x) e as despesas diárias (y),
foi realizada uma amostragem com três famílias,
computando-se os seguintes valores:

෍ 𝒙𝒊 = 𝟏𝟎𝟖 ෍ 𝒚𝒊 = 𝟔𝟓 ෍ 𝒙𝒊 . 𝒚𝒊 = 𝟐𝟑𝟗𝟏

෍ 𝒙𝟐𝒊 = 𝟑𝟗𝟓𝟎 ෍ 𝒚𝟐𝒊 = 𝟏𝟒𝟕𝟑

Com base nesses dados, determine o coeficiente de


correlação.
Atividade
෍ 𝒙𝒊 = 𝟏𝟎𝟖 ෍ 𝒚𝒊 = 𝟔𝟓 ෍ 𝒙𝒊 . 𝒚𝒊 = 𝟐𝟑𝟗𝟏

෍ 𝒙𝟐𝒊 = 𝟑𝟗𝟓𝟎 ෍ 𝒚𝟐𝒊 = 𝟏𝟒𝟕𝟑

𝑛 σ 𝑥𝑖 . 𝑦𝑖 − (σ 𝑥𝑖 )(σ 𝑦𝑖 )
𝑟=
𝑛 σ 𝑥𝑖2 − σ 𝑥𝑖 2 𝑛 σ 𝑦𝑖2 − σ 𝑦𝑖 2

3 ⋅ 2391 − (108)(65) 153


𝑟= = = 0,805
(3 ⋅ 3950 − 108 2 )(3 ⋅ 1473 − 65 2 186 ⋅ 194
Tipos de Gráficos
Colunas Número de Acidentes da Empresa FOGO & CIA

25

20
Quantidade de acidentes

20

15
15

10
10
7

5
3

0
jan/08 jan/09 jan/10 jan/11 jan/12
Mês/Ano

Fonte: Dados Fictícios


Plotagem do gráfico: Microsoft Excel
Barras Número de Acidentes da Empresa FOGO & CIA

jan/12 20

jan/11 3
Mês/Ano

jan/10 7

jan/09 10

jan/08 15

0 5 10 15 20 25
Quantidade de Acidentes

Fonte: Dados Fictícios


Plotagem do gráfico: Microsoft Excel
Setor
Número de Acidentes da Empresa FOGO & CIA (%)

36,4 27,3
jan/08
jan/09
jan/10
jan/11
18,2 jan/12

5,5 12,7

Fonte: Dados Fictícios


Plotagem do gráfico: Microsoft Excel
Colunas
Número de Acidentes da Empresa FOGO & CIA
25

20

Quantidade de acidentes
20

15
15

10
10
7

5
3

0
jan/08 jan/09 jan/10 jan/11 jan/12
Mês/Ano

Fonte: Dados Fictícios


Plotagem do gráfico: Microsoft Excel
Recapitulando
✓ Conceitos básicos da estatística

✓ Tipos de amostragem

✓ Medidas de posição

✓ Medidas de dispersão

✓ Diagrama de dispersão

✓ Coeficiente de correlação e determinação

✓ Tipos de gráficos
Fonte: Google Imagens. Disponível em encurtador.com.br/psGNX
Acesso em: 01 fev. 2021.

Você também pode gostar