Você está na página 1de 54

Estatística Orientada a

Ciência de Dados
Professor: MSc Pablo Leandro Chen Wieler

1
Estatística
Orientada a AULA SERÁ HÍBRIDA.
Ciência de Dados É OPTATIVO A IDA NO SENAI-CIC

 ESTAREI NA SALA SALA 508

Introdução a
ciência de dados

2
Estatística Objetivo Específicos da Aula
Orientada a
Ciência de Dados
 Compreender as principais medidas estatística
de posição dispersão e separatrizes.

 E entender a suas aplicação.


Introdução a
ciência de dados

3
Estatística: o que é ?
Estatística
Orientada a Estatística pode ser pensada como a ciência de
aprendizagem a partir de dados.
Ciência de Dados No nosso cotidiano, precisamos tomar decisões,
muitas vezes rápidas.

Introdução a
ciência de dados

4
Amostragem e planejamento de experimentos:
Estatística mecanismo de coleta de dados;
Orientada a
Ciência de Dados Estatística descritiva: organização,
apresentação e sintetização de dados;

Estatística inferencial: métodos de análise de


dados visando a tomada de decisões. Utiliza
As áreas da alguns resultados da teoria das probabilidades
Estatística (a qual tem por objetivo quantificar a incerteza
existente em determinada situação).

5
Estatística 1. DEFINIÇÃO DO PROBLEMA
Orientada a
2. PLANEJAMENTO
Ciência de Dados
3. COLETA DE DADOS
4. APURAÇÃO DOS DADOS
5. APRESENTAÇÃO DOS DADOS
6. ANÁLISE E INTERPRETAÇÃO DOS
Fases do Método DADOS
Estatístico

6
Estatística
Orientada a
Ciência de Dados DEFINIÇÃO DO PROBLEMA:

Saber exatamente aquilo que se pretende


pesquisar é o mesmo que definir
corretamente o problema.
Fases do Método
Estatístico

7
Estatística
Orientada a PLANEJAMENTO:
Ciência de Dados
Como levantar informações? Que dados
deverão ser obtidos? Qual levantamento a
ser utilizado? Censitário? Por
amostragem? E o cronograma de
atividades? Os custos envolvidos? Etc.
Fases do Método
Estatístico

8
Estatística
Orientada a
Ciência de Dados COLETA DE DADOS :

Fase operacional. É o registro sistemático


de dados, com um objetivo determinado.

Fases do Método
Estatístico

9
Estatística
Orientada a
Ciência de Dados APURAÇÃO DOS DADOS :

Resumo dos dados através de sua


contagem e agrupamento. É a
condensação e tabulação de dados.
Fases do Método
Estatístico

10
APRESENTAÇÃO DOS DADOS : Há duas
Estatística formas de apresentação, que não se excluem
mutuamente:
Orientada a
Ciência de Dados  A apresentação tabular: apresentação
numérica dos dados em linhas e colunas
distribuídas de modo ordenado segundo
regras práticas fixadas pelo Conselho
Nacional de Estatística.
 A apresentação gráfica: os dados
numéricos constituem uma apresentação
Fases do Método geométrica permitindo uma visão rápida e
Estatístico clara do fenômeno.

11
ANÁLISE E INTERPRETAÇÃO DOS
Estatística DADOS: A última fase do trabalho
Orientada a estatístico é a mais importante e delicada.
Ciência de Dados Está ligada essencialmente ao cálculo de
medidas e coeficientes, cuja finalidade
principal é descrever o fenômeno
(estatística descritiva).
Na estatística indutiva a interpretação
Fases do Método dos dados se fundamenta na teoria da
Estatístico probabilidade.

12
Algumas definições ...
Estatística
Orientada a População: conjunto de tudo o que interessa
Ciência de Dados ao estudo de um problema de pesquisa,
segundo alguma característica pré-
selecionada;

amostra: qualquer subconjunto não vazio de


Fases do Método uma população, ou seja, qualquer parte não
Estatístico vazia de uma população;

13
Algumas definições ...
Estatística
Orientada a variável: tem por característica apresentar
Ciência de Dados uma variabilidade quando são realizadas
sucessivas mensurações;

variável qualitativa: caracterizada numa


pesquisa por se referir a avaliações subjetivas;
Fases do Método
Estatístico variável quantitativa: caracterizada numa
pesquisa por se referir a avaliações objetivas,
de caráter numérico. 14
Estatística
Orientada a
Ciência de Dados  Medidas de posição e de dispersão utilizadas
para nas pesquisas para descrever e
representar o conjunto de dados.

Introdução a
ciência de dados

15
Medidas de Medidas de
Posição tendência central
Estatística
Orientada a
Ciência de Dados

• Amplitude
• Variância
Medidas de • Desvio Padrão
Medidas Dispersão • Coeficiente de
variação
descritivas

16
Estatística
Orientada a
Ciência de Dados

Medidas de
tendência Média: ponto Mediana: divide Moda: valor
de equilíbrio o conjunto em mais
central duas partes
do conjunto. iguais. provável.
17
Média Aritmética simples
Estatística
Orientada a  Existem dois tipos de Média mais utilizados:
Ciência de Dados aritmética Simples e aritmética Ponderada.

A Média aritmética Simples, chamada


normalmente apenas de “Média Aritmética”, é a
mais utilizada no nosso dia a dia.
Medidas de
tendência
central  Consiste na soma dos valores coletados e divididos
pela quantidade de fatores considerados.

18
Média Aritmética simples
Estatística
Orientada a  A média aritmética dos números x1, x2, x3, ..., xn, é
Ciência de Dados dada pela fórmula:

𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑥ҧ =
𝑛
Medidas de
tendência
central

19
Média Aritmética simples
Estatística
Orientada a Exemplos de utilização da média aritmética
Ciência de Dados
no cotidiano:

Média das notas escolares.

Medidas de Média de gols num campeonato de futebol.


tendência
central Média de público nos jogos dos
campeonatos.
20
Média Aritmética simples
Estatística
Orientada a Exemplos de utilização da média aritmética
Ciência de Dados
no cotidiano:

Média da idades dos alunos da turma.

Medidas de Renda Per Capita de um país (total da renda


tendência
central de um país dividido pelo número total de seus
habitantes).
21
Estatística
Exercício 01 Determinar a media, dos
Orientada a
seguintes conjuntos de valores:
Ciência de Dados
a) 2,3 2,1 1,5 1,9
 3,0 1,7 1,2 2,1
 2,5 1,3 2,0 2,7
Medidas de  0,8 2,3 2,1 1,7
tendência
central

22
Estatística
Orientada a Exercício 01 Determinar a media, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
 44 36 28 37 35
 33 40 36 35 37
Medidas de
tendência
central

23
Exemplo.
Considere que as médias finais dos alunos de
Estatística um curso foram representadas no gráfico a
Orientada a seguir.
Ciência de Dados Sabendo que a média para aprovação nesse
curso era maior ou igual a 6,0, qual foi a
porcentagem de alunos aprovados?
(A) 18% 20

(B) 21% 16

Medidas de (C) 36% 12

tendência Número de alunos

central (D) 50% 8

(E) 72% 4

4,0 5,0 6,0 7,0 8,0 Médias 24


Analisando o gráfico verificamos: 4 alunos com
média 4; 10 alunos com média 5; 18 alunos
Estatística
com média 6; 16 alunos com média 7 e 2
Orientada a
alunos com média 8; num total de 50 alunos.
Ciência de Dados
Portanto, 36 alunos possuem média igual ou
maior que 6.
Calculando a porcentagem dos aprovados
através do método da regra de três, temos:
Medidas de
tendência
central

25
Média Aritmética Ponderada
Estatística
Orientada a A Média Aritmética Ponderada, chamada
Ciência de Dados simplesmente por :
“Média Ponderada”, é calculada atribuindo-
se pesos aos valores coletados (Ponderação é
sinônimo de peso).

Média Também é utilizada em cálculo de notas,


Aritmética normalmente em provas de concursos onde
Ponderada determinadas disciplinas tem maior
importância que outras para certas áreas.
26
Média Aritmética Ponderada
Estatística A média aritmética ponderada dos números
Orientada a x1, x2, x3, ..., xn, com pesos p1, p2, p3, ..., pn,
Ciência de Dados respectivamente, é dada pela fórmula:

𝑥1 . 𝑝1 + 𝑥2 . 𝑝2 + 𝑥3 . 𝑝3 + ⋯ + 𝑥𝑛 . 𝑝𝑛
Média 𝑥ҧ =
𝑝1 + 𝑝2 + 𝑝3 + ⋯ + 𝑝𝑛
Aritmética
Ponderada

27
Exercício 02 (UNCISAL) Em cada bimestre, uma
Estatística faculdade exige a realização de quatro tipos de
Orientada a avaliação, calculando a nota bimestral pela média
Ciência de Dados ponderada dessas avaliações. Se a tabela
apresenta as notas obtidas por uma aluna nos
quatro tipos de avaliações realizadas e os pesos
dessas avaliações, sua nota bimestral foi de?

Medidas de
tendência
central

28
Exemplo Em um dia de pesca nos rios do Pantanal,
uma equipe de pescadores anotou a quantidade de
Estatística peixes capturada de cada espécie e o preço pelo qual
Orientada a eram vendidos a um supermercado de Cuiabá. Qual o
preço médio por quilo?
Ciência de Dados

Média
Aritmética
Ponderada  Neste caso o fator ponderação (peso) é a quantidade,
em quilos de peixe pescado de cada espécie
29
Estatística Exemplo Qual o preço médio por quilo?
Orientada a
Ciência de Dados

Média
Aritmética
Ponderada

30
•Média Aritmética geométrica
Estatística
Orientada a A Média Geométrica de um conjunto
Ciência de Dados de n elementos do conjunto numérico A é
a raiz enésima do produto de todos os seus
elementos.
Cálculo da média geométrica.
Média Sendo x a média geométrica dos elementos
Geométrica do conjunto numérico

31
•Média Aritmética Ponderada
Estatística
Orientada a •A = {x1, x2, x3; ...; xn}, sendo todos positivos,
Ciência de Dados nesse caso, temos, por definição:
x . x . ... . x = x1 . x2 . x3. ... . xn
n fatores

Média xn = x1 . x2 . x3. ... . xn


Geométrica

Logo: x= n
X 1. X 2. X 3.....Xn
32
Exemplo : Suponha que um automóvel
Estatística percorre os primeiros 10 quilômetros a 30
Orientada a km/h e os outros 10 km a 60 km/h, a primeira
Ciência de Dados vista pareceria que a velocidade média é de
45 km/h.
Mas esse tipo de medida é definido na Física
como a distância total percorrida dividida
pelo tempo total empregado para percorrê-
Média la. Como a distância total é 20 quilômetros e
Geométrica tempo total é 10 + 10 hora.
30 60

33
Como a distância total é 20 quilômetros e
Estatística tempo total é ∆t hora.
Orientada a
Ciência de Dados
∆𝑡1 = ∆𝑥/𝑣1 ∆𝑡2 = ∆𝑥/𝑣2
∆𝑡1 = 10/30 ∆𝑡2 = 10/60

Média
Geométrica ∆𝑡𝑡𝑜𝑡𝑎𝑙 = 10/30 + 10/60

34
Daí tem-se que a velocidade média é:
Estatística s 20 20
Orientada a Vm = = = = 40km / h
t 10 10
+
1
Ciência de Dados 30 60 2

É interessante observar que essa média


pode ser calculada como uma média
Média harmônica de 30 e 60 , isto é:
Geométrica 2
x= = 40 km / h
1 1
+
30 60
35
Estatística Por definição, a moda de uma coleção
Orientada a
Ciência de Dados de dados amostrais ou populacionais é
simplesmente o valor que aparece o
maior número de vezes, isto é, aquele
que apresenta a maior frequência
observada na tabela de distribuição de
frequências.
Moda

36
Estatística
Orientada a Em amostras grandes ou com valores
Ciência de Dados muito repetidos, há casos em que a
moda não é única, situações em que
dois ou mais valores amostrais tenham
ocorrido com a mesma frequência e esta
quantidade de ocorrências seja máxima.
Moda

37
Assim, dependendo de cada caso,
Estatística podemos ter distribuições monomodais,
Orientada a ou simplesmente modais, bimodais,
Ciência de Dados trimodais ou ainda multimodais.
Pode acontecer ainda o caso em que
todos os valores amostrais tenham
apresentado o mesmo número de
ocorrências, significando que neste caso
Moda não há moda, pois nenhum valor se
destacou, configurando assim uma
distribuição amodal.
38
Estatística
Exercício 01 Determinar a MODA, dos
Orientada a
seguintes conjuntos de valores:
Ciência de Dados
a) 2,3 2,1 1,5 1,9
 3,0 1,7 1,2 2,1
 2,5 1,3 2,0 2,7
Medidas de  0,8 2,3 2,1 1,7
tendência
central

39
Estatística
Orientada a Exercício 01 Determinar a MODA, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
 44 36 28 37 35
 33 40 36 35 37
Medidas de
tendência
central

40
Moda é o elemento (ou são os elementos) que
Estatística aparece(m) com a maior frequência na lista
Orientada a de todos os dados pesquisados. Ou seja,
Ciência de Dados aqueles elementos que se destacam pela
maior quantidade na tabela de distribuição de
frequências analisada.
Assim, vejamos nossa tabela de distribuição
de frequências da situação-problema:
Moda

41
Estatística Observe que 76 batimentos cardíacos por
Orientada a minuto é o valor que mais aparece na tabela e
Ciência de Dados que sua frequência é 9.

Neste caso, dizemos 76 é a moda dessa


amostra de dados estatísticos.

Moda

42
Agora, considerando uma outra distribuição de
Estatística frequências, poderíamos obter resultados
Orientada a diferentes:
Ciência de
Dados

Neste caso, temos uma distribuição trimodal


com os valores de 77, 80 e 90 batimentos
cardíacos por minuto.
Moda

43
Por outro, lado a distribuição abaixo é amodal,
Estatística visto que todos os valores apresentam a
Orientada a mesma frequência:
Ciência de
Dados

Moda

44
Estatística
Orientada a
Ciência de Dados A MEDIANA de uma distribuição de
frequências é definida como o valor
ocupante da posição central da coleção
ordenada de modo crescente ou
decrescente dos dados amostrais.
Mediana

45
Estatística
Orientada a Desse modo, a principal propriedade da
Ciência de Dados MEDIANA é dividir o conjunto das
informações em dois subconjuntos
iguais com o mesmo número de
elementos: os valores que são menores
ou iguais à mediana e os valores que são
Mediana maiores ou iguais à mediana.

46
Note que se um valor for extremamente
Estatística deslocado, ou seja, muito afastado dos
Orientada a outros, a mediana não será influenciada
Ciência de Dados por este ao contrário da média, pois por
definição é uma medida estatística
vinculada à posição ocupada e não à
proximidade dos valores apresentados.

Mediana Assim, se um valor for extremamente


pequeno ou grande, não influenciará no
cálculo da mediana.
47
Exemplo
Estatística  O número de gols registrados em cada
Orientada a partida de futebol, durante 13 jogos
Ciência de Dados
 Ordenando esses dados, temos:

 Podemos obter a posição i da mediana

Mediana

48
Estatística
Exercício 01 Determinar a mediana, dos
Orientada a
seguintes conjuntos de valores:
Ciência de Dados
a) 2,3 2,1 1,5 1,9
 3,0 1,7 1,2 2,1
 2,5 1,3 2,0 2,7
Medidas de  0,8 2,3 2,1 1,7
tendência
central

49
Estatística
Orientada a Exercício 01 Determinar a mediana, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
 44 36 28 37 35
 33 40 36 35 37
Medidas de
tendência
central

50
Exercício 03 O gráfico apresenta o
comportamento de emprego formal surgido,
Estatística
segundo o CAGED, no período de janeiro de
Orientada a
2010 a outubro de 2010.
Ciência de Dados
Com base no gráfico, o valor da parte inteira da
mediana dos empregos formais surgidos no
período é

Medidas de
tendência
central

51
Exercício 04 A tabela a seguir mostra a evolução
Estatística da receita bruta anual nos três últimos anos de
Orientada a cinco microempresas (ME) que se encontram à
Ciência de Dados venda.
Um investidor deseja comprar duas das
empresas listadas na tabela. Para tal, ele calcula
a média da receita bruta anual dos últimos três
anos (de 2009 até 2011) e escolhe as duas
Medidas de empresas de maior média anual.
tendência
central Quais as empresas que esse investidor decidiu
comprar ?
52
Exercício 04 A tabela a seguir mostra a evolução
da receita bruta anual nos três últimos anos de
Estatística cinco microempresas (ME) que se encontram à
Orientada a venda. Quais as duas empresas que esse
Ciência de Dados investidor decidiu comprar ?

Medidas de
tendência
central

53
Referência
Estatística
Orientada a  [1] MONTGOMERY, Douglas C.; RUNGER, George C.
Estatística aplicada e probabilidade para engenheiros.
Ciência de 6. ed. Rio de Janeiro: LTC, 2016. 629 p.
Dados  [2] MOORE, David S.; NOTZ, William I.; FLIGNER,
Michael A. A estatística básica e sua prática. 6. ed. Rio
de Janeiro: LTC, 2014. 582 p.
 [3] MEYER, Paul L. Probabilidade: aplicações à
estatística. 2. ed. Rio de Janeiro: LTC, 2011.
Referência  [4] Notas de aula USP.

54

Você também pode gostar