Escolar Documentos
Profissional Documentos
Cultura Documentos
Ciência de Dados
Professor: MSc Pablo Leandro Chen Wieler
1
Estatística
Orientada a AULA SERÁ HÍBRIDA.
Ciência de Dados É OPTATIVO A IDA NO SENAI-CIC
Introdução a
ciência de dados
2
Estatística Objetivo Específicos da Aula
Orientada a
Ciência de Dados
Compreender as principais medidas estatística
de posição dispersão e separatrizes.
3
Estatística: o que é ?
Estatística
Orientada a Estatística pode ser pensada como a ciência de
aprendizagem a partir de dados.
Ciência de Dados No nosso cotidiano, precisamos tomar decisões,
muitas vezes rápidas.
Introdução a
ciência de dados
4
Amostragem e planejamento de experimentos:
Estatística mecanismo de coleta de dados;
Orientada a
Ciência de Dados Estatística descritiva: organização,
apresentação e sintetização de dados;
5
Estatística 1. DEFINIÇÃO DO PROBLEMA
Orientada a
2. PLANEJAMENTO
Ciência de Dados
3. COLETA DE DADOS
4. APURAÇÃO DOS DADOS
5. APRESENTAÇÃO DOS DADOS
6. ANÁLISE E INTERPRETAÇÃO DOS
Fases do Método DADOS
Estatístico
6
Estatística
Orientada a
Ciência de Dados DEFINIÇÃO DO PROBLEMA:
7
Estatística
Orientada a PLANEJAMENTO:
Ciência de Dados
Como levantar informações? Que dados
deverão ser obtidos? Qual levantamento a
ser utilizado? Censitário? Por
amostragem? E o cronograma de
atividades? Os custos envolvidos? Etc.
Fases do Método
Estatístico
8
Estatística
Orientada a
Ciência de Dados COLETA DE DADOS :
Fases do Método
Estatístico
9
Estatística
Orientada a
Ciência de Dados APURAÇÃO DOS DADOS :
10
APRESENTAÇÃO DOS DADOS : Há duas
Estatística formas de apresentação, que não se excluem
mutuamente:
Orientada a
Ciência de Dados A apresentação tabular: apresentação
numérica dos dados em linhas e colunas
distribuídas de modo ordenado segundo
regras práticas fixadas pelo Conselho
Nacional de Estatística.
A apresentação gráfica: os dados
numéricos constituem uma apresentação
Fases do Método geométrica permitindo uma visão rápida e
Estatístico clara do fenômeno.
11
ANÁLISE E INTERPRETAÇÃO DOS
Estatística DADOS: A última fase do trabalho
Orientada a estatístico é a mais importante e delicada.
Ciência de Dados Está ligada essencialmente ao cálculo de
medidas e coeficientes, cuja finalidade
principal é descrever o fenômeno
(estatística descritiva).
Na estatística indutiva a interpretação
Fases do Método dos dados se fundamenta na teoria da
Estatístico probabilidade.
12
Algumas definições ...
Estatística
Orientada a População: conjunto de tudo o que interessa
Ciência de Dados ao estudo de um problema de pesquisa,
segundo alguma característica pré-
selecionada;
13
Algumas definições ...
Estatística
Orientada a variável: tem por característica apresentar
Ciência de Dados uma variabilidade quando são realizadas
sucessivas mensurações;
Introdução a
ciência de dados
15
Medidas de Medidas de
Posição tendência central
Estatística
Orientada a
Ciência de Dados
• Amplitude
• Variância
Medidas de • Desvio Padrão
Medidas Dispersão • Coeficiente de
variação
descritivas
16
Estatística
Orientada a
Ciência de Dados
Medidas de
tendência Média: ponto Mediana: divide Moda: valor
de equilíbrio o conjunto em mais
central duas partes
do conjunto. iguais. provável.
17
Média Aritmética simples
Estatística
Orientada a Existem dois tipos de Média mais utilizados:
Ciência de Dados aritmética Simples e aritmética Ponderada.
18
Média Aritmética simples
Estatística
Orientada a A média aritmética dos números x1, x2, x3, ..., xn, é
Ciência de Dados dada pela fórmula:
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑥ҧ =
𝑛
Medidas de
tendência
central
19
Média Aritmética simples
Estatística
Orientada a Exemplos de utilização da média aritmética
Ciência de Dados
no cotidiano:
22
Estatística
Orientada a Exercício 01 Determinar a media, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
44 36 28 37 35
33 40 36 35 37
Medidas de
tendência
central
23
Exemplo.
Considere que as médias finais dos alunos de
Estatística um curso foram representadas no gráfico a
Orientada a seguir.
Ciência de Dados Sabendo que a média para aprovação nesse
curso era maior ou igual a 6,0, qual foi a
porcentagem de alunos aprovados?
(A) 18% 20
(B) 21% 16
(E) 72% 4
25
Média Aritmética Ponderada
Estatística
Orientada a A Média Aritmética Ponderada, chamada
Ciência de Dados simplesmente por :
“Média Ponderada”, é calculada atribuindo-
se pesos aos valores coletados (Ponderação é
sinônimo de peso).
𝑥1 . 𝑝1 + 𝑥2 . 𝑝2 + 𝑥3 . 𝑝3 + ⋯ + 𝑥𝑛 . 𝑝𝑛
Média 𝑥ҧ =
𝑝1 + 𝑝2 + 𝑝3 + ⋯ + 𝑝𝑛
Aritmética
Ponderada
27
Exercício 02 (UNCISAL) Em cada bimestre, uma
Estatística faculdade exige a realização de quatro tipos de
Orientada a avaliação, calculando a nota bimestral pela média
Ciência de Dados ponderada dessas avaliações. Se a tabela
apresenta as notas obtidas por uma aluna nos
quatro tipos de avaliações realizadas e os pesos
dessas avaliações, sua nota bimestral foi de?
Medidas de
tendência
central
28
Exemplo Em um dia de pesca nos rios do Pantanal,
uma equipe de pescadores anotou a quantidade de
Estatística peixes capturada de cada espécie e o preço pelo qual
Orientada a eram vendidos a um supermercado de Cuiabá. Qual o
preço médio por quilo?
Ciência de Dados
Média
Aritmética
Ponderada Neste caso o fator ponderação (peso) é a quantidade,
em quilos de peixe pescado de cada espécie
29
Estatística Exemplo Qual o preço médio por quilo?
Orientada a
Ciência de Dados
Média
Aritmética
Ponderada
30
•Média Aritmética geométrica
Estatística
Orientada a A Média Geométrica de um conjunto
Ciência de Dados de n elementos do conjunto numérico A é
a raiz enésima do produto de todos os seus
elementos.
Cálculo da média geométrica.
Média Sendo x a média geométrica dos elementos
Geométrica do conjunto numérico
31
•Média Aritmética Ponderada
Estatística
Orientada a •A = {x1, x2, x3; ...; xn}, sendo todos positivos,
Ciência de Dados nesse caso, temos, por definição:
x . x . ... . x = x1 . x2 . x3. ... . xn
n fatores
Logo: x= n
X 1. X 2. X 3.....Xn
32
Exemplo : Suponha que um automóvel
Estatística percorre os primeiros 10 quilômetros a 30
Orientada a km/h e os outros 10 km a 60 km/h, a primeira
Ciência de Dados vista pareceria que a velocidade média é de
45 km/h.
Mas esse tipo de medida é definido na Física
como a distância total percorrida dividida
pelo tempo total empregado para percorrê-
Média la. Como a distância total é 20 quilômetros e
Geométrica tempo total é 10 + 10 hora.
30 60
33
Como a distância total é 20 quilômetros e
Estatística tempo total é ∆t hora.
Orientada a
Ciência de Dados
∆𝑡1 = ∆𝑥/𝑣1 ∆𝑡2 = ∆𝑥/𝑣2
∆𝑡1 = 10/30 ∆𝑡2 = 10/60
Média
Geométrica ∆𝑡𝑡𝑜𝑡𝑎𝑙 = 10/30 + 10/60
34
Daí tem-se que a velocidade média é:
Estatística s 20 20
Orientada a Vm = = = = 40km / h
t 10 10
+
1
Ciência de Dados 30 60 2
36
Estatística
Orientada a Em amostras grandes ou com valores
Ciência de Dados muito repetidos, há casos em que a
moda não é única, situações em que
dois ou mais valores amostrais tenham
ocorrido com a mesma frequência e esta
quantidade de ocorrências seja máxima.
Moda
37
Assim, dependendo de cada caso,
Estatística podemos ter distribuições monomodais,
Orientada a ou simplesmente modais, bimodais,
Ciência de Dados trimodais ou ainda multimodais.
Pode acontecer ainda o caso em que
todos os valores amostrais tenham
apresentado o mesmo número de
ocorrências, significando que neste caso
Moda não há moda, pois nenhum valor se
destacou, configurando assim uma
distribuição amodal.
38
Estatística
Exercício 01 Determinar a MODA, dos
Orientada a
seguintes conjuntos de valores:
Ciência de Dados
a) 2,3 2,1 1,5 1,9
3,0 1,7 1,2 2,1
2,5 1,3 2,0 2,7
Medidas de 0,8 2,3 2,1 1,7
tendência
central
39
Estatística
Orientada a Exercício 01 Determinar a MODA, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
44 36 28 37 35
33 40 36 35 37
Medidas de
tendência
central
40
Moda é o elemento (ou são os elementos) que
Estatística aparece(m) com a maior frequência na lista
Orientada a de todos os dados pesquisados. Ou seja,
Ciência de Dados aqueles elementos que se destacam pela
maior quantidade na tabela de distribuição de
frequências analisada.
Assim, vejamos nossa tabela de distribuição
de frequências da situação-problema:
Moda
41
Estatística Observe que 76 batimentos cardíacos por
Orientada a minuto é o valor que mais aparece na tabela e
Ciência de Dados que sua frequência é 9.
Moda
42
Agora, considerando uma outra distribuição de
Estatística frequências, poderíamos obter resultados
Orientada a diferentes:
Ciência de
Dados
43
Por outro, lado a distribuição abaixo é amodal,
Estatística visto que todos os valores apresentam a
Orientada a mesma frequência:
Ciência de
Dados
Moda
44
Estatística
Orientada a
Ciência de Dados A MEDIANA de uma distribuição de
frequências é definida como o valor
ocupante da posição central da coleção
ordenada de modo crescente ou
decrescente dos dados amostrais.
Mediana
45
Estatística
Orientada a Desse modo, a principal propriedade da
Ciência de Dados MEDIANA é dividir o conjunto das
informações em dois subconjuntos
iguais com o mesmo número de
elementos: os valores que são menores
ou iguais à mediana e os valores que são
Mediana maiores ou iguais à mediana.
46
Note que se um valor for extremamente
Estatística deslocado, ou seja, muito afastado dos
Orientada a outros, a mediana não será influenciada
Ciência de Dados por este ao contrário da média, pois por
definição é uma medida estatística
vinculada à posição ocupada e não à
proximidade dos valores apresentados.
Mediana
48
Estatística
Exercício 01 Determinar a mediana, dos
Orientada a
seguintes conjuntos de valores:
Ciência de Dados
a) 2,3 2,1 1,5 1,9
3,0 1,7 1,2 2,1
2,5 1,3 2,0 2,7
Medidas de 0,8 2,3 2,1 1,7
tendência
central
49
Estatística
Orientada a Exercício 01 Determinar a mediana, dos
Ciência de Dados seguintes conjuntos de valores:
b) 37 38 33 42 35
44 36 28 37 35
33 40 36 35 37
Medidas de
tendência
central
50
Exercício 03 O gráfico apresenta o
comportamento de emprego formal surgido,
Estatística
segundo o CAGED, no período de janeiro de
Orientada a
2010 a outubro de 2010.
Ciência de Dados
Com base no gráfico, o valor da parte inteira da
mediana dos empregos formais surgidos no
período é
Medidas de
tendência
central
51
Exercício 04 A tabela a seguir mostra a evolução
Estatística da receita bruta anual nos três últimos anos de
Orientada a cinco microempresas (ME) que se encontram à
Ciência de Dados venda.
Um investidor deseja comprar duas das
empresas listadas na tabela. Para tal, ele calcula
a média da receita bruta anual dos últimos três
anos (de 2009 até 2011) e escolhe as duas
Medidas de empresas de maior média anual.
tendência
central Quais as empresas que esse investidor decidiu
comprar ?
52
Exercício 04 A tabela a seguir mostra a evolução
da receita bruta anual nos três últimos anos de
Estatística cinco microempresas (ME) que se encontram à
Orientada a venda. Quais as duas empresas que esse
Ciência de Dados investidor decidiu comprar ?
Medidas de
tendência
central
53
Referência
Estatística
Orientada a [1] MONTGOMERY, Douglas C.; RUNGER, George C.
Estatística aplicada e probabilidade para engenheiros.
Ciência de 6. ed. Rio de Janeiro: LTC, 2016. 629 p.
Dados [2] MOORE, David S.; NOTZ, William I.; FLIGNER,
Michael A. A estatística básica e sua prática. 6. ed. Rio
de Janeiro: LTC, 2014. 582 p.
[3] MEYER, Paul L. Probabilidade: aplicações à
estatística. 2. ed. Rio de Janeiro: LTC, 2011.
Referência [4] Notas de aula USP.
54