Você está na página 1de 45

Estatística Orientada a

Ciência de Dados
Professor: Pablo Leandro Chen Wieler
– E-mail principal
pablo.wieler@sistemafiep.org.br
Contato com o
professor
– E-mail particular
pabloelt@gmail.com

2
Objetivo Específicos Geral

Apresentação plano de aula


Objetivo Apresentação contrato pedagógico
Específicos
Geral Apresentar a estrutura da disciplina de
Estatística Orientada a Ciência de Dados.

3
EMENTA – Parte 1
Estatística
Orientada a
 Análise Exploratória de Dados: Elementos de Dados
Ciência de Estruturados,
Dados  Dados Retangulares, Estimativas de Localização (média,
moda, mediana e estimativa robusta), Estimativas de
Variabilidade (desvio padrão, Percentis),
 Explorando a Distribuição de Dados (Percentis e Boxplot),
 Correlação e gráficos de dispersão, Explorando Duas ou Mais
Variáveis,
EMENTA
 Aplicações em softwares; Distribuições de Dados e
Amostras: Amostragem Aleatória e Viés de Amostra,
4
 EMENTA – Parte 2
Estatística
Orientada a  Viés de Seleção, Distribuição de Amostragem de uma
Ciência de Estatística,
Dados  Intervalos de Confiança, Distribuição Normal, Distribuições
de Cauda Longa Distribuição t de Student,
 Distribuição Binomial, Poisson e Distribuições Relacionadas
Aplicações em softwares; Experimentos Estatísticos e Teste
de Significância: Testagem A/B, Testes de Hipótese, Testes t,
Testagem Múltipla, ANOVA, aplicações em softwares;
 Regressão e Previsão: Regressão Linear, Regressão múltipla
EMENTA Previsão usando Regressão, Regressão Polinomial e Spline,
Aplicações em softwares;

5
Bibliografia Básica:
Estatística
Orientada a
 [1] NETO, Pedro Luiz de Oliveira Costa. Estatística. Editora Blucher, 2002. Biblioteca
Ciência de
Virtual Pearson
Dados
 [2] FARBER, B.; LARSON, R. Estatística Aplicada. 4ª Edição. São Paulo, 2010. Biblioteca
Virtual Pearson

 [3] BONAFINI, Fernanda Cesar. Estatística. São Paulo: Pearson Education do Brasil, 2012.
Biblioteca Virtual Pearson

EMENTA

6
 Carga Horária: 80 h (1 Bimestre + 2 Bimestre)

Estatística Nota
Orientada a
Ciência de 𝑁𝑃1 +𝑁𝑃2
Dados 𝑀𝐸𝐷𝐼𝐴_𝑁𝑂𝑇𝐴 =
2

Nota

7
MÉDIA > 7,0 e Frequência > 75% - Aprovado
Estatística
Orientada a MÉDIA > 4,0 e < 7,0 e Frequência > 75% -
Ciência de Exame Final
Dados
MÉDIA <4,0 ou Frequência < 75% -
Reprovado

Nota

8
 Recuperação
Estatística  Todo o conteúdo;
Orientada a
Ciência de
Dados

Nota

9
 Carga Horária: 80 h

Estatística  2 Avaliações:
Orientada a
Ciência de 1ª Avaliação - 21/set: 2ª Avaliação- 30/nov:
Dados - Avaliação 3,0 - Avaliação 3,0
- Listas-> 4,0 - Listas -> 4,0
- Trabalhos ->2,0 - Trabalhos ->2,0
- APS 1,0 - APS 1,0

Nota

10
Objetivo Específicos da Aula
Estatística
Orientada a
Ciência de Dados  Evidenciar a importância da Estatística.

 Apresentar os principais conceitos e aplicações


da Estatística.
Introdução a  Apresentar a estrutura da disciplina de
ciência de dados
Estatística Orientada a Ciência de Dados.
Apresentação da Disciplina
Estatística
Orientada a
Ciência de Dados  A Estatística associa dados aos problemas gerando
informações relevantes para o estabelecimento de
conclusões capazes de viabilizar a tomada de
decisões em ambientes de incertezas e variações.
Introdução a
ciência de dados
CONCEITOS BÁSICOS
Estatística
Orientada a
 A Estatística pode ser definida como o conjunto
Ciência de Dados de ferramentas para coleta, organização, análise e
interpretação de dados experimentais.

 O objeto de estudo em Estatística é um conjunto


Introdução a de dados que pode constituir uma população ou
uma amostra.
ciência de dados
Estatística

Estatística  Atualmente as informações numéricas são


Orientada a necessárias para cidadãos e organizações de
Ciência de Dados qualquer natureza e parte do mundo
globalizado.

 Aplicações
 Índices econômicos,.
Introdução a  Pesquisa de intenção de votos.
ciência de dados  Gráficos de média publicados na mídia “Big data”
Estatística
Orientada a Estatística
Ciência de Dados
A estatística é fundamenta na análise de
dados provenientes de processos em que
existe variabilidade.

Introdução a
ciência de dados
Estatística Importância da Estatística
Orientada a
Ciência de Dados  Que tipos de informações são necessárias?

 Qual quantidade de informações é suficiente?

Introdução a  Como processar estas informações ?


ciência de dados
Importância da Estatística
Estatística
Orientada a Método estatístico são fundamentais para o trabalho como:
Ciência de Dados  Processos industriais:
 O Controle Estatístico de Processos (CEP) é uma
ferramenta da qualidade utilizada nos processos
produtivos (e de serviços) com objetivo de fornecer
Introdução a informações para um diagnóstico mais eficaz na
ciência de dados prevenção e detecção de defeitos/problemas nos
processos avaliados.
Importância da Estatística
Estatística
Orientada a
Ciência de Dados Método estatístico são fundamentais para o trabalho
como:
 Pesquisadores: A partir de uma amostra generalizar as
suas conclusões.
Introdução a
 Setor farmacêutica;
ciência de dados
 Engenharias entre outros.
Importância da Estatística
Estatística
Orientada a Método estatístico são fundamentais para o trabalho
Ciência de Dados
como:
 Médicos: a partir de coletas de amostra generalizar solução
para população inteiras.

Introdução a  Economista: para sintetizar todo o comportamento de uma


ciência de dados sociedade em relação a um número.
Áreas da Estatística
Estatística
Orientada a
A teoria da Estatística divide-se em três grandes
Ciência de Dados áreas:

 Estatística Descritiva

 Estatística Indutiva
Introdução a
ciência de dados  Probabilidade
Áreas da Estatística
Estatística
Orientada a  Probabilidade: Consiste no estudo da
Ciência de Dados aleatoriedade e da incerteza.

 Utiliza-se métodos de quantificação das chances


associadas aos diversos resultados. Como
exemplo:
 Jogar varias vezes 2 dados simultaneamente.
Probabilidade  Retirada de cartas de baralhos
 Determinar a vida útil de um componente eletrônico.
Probabilidade
Estatística
Orientada a
Ciência de Dados Consiste no estudo da aleatoriedade e da
incerteza do caso de estudo.

Utiliza métodos de quantificação das chances


associadas aos diversos resultados.

Probabilidade
Probabilidade
Estatística
Orientada a Resolução
Ciência de Dados
Observar a frequência de
ocorrência do evento

Probabilidade
Probabilidade
Estatística
Orientada a
Exemplo:
Ciência de Dados
 Qual é a probabilidade de um sistema
eletrônico falhar depois de uma ano de
operação?

Probabilidade
Estatística Resolução
Orientada a
Ciência de Dados  Divide-se o número de vezes em que o fato de
interesse ocorreu pelo número de observações
realizadas obtendo-se uma estimativa para a
Probabilidade P(x) de ocorrência desse evento.

Probabilidade
Exemplos de Probabilidade

Estatística  Em uma prova com múltipla escolha, qual a probabilidade


Orientada a de acertar uma questão “chutando ”?
Ciência de Dados
 Qual a probabilidade de chover nesse final de semana?

 Jogamos dois dados comuns.


Qual a probabilidade de que
o total de pontos seja igual a 10?
Probabilidade
Estatística Áreas da Estatística
Orientada a
Ciência de Dados
 Estatística Descritiva: refere-se as técnicas de
sintetização, organização e descrição de dados.
 Descrever um determinado fenômeno

Estatística
Descritiva
Estatística Descritiva

Estatística  A estatística descritiva utiliza um conjunto de técnicas tais


Orientada a como: medidas de posição e dispersão, tabelas e gráficos para
resumir as características dos dados coletados.
Ciência de Dados

Estatística
Descritiva
Estatística Descritiva
Estatística  Exemplo INPC (Índice Nacional de preços ao consumidor), foi
Orientada a criado inicialmente com o objetivo de orientar os reajustes de
Ciência de Dados salários dos trabalhadores.
 Esse reajuste é um número partir de vários dados.

Estatística
Descritiva
Estatística Descritiva
Estatística
Orientada a  IBGE -> População paranaense
Ciência de Dados

Estatística
Descritiva
Estatística Descritiva
Estatística
Orientada a  IBGE -> Educação paranaense
Ciência de Dados

Estatística
Descritiva
Áreas da Estatística
Estatística
Orientada a
A teoria da Estatística divide-se em três grandes
Ciência de áreas:
Dados
 Estatística Indutiva: compreende as técnicas
por meio das quais são tomadas decisões
Estatística sobre a população baseadas na observações de
Indutiva ou
inferencial amostras.
Estatística Indutiva ou inferencial
Estatística
Orientada a  É aquela que partindo de uma amostra estabelece
hipótese, tira conclusões sobre a população de origem
Ciência de Dados e que formula previsões fundamentando-se na teoria
das probabilidades.

Estatística  A estatística indutiva cuida da análise de interpretação


dos dados.
Indutiva ou
inferencial
Estatística Indutiva ou inferencial
Estatística
Orientada a  O processo de generalização do método indutivo está
Ciência de Dados associado a uma margem de incerteza. Isto se deve ao fato de
que a conclusão que se pretende obter para o conjunto de
todo.

 O processo de generalização do método indutivo está


Estatística associado a uma margem de incerteza.
Indutiva ou
inferencial  Os indivíduos analisados quanto a determinadas características
comuns baseia-se em uma parcela do total de observações.
Estatística Indutiva ou inferencial
Estatística
Orientada a CONCEITOS INICIAIS
Ciência de Dados  População: É um conjunto de indivíduos (ou objetos)
tendo pelo menos uma característica (variável) comum
(ou características – variáveis comuns).

Estatística  Amostra: é a representativa da população, os


resultados da amostra podem ser usados para inferir
Indutiva ou sobre a população - Inferência Estatística
inferencial
Estatística Indutiva ou inferencial
Estatística
Orientada a CONCEITOS INICIAIS
População
Ciência de Dados
Amostra

Amostragem

Estatística
Indutiva ou
ESTATÍSTICA
inferencial PARÂMETRO É uma medida usada
É uma medida usada para descrever para descrever uma
uma característica da população característica da
amostra
Estatística COLETA DE DADOS
Orientada a
Ciência de Dados  Os dados são base para a tomada de decisões confiáveis
durante análise de um problema.

 Os dado são úteis quando eles geram algum tipo de ação.

Estatística  A coleta de dados pode se basear em dados históricos ou em


Indutiva ou experimentos planejados.
inferencial
COLETA DE DADOS
Estatística
Orientada a  Dados históricos são dados que já estão disponíveis na
Ciência de Dados empresa e, por isso, podem ser obtidos sem inferência
no processo.

 Experimentos planejados envolvem mudanças

Estatística propositais realizadas nos fatores do processo (causa),


Indutiva ou de modo que se possa avaliar os possíveis alterações
inferencial sofridas pelas características de qualidade (efeito),
como também as razões desta alterações.
Exemplo de estatística Indutiva ou inferencial

Estatística  Intensão de Voto para


Orientada a governador PR no 1º turno 2018
Ciência de Dados
 Candidato 1 – 45%

 Candidato 2 – 20,2%

 Candidato 3 – 11,4%
Estatística
Indutiva ou  Candidato 4 – 7,1%
inferencial  Outros – 16,3%
Exemplo de estatística Indutiva ou
Estatística inferencial
Orientada a  Calcular o tamanho do deposito
Ciência de Dados para número X de caixa de papelão

 Para calcular o tamanho do


depósito, primeiramente
Estatística determinar a largura média de um
Indutiva ou lote de caixa. Assim calcular o

inferencial espaço mais preciso do meu


estoque.
Exemplo de estatística Indutiva ou inferencial
Estatística
Orientada a
Ciência de Dados  Ocorrência de chuva – Meteorologia

 Produção industrial – Crescimento da produção.


Estatística
Indutiva ou
inferencial
Resumo

Estatística
 A estatística descritiva envolve a organização, resumo
Orientada a e representação dos dados. As metodologias
Ciência de Dados empregadas são tabelas de frequência; gráficos;
cálculo de medidas de tendência central como média,
mediana e moda; e cálculo de medidas de variação
como variância e desvio padrão.

 Já na estatística Indutiva ou inferencial estamos


Estatística sempre ligados em utilizar as informações de uma
amostra para chegar a conclusões sobre um grupo
Indutiva ou maior, ao qual não temos acesso. Nesse sentido, uma
metodologia muito utilizada na estatística inferencial é
inferencial a probabilidade.

Fonte: https://posgraduando.com/diferenca-entre-estatistica-descritiva-e-inferencial/
Referência

Estatística
 [1] NETO, Pedro Luiz de Oliveira Costa. Estatística. Editora Blucher,
Orientada a
2002. Biblioteca Virtual Pearson
Ciência de
Dados  [2] FARBER, B.; LARSON, R. Estatística Aplicada. 4ª Edição. São
Paulo, 2010. Biblioteca Virtual Pearson

 [3] BONAFINI, Fernanda Cesar. Estatística. São Paulo: Pearson


Education do Brasil, 2012. Biblioteca Virtual Pearson

Referência  [4] D´AGOSTINI, Fabiano Pasqual. Apostila básica Estatística.


JOAÇABA, JULHO - 2009
ARREDONDAMENTO Regra sugerida:
Estatística  Para arredondamento com aproximação de uma casa decimal (nos
Orientada a décimos), observar o dígito da segunda casa decimal.
Ciência de Dados
 Se este dígito é menor que 5, mantém o dígito da primeira casa decimal,
porém, se este dígito é igual ou maior que 5, adicione uma unidade no dígito
da primeira casa decimal.

𝐷𝑖𝑣𝑖𝑑𝑖𝑟 65 𝑝𝑜𝑟 29

ARREDONDAMENTO

𝐷𝑖𝑣𝑖𝑑𝑖𝑟 183 𝑝𝑜𝑟 12


ARREDONDAMENTO Regra sugerida:
Estatística  Para arredondamento com aproximação de duas casas decimais (nos
Orientada a centésimos), procede-se da mesma forma, observando neste caso o dígito
Ciência de Dados da terceira casa decimal. E assim se estende esta regra, se desejar
arredondamento com mais de duas casas decimais

𝐷𝑖𝑣𝑖𝑑𝑖𝑟 65 𝑝𝑜𝑟 29

ARREDONDAMENTO

𝐷𝑖𝑣𝑖𝑑𝑖𝑟 183 𝑝𝑜𝑟 12

Você também pode gostar