Você está na página 1de 89

Noções Básicas de

Estatística e
Probabilidade
Geraldo Xexéo, D.Sc.
DCC/IM & PESC/COPPE
UFRJ
Estatística

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
2
Estatística
• Estatística é um conjunto de métodos usados
para se analisar dados
• Pode ser aplicada em praticamente todas as
áreas do conhecimento humano e em
algumas áreas recebe um nome especial.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
3
Tipos de Estatística
• Estatística Descritiva
• Descreve o dados
• Estatística Inferencial
• Estuda uma amostra dos mesmos dados

https://medium.com/analytics-vidhya/descriptive-statistics-for-data-science-2f304a36ac34

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
4
População
• O conjunto de elementos para os quais
desejamos nossas conclusões
• Conjunto de informações que tenham
características comuns
• Não precisa ser de pessoas, o que importa é
a variável estudada

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
5
Amostra
• Parte (redução) da população
• Para os quais temos dados
• Sem a perda de características essenciais

https://medium.com/analytics-vidhya/descriptive-statistics-for-data-science-2f304a36ac34

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
6
Variáveis
• As variáveis nos estudos estatísticos são os
valores que assumem determinadas
características dentro de uma pesquisa

https://mundoeducacao.bol.uol.com.br/matematica/variaveis-na-estatistica.htm
• Variável Independente
• Preditora
• Manipuilado no experimento para observar o
efeito na variável dependente
• Variável Dependente
• Resposta do experimento

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
7
Medida
• Relação entre magnitude e critério

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
8
Entendendo as
Variáveis

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
9
Tipos de Variáveis

https://veterinariaexemplar.wordpress.com/2018/08/23/bioestatistica-variaveis/
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
10
Nominal
• Reprenta uma categoria
• Não tem sentido matemático
• Não permitem operações aritméticas
• Não tem uma ordem
• Homem, mulher
• Número de telephone
• Possível fazer contagens

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
11
Ordinal
• Ordenações
• Sabemos que algo é maior ou menor, mas
não podemos quantificar quanto

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
12
https://veterinariaexemplar.wordpress.com/2018/08/23/bioestatistica-variaveis/
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
13
Intervalar
• Existe uma unidade de medida
• Arbitrária
• Existe um zero relative
• Podemos somar e subtrair
• Nunca multiplicar e divider
• Exemplos:
• Temperaturas em Celsius
• Com as diferenças entre medidas de interval
podemos fazer todas as operações
geométricas
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
14
Racionais
• O zero é absoluto
• Podemos fazer todas as contas
• Por exemplo
• distância

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
15
Medidas de
Tendência Central

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
16
Tendência Central
• Valor central ou valor típico

https://www.kdnuggets.com/2019/06/statistics-data-scientists-know.html
https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
17
Média aritmética
• Média (simplesmente)
• a soma de todas as medições divididas pelo
número de observações no conjunto de
dados.

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
18
Mediana

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
• o valor do meio que separa a metade maior

http://clubes.obmep.org.br/blog/tratamento-da-informacao-medidas-de-tendencia-central/medidas-de-
da metade menor no conjunto de dados.
• A mediana e a moda são as únicas medidas de
tendência central que podem ser usadas
para nível de medição, onde valores recebem
ranks relativos aos outros mas não são medidos
absolutamente.

tendencia-central-passando-a-limpo-as-ideias/
• Se a quantidade de valores do conjunto for ímpar, a
mediana é o valor central;
• Se a quantidade de valores do conjunto for par, é
preciso tirar a Média Aritmética dos valores centrais.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
19
A expectiva normal
• Se a distribuição é normal, média e mediana
são boas medidas da tendência central
• E podem ser iguais
• Preferir a média
• Inclui todos os valores dos dados

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
20
Assimetria
• Quanto mais
assimétrica, mais a
mediana é adequada

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
21
https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
Moda
• O valor que aparece com mais frequência no

http://clubes.obmep.org.br/blog/tratamento-da-informacao-medidas-de-tendencia-central/medidas-de-
conjunto de dados.
• Essa é a única medida de tendência central que
pode ser usada com dados nominais, os quais
tem atribuições de categoria puramente
qualitativa.
• Quando um conjunto de dados não apresenta moda,
dizemos que esse conjunto é amodal.

tendencia-central-passando-a-limpo-as-ideias/
• Caso exista uma moda, denominamos o conjunto
de Unimodal.
• Existindo duas modas, denominamos o conjunto
de bimodal e assim sucessivamente.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
22
Moda (II)

https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
23
Moda (III)

https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
24
Moda - problema

https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
25
Moda – problema II

https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
26
Quando usar
Variável Melhor Medida

Nominal Moda
Ordinal Mediana
Intervalo/Razão
Média
(simétrica)
Intervalo/Razão
Mediana
(assimétrica)
Dados com outliers Mediana
(com distorção da média)

https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
27
Quadrinhos

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
28
Quadrinhos da Média…

https://novaescola.org.br/conteudo/3543/moda-media-e-mediana-quando-usar-e-como-interpretar-os-
resultados
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
29
Quadrinhos da Média…

https://novaescola.org.br/conteudo/3543/moda-media-e-mediana-quando-usar-e-como-interpretar-os-
resultados
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
30
Quadrinhos da Média…

https://novaescola.org.br/conteudo/3543/moda-media-e-mediana-quando-usar-e-como-interpretar-os-
resultados
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
31
Outras Médias

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
32
Média ponderada
• Uma média aritmética que incorpora peso
para os elementos.

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
33
Média geométrica

https://pt.wikipedia.org/wiki/M%C3%A9dia_geom%C3%A9trica
• A raiz enésima(n) do produto dos valores dos dados, onde
existem n valores.
• Essa medida é válida apenas para dados que foram medidos
absolutamente em uma escala estritamente positiva.
• A média geométrica é mais apropriada que a média aritmética
para descrever crescimentos proporcionais, tanto crescimento
exponencial (proporção constante de crescimento) e crescimento
variado; nos negócios a média geométrica da taxa de crescimento
é conhecida como composição anual da taxa

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
crescimento (CAGR). A média geométrica do crescimento sobre
períodos acarreta os equivalentes crescimentos constantes da
taxa que poderiam acarretar a mesma quantia.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
34
Média harmônica
• É o recíproco da média aritmética do
recíproco dos valores dos dados.
• Essa medida também só é válida para dados
que foram medidos absolutamente em uma
escala estritamente positiva.

https://pt.wikipedia.org/wiki/Tend%C3%AAncia_central
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
35
Medidas de
Dispersão

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
36
Dispersão
• também chamada de variabilidade ou
espalhamento)
• o quão esticada ou espremida uma
distribuição é.
• Exemplos
• variância
• o desvio padrão
• amplitude interquartil.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
37
Amplitude Interquartil
• IQR
• A distância entre o 1º quartil e o 3º quartil
• A amplitude de 50% dos dados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
38
Variância
• Média das diferenças quadradas

σ𝑁 2
2
(𝑥
𝑖=1 𝑖 − 𝜇)
𝑉𝑎𝑟 = 𝜎 =
𝑁

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
39
Desvio Padrão
• Raiz quadrada da variância

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
40
Z-Score
• Número de desvios padrões de distância para
a média

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
41
Teorema do Limite
Central

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
42
Teorema do Limite Central
• Quando o tamanho da amostra aumenta, a
distribuição amostral da sua média se
aproxima cada vez mais de uma distribuição
normal
• A média de uma amostra de n elementos
de uma população tende a uma
distribuição normal

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
43
Enunciado Formal
• Seja uma amostra aleatória simples
(X1,X2,...,Xn) de tamanho n, dada a partir de
uma população com média μ e variância 𝜎2
finita. A medida que n cresce, a distribuição
σ𝑁
𝑖=1 𝑋𝑖
amostra da média = 𝑋ത aproxima-se da
𝑛
distribuição normal com média μ e variância
𝜎2
.
𝑛

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
44
TCL - Visualização

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
45
Probabilidade

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
46
O que é Probabilidade
• A chance de algo acontecer
• Quão provável é que algum evento ocorra
• P(E) = Probabilidade de um evento E ocorrer
• n(E) = Número de maneiras que E ocorre
• n(T) = Número total de resultados possíveis

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
47
Propriedades
• Quantificada entre 0 e 1
• 0 impossível de acontecer
• 1 só pode acontecer dessa forma
• A soma da probabilidade de todos os eventos
possíveis é 1

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
48
Variáveis Aleatórias
• Um conjunto de valores possíveis em um
experimento aleatório
• Discreta ou contínua

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
49
Importância
• Atende ao tratamento de algumas formas de
incerteza
• Incerteza
• Aleatoriedade
• Conhecimento da probabilidade permite a
tomada de decisão com informação e
justificativa
• E com conhecimento dos riscos

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
50
IA/DS/ML/IC/...
• Uso de inferências estatísticas para predição,
diagnóstico, análise, etc.
• Dependem de distribuições de probabilidade
dos dados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
51
Distribuições de
Probabilidade

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
52
Distribuição de
Probabilidade
• Descreve como as probabilidades estão
distribuídas sobre os valores da variável
aleatória
• V.A. Discreta -> probability mass function f(x)
• V.A. Contínua -> probability density function
f(x)
• 0<f(X)<1

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
53
Distribuições de
Probabilidade
• Uniforme
• Binomial
• Bernouille
• Normal

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
54
Uniforme
• Os resultados de um experimento são todos
igualmente prováveis
• f(x) = 1/(b-a)
• E(x)=média=(a+b)/2
• Variância = V(x) = (b-a)2/12

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
55
Distribuição Binomial
• Experimento com n tentativas que só podem
dar 2 resultados
• Sucesso e falha
• Probabilidade de sucesso constante
• Probabilidade de k sucessos em n tentativas
com sucesso p

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
56
Exemplo (Binomial)
• Suponha que uma moeda é lançada 3 vezes
e a probabilidade de cara seja p em cada
lançamento
• Determinar a distribuição de probabilidade da
variável X, número de caras nos 3 lançamentos.
• S: sucesso, cara – probabilidade p
• F:fracasso, coroa – probabilidade q = (1-p)
• W={FFF,FFS,FSF,SFF,FSS,SFS,SSF,SSS}
• Xi é uma variável aleatória Bernoulli (i=1,2,3).
• X é o número de caras
Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
57
Exemplo (Binomial)

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
58
Visualização de Binomial

𝑉𝑎𝑟 𝑥 = 𝑛𝑝(𝑝 − 1)

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
59
Bernoulli
• Uma distribuição binomial com n=1
• E(x)=p
• Variância V(x) = p(1-p)

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
60
Distribuição Normal
• Normal ou Gaussiana
• Simétrica ao redor da média
• Dados mais perto da média são mais
frequentes que dados longe da média
• Determinada pela média e o desvio padrão

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
61
Visão Simples

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
62
Algumas normais

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
63
Distribuição Normal Padrão
• Média=0
• Desvio padrão=1

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
64
Onde estão os dados?

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
65
Kurtosis e Obliquidade

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
66
Distribuição de Poisson
• Situações onde eventos ocorrem em pontos
aleatórios de espaço e tempo
• Só queremos saber do número de eventos
• Exigências
• Um evento de sucesso não influencia o sucesso
de outro evento
• A probabilidade de sucesso em um intervalo
curto é igual a probabilidade de sucesso em um
intervalo longo
• A a probabilidade de sucesso em um intervalor
se aproxima a zero quando o intervalo fica menor
Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
67
Poisson - Exemplos
• Número de chamadas de emergência em um
hospital por dia
• Número de roubos em uma delegacia por dia
• Número de cliente chegando ao banco em
uma hora
• Número de erros em uma página de um
mesmo livro

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
68
Parâmetros (Poisson)
• λ é a taxa de ocorrência
• t é o intervalo de tempo
• X é o número de eventos no intervalo
• μ = λ*t

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
69
Gráfico Poisson
• E(X)=μ
• Var(X)=μ

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
70
Distribuição Exponencial
• Modela o intervalo de tempo entre eventos
• λ é a taxa
• de falha, de chegada de cliente, ...

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
72
Gráfico da Exponencial

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
73
Visualizando os
dados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
74
Univariados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
75
Bi-variados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
76
Multivariados

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
77
Box Plot

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
78
Exemplo Box Plot

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
79
Box Plots e grupos

https://caetreinamentos.com.br/blog/ferramentas/como-fazer-box-plot/
LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
80
Box Plot - Entendendo
• O box plot é comparativamente curto
• veja o exemplo (2). Isso sugere que os
estudantes em geral têm um alto nível de
concordância entre si.
• O box plot é relativamente alto
• veja os exemplos (1) e (3). Isso sugere que os
alunos tenham opiniões muito diferentes
sobre esse aspecto ou sub-aspecto.
• Um box plot é muito mais alto ou mais
baixo que outro
• compare (3) e (4) – isto poderia sugerir uma
diferença entre grupos. Por exemplo, o box
plot para meninos pode ser menor ou maior
que o enredo equivalente para meninas.
• Diferenças óbvias entre box plots
• veja os exemplos (1) e (2), (1) e (3), ou (2) e
(4). Qualquer diferença óbvia entre gráficos
para grupos comparativos é merecedora de
uma investigação adicional nos relatórios.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
81
Boxplot
• O box plot da sua escola é muito maior ou menor
do que o do grupo de referência nacional.
• Isso também sugere uma área de diferença que
poderia ser mais explorada nos relatórios e detalhados
através de consulta.
• As 4 seções do box plot são desiguais em
tamanho
• Veja o exemplo (1). Isso mostra que muitos alunos têm
visões semelhantes em certas partes da escala, mas
em outras partes da escala os alunos são mais
variáveis ​em seus pontos de vista.
• A estreita superior longa no exemplo significa que as
visualizações dos alunos são variadas entre o grupo
quartil mais positivo e muito semelhantes para o grupo
quartil menos positivo. Os relatórios podem ser usados
​para explorar isso mais.
• Mesma mediana, distribuição diferente
• Veja os exemplos (1), (2) e (3). As medianas (que
geralmente estão próximas da média) estão todas no
mesmo nível. No entanto, os gráficos de caixa nesses
exemplos mostram distribuições de visualizações
muito diferentes
• É sempre importante considerar o padrão de toda a
distribuição de respostas em uma caixa.

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
82
O que vocês podem dizer?

LINE-Laboratório de Tratamento
de Informação Não Estruturada
Geraldo Xexéo - xexeo@cos.ufrj.br
83
Probabilidade
Condicional

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
84
Probabilidade Condicional
• Medida de probabilidade de um evento dado
que outro evento ocorreu
• Probabilidade de (acontecer) B dado (que) A
(aconteceu)

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
85
Uso – Teorema de Bayes

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
86
FIM

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
87
Slides utilizados
• Distribuições de Bernoulli e Binomial Modelos
de Probabilidade e Inferência Estatística Prof.
Tarciana Liberal Departamento de Estatística
– UFPB

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
88
Bibliografia
• https://towardsdatascience.com/probability-for-data-science-9770b26643d0
• Costa, Sérgio F. Introdução Ilustrada a Estatística (com muito humor) 2ª Edição
Harbra 1992
• Anderson, D.R. Sweeney, D.J.. Williams, T.A. Statistics for Business and
Economics 7ª Edição South-Western College Publishing
• https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-
mode-median.php
• https://en.wikipedia.org/wiki/Normal_distribution
• https://www.statisticshowto.datasciencecentral.com/probability-and-
statistics/normal-distributions/
• https://pt.wikipedia.org/wiki/Teorema_central_do_limite
• https://towardsdatascience.com/inferential-statistics-for-data-science-
b0075670fc8a
• https://towardsdatascience.com/bayesian-statistics-for-data-science-
45397ec79c94
• https://towardsdatascience.com/statistical-learning-for-data-science-
b61b263c1196

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
89
Contato

Geraldo Xexéo
xexeo@cos.ufrj.br
gxexeo@gmail.com
Este obra está licenciado com uma Licença Creative Commons
Atribuição-NãoComercial-SemDerivações 4.0 Internacional.

Geraldo Xexéo
xexeo@cos.ufrj.br
Árvore de Decisão
90