Você está na página 1de 14

27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina

Mellow Yellow 23/03/2023


Notas de margem
Tarefas de Aprendizado

Mellow Yellow 23/03/2023

tarefas preditivas, algoritmos de AM são aplicados a conjuntos de


dados de treinamento rotulados para induzir um modelo preditivo
capaz de predizer, para um novo objeto representado pelos
valores de seus atributos preditivos, o valor de seu atributo alvo.

Mellow Yellow 23/03/2023

Modelos preditivos podem ser utilizados, por exemplo, para, a


partir de seus sintomas, predizer o estado de saúde de um
paciente.

Mellow Yellow 23/03/2023

Nessas tarefas, em geral são utilizados algoritmos de AM que


seguem o paradigma de aprendizado supervisionado.

Mellow Yellow 23/03/2023

O termo supervisionado vem da simulação da presença de um


“supervisor externo”

Mellow Yellow 23/03/2023

tarefas de descrição, ao invés de predizer um valor, algoritmos de


AM extraem padrões dos valores preditivos de um conjunto de
dados.

Mellow Yellow 23/03/2023

Como não fazem uso do conhecimento do “supervisor externo”,


esses algoritmos usam o paradigma de aprendizado não
supervisionado.

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 1/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Uma das principais tarefas descritivas, agrupamento de dados,


procura grupos de objetos similares entre si no conjunto de dados.
Outra tarefa descritiva é encontrar regras de associação, que
associam valores de um subconjunto de atributos preditivos a
valores de outro subconjunto.

Mellow Yellow 23/03/2023

As tarefas preditivas se distinguem pelo valor de rótulo a ser


predito: discreto, no caso de tarefas de classificação; e contínuo,
no caso de tarefas de regressão.

Mellow Yellow 23/03/2023

As tarefas descritivas são genericamente divididas em:


agrupamento, que dividem os dados em grupos de acordo com
sua similaridade; sumarização, que buscam uma descrição
simples e compacta para um conjunto de dados; e associação, que
procuram padrões frequentes de associações entre os atributos de
um conjunto de dados.

Mellow Yellow 23/03/2023

Agrupamento semissupervisionado é usado quando os dados não


são rotulados, mas são conhecidas algumas restrições sobre os
dados, como pares de objetos que devem estar no mesmo grupo
ou em grupos diferentes.

Mellow Yellow 23/03/2023

A classificação semissupervisionada é utilizada em tarefas de


classificação em que apenas parte dos exemplos de treinamento
possui um rótulo de classe.

Mellow Yellow 23/03/2023

regressão semissupervisionada.

O que é a regressão???

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 2/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

O aprendizado semissupervisionado procura aumentar o número


de objetos rotulados.

Mellow Yellow 23/03/2023

O modelo induzido com os dados rotulados disponíveis é utilizado


para rotular dados não rotulados.

Mellow Yellow 23/03/2023

Esses dados podem então ser adicionados ao conjunto de


treinamento e o processo se repete até que os dados que
satisfaçam uma dada condição sejam rotulados.

Mellow Yellow 23/03/2023

Como todos os dados não rotulados são utilizados e recebem um


rótulo, podem ser dados redundantes,

Mellow Yellow 23/03/2023

Uma estratégia de aprendizado ativo seleciona iterativamente os


dados a serem rotulados e o rótulo a ser atribuído a cada um
deles, que pode incluir a consulta a um oráculo. Assim, apenas os
dados que apresentam uma característica ausente nos dados
rotulados, com possibilidade de melhorar a qualidade do modelo
induzido, são selecionados. Os dados que não forem selecionados
são descartados.

Mellow Yellow 23/03/2023

aprendizado por reforço, que reforça ou recompensa uma ação


considerada positiva e pune uma ação considerada negativa. Um
exemplo de tarefa de reforço é a de ensinar um robô a encontrar a
melhor trajetória entre dois pontos.

Mellow Yellow 23/03/2023

Aprendizado de Máquina e Indução de Modelos

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 3/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

a regra também deve ser válida para outros objetos do mesmo


domínio ou problema, que não fazem parte do conjunto de
treinamento. A essa propriedade de um modelo continuar a ser
válido para novos objetos dá-se o nome capacidade de
generalização.

Mellow Yellow 23/03/2023

Quando um modelo apresenta uma baixa capacidade de


generalização, a regra está superajustada aos dados (overfitting).
Isso significa que o modelo memorizou ou se especializou nos
dados de treinamento.

Mellow Yellow 23/03/2023

Na situação inversa, quando o modelo possui baixa capacidade


preditiva para os dados de treinamento, pode ter ocorrido um
subajuste (underfitting). Subajuste geralmente ocorre quando os
dados de treinamento disponíveis são pouco representativos ou
quando o modelo usado é muito simples e não captura os padrões
existentes nos dados

Mellow Yellow 23/03/2023

Viés Indutivo

Mellow Yellow 23/03/2023

redes neurais artificiais representam um modelo por um conjunto


de valores reais, associados aos pesos das conexões da rede.
Árvores de decisão utilizam uma estrutura de árvore em que cada
nó interno é representado por uma pergunta referente ao valor de
um atributo e cada nó externo está associado a uma classe. A
linguagem ou representação usada define a preferência ou viés
(bias) de representação do algoritmo,

Mellow Yellow 23/03/2023

A forma como um algoritmo procura pelo melhor modelo, espaço


de possíveis modelos, define um outro viés, o viés de busca.

Mellow Yellow 23/03/2023 IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
INTRODUÇÃO AOS DADOS poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 4/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Conjuntos de dados são formados por objetos que podem


representar um objeto físico, como uma cadeira, ou uma noção
abstrata, como os sintomas apresentados por um paciente que se
dirige a um hospital. Tais objetos também são comumente
referidos como padrões, instâncias, objetos, registros ou
exemplos. Em geral, cada objeto é descrito por um conjunto de
atributos preditivos (também chamados de atributos de entrada, de
vetores de variáveis e de vetores de características). Cada objeto
corresponde a uma ocorrência dos dados. Cada atributo está
associado a uma propriedade do objeto.

Mellow Yellow 23/03/2023

Técnicas de pré-processamento são frequentemente utilizadas


para corrigir problemas nos dados e para tornar os conjuntos de
dados mais adequados para o uso de algoritmos de AM.

Mellow Yellow 23/03/2023

As técnicas voltadas ao pré-processamento podem ser agrupadas


nos seguintes tipos de tarefas: ■Integração de dados; ■Eliminação
manual de atributos; ■Amostragem de dados; ■Balanceamento de
dados; ■Limpeza de dados; ■Redução de dimensionalidade;
■Transformação de dados.

Mellow Yellow 23/03/2023

dados armazenados em mais de uma base ou conjunto de dados.


Assim, os dados podem vir de mais de uma fonte ou tabela
atributo-valor. Quando dados presentes em diferentes conjuntos
precisam ser utilizados por um algoritmo de AM, esses conjuntos
devem ser integrados de forma a constituir um único conjunto ou
tabela. Essa integração pode levar a inconsistências e
redundâncias.

Mellow Yellow 23/03/2023

Problemas como redundância e inconsistência muitas vezes estão


relacionados com uma grande quantidade de dados. Técnicas de
amostragem e de seleção de atributos têm sido empregadas
nessas situações.

Mellow Yellow 23/03/2023

IMPRESSO POR: 231506049@pucrs.edu.br. A


algumas classes podem ter um número de objetos muito superior a impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
outras, formando um conjunto de dados desbalanceado. parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 5/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Os dados podem estar incompletos por causa da ausência de


valores. Os dados podem ser inconsistentes em razão de erros na
sua geração, captação ou entrada.

Mellow Yellow 23/03/2023

Para lidar com eles, diversas técnicas para limpeza de dados têm
sido propostas e investigadas na literatura de AM.

Mellow Yellow 23/03/2023

dificuldades em utilizar os dados no seu formato original. Para


tratar desse problema, são realizadas transformações nos dados
originais antes que eles sejam utilizados pelo algoritmo. Um
exemplo simples de transformação é a conversão de valores
simbólicos em valores numéricos e vice-versa. Um exemplo mais
complexo é a transformação de vídeos para valores numéricos.

Mellow Yellow 23/03/2023

ANÁLISE DE DADOS

Mellow Yellow 23/03/2023

Caracterização de Dados

Mellow Yellow 23/03/2023

um conjunto dados podem ser representados por uma matriz de


objetos Xn × d, em que n é o número de objetos e d é o número de
atributos de entrada de cada objeto. O valor de d define a
dimensionalidade dos objetos ou do espaço de objetos (também
chamado de espaço de entradas ou espaço de atributos). Cada
elemento dessa matriz, xji ou xij, contém o valor da j-ésima
característica para o i-ésimo objeto. Os d atributos também podem
ser vistos como um conjunto de eixos ortogonais e os objetos,
como pontos no espaço de objetos de dimensão d.

Mellow Yellow 23/03/2023

No conjunto hospital, cada objeto corresponde a um paciente,


IMPRESSO POR: 231506049@pucrs.edu.br. A
sendo por isso formado pelos valores de atributos de entrada impressão de notas e realces são apenas para uso
referentes ao paciente. pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 6/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Esses atributos são: identificação, nome, idade, sexo, sintomas e


resultados de exames clínicos.

Mellow Yellow 23/03/2023

atributo alvo, também denominado atributo meta ou de saída, que


representa o que queremos prever. Para tarefas descritivas, o
conjunto de dados não precisa ter atributo alvo. Já para as tarefas
preditivas, o atributo alvo precisa estar presente,

Mellow Yellow 23/03/2023

existem tarefas preditivas com mais de um atributo alvo, como é o


caso da classificação multirrótulo

Mellow Yellow 23/03/2023

Quando os valores do atributo alvo identificam categorias ou


classes às quais os objetos pertencem, ele é denominado classe e
assume valores discretos 1, ..., k. Tem-se, nesse caso, uma tarefa
de classificação.

Mellow Yellow 23/03/2023

Quando a tarefa de classificação tem apenas 2 classes, ela é uma


tarefa de classificação binária.

Mellow Yellow 23/03/2023

Se as classes tiverem diferentes números de objetos, a classe com


o maior número é denominada classe majoritária, e a com menos,
minoritária.

Mellow Yellow 23/03/2023

Se, por outro lado, o atributo alvo contém valores numéricos


contínuos, tem-se um problema de regressão

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 7/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Os valores que um atributo pode assumir podem ser definidos de


diferentes formas. Neste livro, são definidos por dois aspectos: tipo
e escala. O tipo de um atributo diz respeito ao grau de quantização
nos dados, e a escala indica a significância relativa dos valores.

Mellow Yellow 23/03/2023

é importante notar que alguns atributos não seguem


necessariamente essa classificação, tais como textos e imagens,2
que podem ser considerados não estruturados.

Mellow Yellow 23/03/2023

Tipo

Mellow Yellow 23/03/2023

O tipo define se o atributo representa quantidades, sendo então


denominado quantitativo ou numérico, ou qualidades, quando é
chamado de qualitativo, simbólico ou categórico, pois os valores
podem ser associados a categorias.

Mellow Yellow 23/03/2023

Apesar de alguns atributos qualitativos poderem ter seus valores


ordenados, operações aritméticas não podem ser aplicadas aos
seus valores.

Mellow Yellow 23/03/2023

Os valores de um atributo quantitativo podem tanto ser ordenados


quanto utilizados em operações aritméticas. Valores quantitativos
podem ser ainda contínuos ou discretos.

Mellow Yellow 23/03/2023

Atributos contínuos podem assumir um número infinito de valores.

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 8/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Exemplos de atributos contínuos são atributos que representam


peso, tamanho e distância.

Mellow Yellow 23/03/2023

Atributos discretos contêm um número finito ou infinito contável de


valores. Um caso especial dos atributos discretos são os atributos
binários (ou booleanos), que apresentam apenas dois valores,
como 0/1, sim/não, ausência/presença e verdadeiro/falso.

Mellow Yellow 23/03/2023

Escala

Mellow Yellow 23/03/2023

A escala define as operações que podem ser realizadas sobre os


valores do atributo. Em relação á escala, os atributos podem ser
classificados como nominais, ordinais, intervalares e racionais. Os
dois primeiros são do tipo qualitativo e os dois últimos são
quantitativos.

Mellow Yellow 23/03/2023

Na escala nominal, os valores são apenas nomes diferentes,


carregando a menor quantidade de informação possível. Não
existe uma relação de ordem entre seus valores. Assim, as
operações mais utilizadas para manipulação de seus valores são
as de igualdade e desigualdade de valores.

Mellow Yellow 23/03/2023

Os valores em uma escala ordinal refletem também uma ordem


das categorias representadas. Dessa forma, além dos operadores
anteriores, operadores como <, >, ≤, ≥ podem ser utilizados. Por
exemplo, quando um atributo possui como valores pequeno, médio
e grande, além de os valores serem categóricos, é possível definir
se um valor é igual, maior ou menor que outro.

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 9/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 23/03/2023

Na escala intervalar, os atributos são representados por números


que variam dentro de um intervalo. Assim, é possível definir tanto a
ordem quanto a diferença em magnitude entre dois valores. A
diferença em magnitude indica a distância que separa dois valores
no intervalo de possíveis valores. O valor zero não tem o mesmo
significado que o zero utilizado em operações aritméticas. Por
exemplo, seja a escala de temperatura dada em graus Celsius. Se
o serviço de previsão do tempo em dias de verão para uma dada
cidade informa que a temperatura vai variar entre 26 e 34 graus e
em dias de inverno, para a mesma cidade, informa que vai variar
entre 13 e 21 graus, tem-se que a temperatura dessa cidade
apresenta uma variação de 8 graus entre a mínima e a máxima,
não importa se a estação do ano é verão ou inverno. Entretanto,
90 graus Celsius é diferente de 90 graus Fahrenheit, apesar de
ambos os valores se referirem ao atributo temperatura, do mesmo
modo que não é possível afirmar que no inverno a cidade é duas
vezes menos quente que no verão, pois não faz sentido, para esse
atributo, utilizar como informação a razão entre dois valores. Isso
ocorre porque o ponto em que esse atributo assume o valor 0,
chamado de ponto zero ou origem da escala, é definido de forma
arbitrária. Isso é uma característica dos atributos intervalares. Esse
problema seria eliminado se fosse utilizada a escala de
temperatura Kelvin, cujo valor do ponto zero é o ponto zero
verdadeiro (Pyle, 1999). Outros exemplos são a duração de um
evento em minutos e datas em um calendário.

Mellow Yellow 23/03/2023

Atributos com escala racional são os que carregam mais


informações. Os números têm um significado absoluto, ou seja,
existe um zero absoluto junto com uma unidade de medida, de
forma que a razão tenha significado. Por exemplo, considerando o
número de vezes que uma pessoa foi ao hospital, o ponto zero
está associado a não ter ocorrido nenhuma visita.

Mellow Yellow 23/03/2023

Exploração de Dados

Mellow Yellow 23/03/2023

Dados Univariados

Mellow Yellow 27/03/2023

Medidas de Localidade
IMPRESSO POR: 231506049@pucrs.edu.br. A
impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 10/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 27/03/2023

As medidas de localidade definem pontos de referência nos dados


e variam para dados numéricos e simbólicos. Para dados
simbólicos, utiliza-se geralmente a moda, que é o valor encontrado
com maior frequência para um atributo.

Mellow Yellow 27/03/2023

Para atributos numéricos, medidas muito utilizadas são média,


mediana e percentil.

Mellow Yellow 27/03/2023

Um problema da média é a sua sensibilidade á presença de


outliers, que são valores muito diferentes dos demais valores
observados para o mesmo atributo

Mellow Yellow 27/03/2023

Esse problema é minimizado com o uso da mediana, que é menos


sensível a outliers. Para usar a mediana, o primeiro passo é
ordenar de forma crescente o conjunto de valores.

Mellow Yellow 27/03/2023

Assim, se o número de valores, n, é impar, a mediana é igual ao


valor do meio do conjunto ordenado. Caso contrário, se for par, é
dada pela média dos dois valores do meio.

Mellow Yellow 27/03/2023

Por exemplo, seja o conjunto de valores {17, 4, 8, 21, 4}. A


ordenação desse conjunto gera a sequência de valores (4, 4, 8,
17, 21). Observe que valores repetidos são mantidos na
sequência. Como o número de valores é ímpar, 5, a mediana é
dada pelo terceiro valor; assim, a mediana = 8. Se o conjunto de
valores fosse formado pelos elementos, {17, 4, 8, 21, 4, 15, 13, 9},
como o número de elementos, 8, é par, a mediana é dada pela
média entre o quarto e quinto valores da sequência ordenada (4, 4,
8, 9, 13, 15, 17, 21). Nesse caso, mediana = (9 + 13)/2 = 11. O uso
da mediana torna mais fácil observar se a distribuição é oblíqua
(assimétrica) ou se existem outliers.

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 11/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 27/03/2023

Exitem ainda variações da média e da mediana, como, por


exemplo, a média truncada, que minimiza os problemas da média
por meio do descarte dos exemplos nos extremos da sequência
ordenada dos valores. Para isso, é necessário definir a
porcentagem dos exemplos a serem eliminados em cada
extremidade.

Mellow Yellow 27/03/2023

Outras medidas muito utilizadas são os quartis e os percentis.


Assim como a mediana, essas medidas são utilizadas após os
valores serem ordenados. Enquanto a mediana divide os dados ao
meio, essas outras medidas utilizam pontos de divisão diferentes.
Os quartis dividem os valores ordenados em quartos. Assim, o 1o
quartil de uma sequência, Q1, é o valor que tem 25% dos demais
valores abaixo dele. Esse também é o valor do 25o percentil,
P25%. O 2o quartil (Q2) é a mediana, que é igual ao 50o percentil,
P50%. Por fim, o 3o quartil (Q3) corresponde ao valor que tem
75% dos demais valores abaixo dele (ou P75%). Seja p um valor
entre 0 e 100. O po percentil, Pp, é um valor xi do conjunto de
valores tal que p% dos valores observados são menores que xi.
Assim, o 40o percentil, P40%, de um conjunto de valores é o valor
para o qual 40% dos demais valores são menores ou iguais a ele.
Para calcular o po percentil, basta seguir os passos do Algoritmo
2.1.

Mellow Yellow 27/03/2023

Algoritmo 2.1Algoritmo para cálculo do percentil Entrada: Um


conjunto de n valores e o percentil p – valor real entre 0,0 (equivale
a 0%) e 1,0 (equivale a 100%) – a ser retornado Saída: Valor do
percentil

Ver cartão com algoritmo

Mellow Yellow 27/03/2023

Medidas de Espalhamento

Mellow Yellow 27/03/2023

As medidas de espalhamento medem a dispersão ou


espalhamento de um conjunto de valores. Assim, elas permitem
observar se os valores estão amplamente espalhados ou
relativamente concentrados em torno de um valor, por exemplo, a
média. IMPRESSO POR: 231506049@pucrs.edu.br. A
impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 12/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 27/03/2023

O intervalo é a medida mais simples e mostra espalhamento


máximo entre os valores de um conjunto.

intervalo(x) = max (x) - min(x)

Mellow Yellow 27/03/2023

Se a maioria dos valores for próxima de um ponto, com um


pequeno número de valores extremos, o intervalo não será uma
boa medida do espalhamento dos valores. A medida mais utilizada
para avaliar o espalhamento de valores é a variância

variância(x) = ((x1 - média)² + ... + (xn - média)²) / (n-1) ->


correção de Bessel.

Mellow Yellow 27/03/2023

O uso do denominador n – 1, chamado correção de Bessel, dá


uma melhor estimativa da variância verdadeira do que o uso de n.

Mellow Yellow 27/03/2023

Outra medida de espalhamento, o desvio padrão, é dada pela raiz


quadrada da variância.

Mellow Yellow 27/03/2023

Desvio médio absoluto (AAD, do inglês absolute average


deviation)

AAD(x) = (|x1 - média| + ... + |xn - média|) / n

Mellow Yellow 27/03/2023

Desvio mediano absoluto (MAD, do inglês median absolute


deviation)

MAD(x) = mediana({|x1 - média|, ... , |xn - média|})

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 13/14
27/03/2023, 17:49 Realces e notas: Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina
Mellow Yellow 27/03/2023

Intervalo interquartil (IQR, do inglês interquartil range)

IQR(x) = P75% - P25% = Q3 - Q1

Mellow Yellow 27/03/2023

Medidas de Distribuição

IMPRESSO POR: 231506049@pucrs.edu.br. A


impressão de notas e realces são apenas para uso
pessoal e privado. As notas criadas pelo usuário não são
parte do conteúdo da editora. Nenhuma parte deste livro
poderá ser reproduzida ou transmitida sem prévia
autorização da editora. Os violadores serão
processados.

about:blank 14/14

Você também pode gostar