Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Classificação / Regressão
O objetivo geral das técnicas de Classificação e Regressão é construir um modelo/regra
que possa ser usado para se fazer previsões. Em um problema de Classificação ou Regressão,
tem-se, genericamente, um conjunto de dados de treinamento (também chamado de banco
de dados de treinamento). Cada registro — linha do banco de dados — possui vários
atributos/caracterı́sticas/variáveis. Os atributos cujo domı́nio é numérico são chamados de
atributos numéricos, enquanto que os atributos cujo domı́nio não é numérico são chamados de
atributos categóricos. Alguns autores distinguem entre atributos categóricos que assumem
valores em um conjunto não ordenado (atributos nominais) e atributos categóricos com
domı́nios ordenados (atributos ordinais).
Existe um atributo distinto denominado atributo dependente. Os atributos restantes
são chamados de atributos dos preditores ou atributos independentes; eles são numéricos ou
categóricos por natureza. Se o atributo dependente for categórico, o problema é referido
como um problema de classificação. Se o atributo dependente for numérico, tem-se um
problema de regressão. A análise de regressão é um método conceitualmente simples usado
para investigar relações funcionais entre variáveis. Po exemplo, um avaliador imobiliário pode
querer relacionar o preço de venda de uma casa com as caracterı́sticas fı́sicas da mesma. A
relação é expressa na forma de uma equação ou um modelo conectando a resposta ou variável
dependente e uma ou mais variáveis explicativas ou preditoras.
1
definido.