Este documento descreve uma tarefa de aproximação de funções desconhecidas usando regressão linear polinomial. Os alunos devem plotar dados de treinamento, criar um modelo polinomial ajustável, calcular parâmetros usando regressão linear, validar o modelo em dados de teste e ajustar o grau do polinômio para minimizar o erro.
Este documento descreve uma tarefa de aproximação de funções desconhecidas usando regressão linear polinomial. Os alunos devem plotar dados de treinamento, criar um modelo polinomial ajustável, calcular parâmetros usando regressão linear, validar o modelo em dados de teste e ajustar o grau do polinômio para minimizar o erro.
Este documento descreve uma tarefa de aproximação de funções desconhecidas usando regressão linear polinomial. Os alunos devem plotar dados de treinamento, criar um modelo polinomial ajustável, calcular parâmetros usando regressão linear, validar o modelo em dados de teste e ajustar o grau do polinômio para minimizar o erro.
Descrição da tarefa Nesta tarefa, realizaremos a aproximação de funções com regressão linear e aproximações polinomiais, consulte Regressão Linear no material do curso Parte 3 - Fundamentos Matemáticos. Um conjunto de dados de pares de entrada-saída é fornecido, onde as saídas são geradas por uma função desconhecida g. A função tem uma variável de entrada e uma variável de saída, e as medições de saída são afetadas pelo ruído. Você desenvolverá um aproximador dessa função, usando um modelo linear com termos polinomiais (funções de base). Os parâmetros do modelo serão encontrados usando o conjunto de dados de identificação. Um segundo conjunto de dados é fornecido para validar o modelo desenvolvido. Os dois conjuntos de dados são fornecidos em um arquivo de dados MATLAB, contendo uma estrutura para cada conjunto. O conjunto de dados de treinamento é denominado id e o conjunto de dados de validação val. Cada uma dessas estruturas contém um vetor X de amostras de entrada e as amostras de saída correspondentes no vetor Y. Requisitos: • Plote os dados de identificação para ter uma ideia do formato da função. • Crie um aproximador polinomial de grau n - 1, onde n é o número de parâmetros / funções de base. Aqui, n deve ser ajustável. Observe que há um parâmetro extra para o termo constante, e é por isso que o grau é apenas n - 1. Por exemplo, quando n = 4, o polinômio tem grau 3 e o aproximador é:
• Para qualquer valor de n, crie um sistema de equações lineares para
regressão linear, usando os dados de identificação. Use a representação matricial explicada na aula. Resolva este sistema usando a divisão à esquerda da matriz, operador \ no Matlab (ou alternativamente com linsolve). Relate o MSE nos dados de identificação. • Valide o modelo nos diferentes conjuntos de dados de validação: calcule as saídas aproximadas e, a partir delas, o MSE nos dados de validação. Mostre um gráfico da função aproximada no conjunto de dados de validação, comparando com as saídas reais. • Ajuste n para um bom desempenho (tentando valores até, digamos, 20). O desempenho deve ser avaliado pelo MSE nos diferentes conjuntos de dados de validação para evitar sobreajuste. Produza um gráfico do MSE versus n e encontre o ponto onde o MSE é mínimo. Seus gráficos serão semelhantes aos exemplificados na próxima figura (exceto que seus dados e a qualidade do ajuste podem ser diferentes, é claro).