A função objetiva desempenha um papel
crucial e central na otimização de modelos de aprendizado de máquina. Aqui está um colapso de sua função e significado:
Qual é a função objetiva: *
Um objetivo: É uma função matemática que quantifica o quão "bom" é um modelo em executar a tarefa pretendida. Define formalmente o que o modelo está tentando alcançar.
*
uma pontuação: Ele pega as previsões do modelo e as compara aos valores alvo reais (verdade do solo). Com base nessa comparação, ele calcula uma pontuação (um único número).
*
Minimização ou maximização: Dependendo da definição, a função objetivo foi projetada para ser * minimizada * (por exemplo, erro, perda, custo) ou * maximizado * (por exemplo, precisão, lucro, recompensa). O objetivo do processo de otimização é encontrar os parâmetros do modelo que levam à melhor pontuação possível (a mais baixa ou mais alta).
papel na otimização: 1.
Definindo sucesso: A função objetiva * define o que significa para o modelo ter sucesso.
2.
fornecendo um alvo: A função objetiva serve como um alvo * para o algoritmo de otimização.
3.
guia a pesquisa: A forma da função objetivo (seus derivados e curvatura) orienta a pesquisa do algoritmo de otimização pelos melhores parâmetros do modelo. Algoritmos como ascendência de gradiente usam o gradiente (a inclinação) da função objetivo para determinar a direção para ajustar os parâmetros para obter uma pontuação melhor.
4.
Avaliando o desempenho: A função objetiva pode ser usada para * avaliar o desempenho de diferentes modelos ou diferentes conjuntos de parâmetros * para o mesmo modelo. Ao comparar os valores de função objetiva para diferentes configurações, você pode selecionar o modelo que tem o melhor desempenho de acordo com os critérios definidos.
Tipos comuns de funções objetivas: *
Regressão: *
Erro ao quadrado médio (MSE): Média das diferenças quadradas entre os valores previstos e reais. Bom para medir a precisão geral da previsão.
*
Erro absoluto médio (mae): Média das diferenças absolutas entre os valores previstos e reais. Mais robusto para outliers do que MSE.
* Classificação
: *
Perda de entropia cruzada (perda de log): Mede a dissimilaridade entre as distribuições de probabilidade previstas e os rótulos verdadeiros. Comumente usado em regressão logística e redes neurais.
*
Perda de dobradiça: Usado em máquinas vetoriais de suporte (SVMS). Penalizar classificações incorretas e incentiva uma margem entre as classes.
*
Clustering: *
soma dentro do cluster de quadrados (WCSS): Mede a compactação dos clusters. Algoritmos como K-Means pretendem minimizar o WCSS.
* Aprendizagem de reforço
: *
Função de recompensa: Define a recompensa (ou penalidade) que um agente recebe por tomar determinadas ações em um ambiente. O objetivo do agente é maximizar a recompensa cumulativa.
Considerações importantes: *
Escolha da função objetiva: A escolha da função objetiva é * crítica * e depende muito da tarefa específica de aprendizado de máquina e do comportamento desejado do modelo. Uma função objetiva mal escolhida pode levar a um modelo que tem um bom desempenho nos dados de treinamento, mas generaliza mal a dados invisíveis ou que não se alinham aos objetivos reais do aplicativo.
*
regularização: As funções objetivas são frequentemente aumentadas com * Termos de regularização * (por exemplo, regularização L1 ou L2). A regularização penaliza modelos complexos e ajuda a prevenir o excesso de ajuste, levando a uma melhor generalização. O termo de regularização é adicionado ao componente de perda principal da função objetivo.
*
Algoritmo de otimização: A escolha do * algoritmo de otimização * deve ser compatível com a função objetivo. Alguns algoritmos são mais adequados para certos tipos de funções objetivas (por exemplo, convexo vs. não convexo).
*
mínimos locais (otimização não convexa): Muitas funções objetivas no aprendizado de máquina, especialmente no aprendizado profundo, são *não convexas *. Isso significa que o cenário de otimização possui vários mínimos locais e o algoritmo de otimização pode ficar preso em um desses mínimos locais, em vez de encontrar o mínimo global (a melhor solução possível). Técnicas como inicialização cuidadosa, momento e taxas de aprendizado adaptável são usadas para mitigar esse problema.
Em resumo, a função objetivo é o coração do processo de otimização no aprendizado de máquina. Ele define o que o modelo deve alcançar, guia a busca pelos melhores parâmetros do modelo e nos permite avaliar e comparar diferentes modelos.