O documento descreve que o ChatGPT utiliza aprendizado por reforço e aprendizado supervisionado para melhorar suas respostas com base em feedback humano. Ele foi treinado em 570GB de texto da internet, incluindo a Wikipedia. Sua acurácia varia de acordo com a pergunta, mas foi de 77% a 100% em questões médicas e 59% no ENEM. O ChatGPT é moderado por treinadores que fornecem respostas desejáveis ou classificam respostas em potencial.
O documento descreve que o ChatGPT utiliza aprendizado por reforço e aprendizado supervisionado para melhorar suas respostas com base em feedback humano. Ele foi treinado em 570GB de texto da internet, incluindo a Wikipedia. Sua acurácia varia de acordo com a pergunta, mas foi de 77% a 100% em questões médicas e 59% no ENEM. O ChatGPT é moderado por treinadores que fornecem respostas desejáveis ou classificam respostas em potencial.
O documento descreve que o ChatGPT utiliza aprendizado por reforço e aprendizado supervisionado para melhorar suas respostas com base em feedback humano. Ele foi treinado em 570GB de texto da internet, incluindo a Wikipedia. Sua acurácia varia de acordo com a pergunta, mas foi de 77% a 100% em questões médicas e 59% no ENEM. O ChatGPT é moderado por treinadores que fornecem respostas desejáveis ou classificam respostas em potencial.
O ChatGPT é um Large Language Model que utiliza de Aprendizado
por Reforço por Feedback Humano e Aprendizado Supervisionado para melhorar a acurácia das respostas, o feedback humano ajuda em diminuir respostas ruins, enviesadas ou incorretas. O ChatGPT foi treinado em 570GB de texto, incluindo a Wikipedia, artigos na Internet, Websites e muito mais conteúdo da Internet. A acurácia de respostas do ChatGPT pode variar conforme as perguntas que são feitas e a versão sendo utilizada, porém, por exemplo na área médica foi demonstrado uma acurácia de 77% até 100%. Em contrapartida, quando colocada para fazer o ENEM ele atingiu apenas 59% de acertos. A curadoria e moderação do ChatGPT é feito de múltiplas formas, em uma delas um Prompt é repassado para um treinador que escreve a resposta desejável, que então é passado para o ChatGPT para aumentar a acurácia das suas respostas. Em outra forma, baseada em recompensa, é exibido um Prompt e quatro respostas em potencial, um curador então ordena as melhores para piores respostas e repassa essas informações para o ChatGPT. Os modelos LLM possuem diversas aplicações, porém já estamos vendo alguns exemplos ao redor do mundo das mudanças que ele provocou. Nas gigante de casa e decoração IKEA, os trabalhadores dos call centers foram treinados como conselheiros de interior, já que o seu antigo trabalho estava sendo substituído pelo ChatGPT. No chat colaborativo Slack foi implementado e oferece ajuda para melhorar o workflow dos times, aumentar a produtividade e colaboração. Por fim, uma das grandes parcerias da OpenAI é a Microsoft, as duas se juntaram e implementaram no Bing um assistente de pesquisa na Internet, que pode responder perguntas como o ChatGPT, resumir artigos entre outras opções.
quais as técnicas de IA utilizadas, modelos, algoritmos, bases de dados
REFERÊNCIAS
Assessing the Accuracy and Reliability of AI-Generated Medical Responses:
An Evaluation of the Chat-GPT Model. Disponível em: https://pubmed.ncbi.nlm.nih.gov/36909565/