Tradução do artigo Coding Agents Proliferate publicado na newsletter The Batch de 10/abril/2024. Veja o artigo original aqui.
Novas ferramentas de codificação atuam como agentes para automatizar tarefas de programação de software.
O que há de novo:
Uma onda de ferramentas de desenvolvimento de software de código aberto baseadas em grandes modelos de linguagem (LLMs) aproveita a capacidade dos grandes modelos de linguagem de planejar e criticar seu próprio trabalho e se estender chamando funções.
Como funciona:
Esses projetos seguem os passos do Devin da Cognition , um sistema comercial anunciado como um desenvolvedor de software semi-autônomo que está disponível para clientes selecionados mediante solicitação. Alguns, como Devin, fornecem bate-papo em sandbox para comandos em linguagem natural, shell de linha de comando, editor de código e/ou um navegador da web por meio do qual o agente pode testar o código ou encontrar documentação. Quando solicitado, eles geram um plano passo a passo e o executam. Eles poderão solicitar mais informações ou instruções e os usuários poderão interromper para modificar suas solicitações. Veja alguns dos agentes atualmente disponíveis:
Devika usa Claude 3 da Anthropic, GPT-4 e GPT-3.5 da OpenAI e modelos suportados pelo Ollama , uma ferramenta que executa grandes modelos de linguagem localmente. Assim como o Devin, o Devika é executado em um navegador da web e inclui um agente que realiza planejamento e raciocínio. Uma base de conhecimento e um banco de dados persistentes lembram quais projetos estão ativos.
Já o OpenDevin é baseado em GPT-4, mas tem acesso a mais de 100 modelos via litellm , um pacote que simplifica as chamadas de API. Os desenvolvedores do OpenDevin pretendem combinar a interface do usuário do Devin e permitir que o sistema avalie sua própria precisão.
O SWE-Agent aborda bugs e problemas nos repositórios do Github. Ele pode usar qualquer modelo de linguagem. Usando o GPT-4, ele resolveu 12,3% das tarefas no conjunto de dados do SWE-bench de problemas reais do GitHub. (Devin resolveu 13,9 por cento das tarefas do banco SWE. Claude 3, o modelo com maior pontuação não treinado especificamente para codificação, resolveu 4,8 por cento das tarefas do banco SWE.)
Por trás das notícias:
Ferramentas de preenchimento de código, como Github Copilot e Code Llama, rapidamente se tornaram omnipresentes. AutoGPT, lançado em 2023, é um agente de IA generalista de código aberto baseado em GPT-4 que tem sido usado para escrever e depurar código. Recentemente, a Replit, conhecida por seus aplicativos de preenchimento de código e chatbot Ghostwriter, começou a construir seus próprios LLMs para reparo automatizado de código.
Por que é importante:
Os agentes de codificação se distinguem por técnicas que permitem que grandes modelos de linguagem planejem e reflitam sobre seu trabalho, chamem outras ferramentas e colaborem entre si. Os usuários relatam que, diferentemente dos assistentes de codificação anteriores, as novas ferramentas são melhores para sustentar tarefas extensas e corrigir seu próprio trabalho.
Estamos pensando:
Muitos desenvolvedores de software temem que grandes modelos de linguagem tornem obsoletos os codificadores humanos. Duvidamos que a IA substitua os programadores, mas acreditamos que os programadores que usam IA substituirão aqueles que não o fazem. As ferramentas baseadas em agentes ainda têm um longo caminho a percorrer, mas parece provável que elas aumentem as habilidades dos programadores em um pipeline de desenvolvimento maior.
Comentarios