top of page

A Proliferação de Agentes de Codificação

Tradução do artigo Coding Agents Proliferate publicado na newsletter The Batch de 10/abril/2024. Veja o artigo original aqui.

Novas ferramentas de codificação atuam como agentes para automatizar tarefas de programação de software. 


O que há de novo:

Uma onda de ferramentas de desenvolvimento de software de código aberto baseadas em grandes modelos de linguagem (LLMs) aproveita a capacidade dos grandes modelos de linguagem de planejar e criticar seu próprio trabalho e se estender chamando funções. 


Como funciona: 

Esses projetos seguem os passos do Devin da Cognition , um sistema comercial anunciado como um desenvolvedor de software semi-autônomo que está disponível para clientes selecionados mediante solicitação. Alguns, como Devin, fornecem bate-papo em sandbox para comandos em linguagem natural, shell de linha de comando, editor de código e/ou um navegador da web por meio do qual o agente pode testar o código ou encontrar documentação. Quando solicitado, eles geram um plano passo a passo e o executam. Eles poderão solicitar mais informações ou instruções e os usuários poderão interromper para modificar suas solicitações.  Veja alguns dos agentes atualmente disponíveis:

  • Devika usa Claude 3 da Anthropic, GPT-4 e GPT-3.5 da OpenAI e modelos suportados pelo Ollama , uma ferramenta que executa grandes modelos de linguagem localmente. Assim como o Devin, o Devika é executado em um navegador da web e inclui um agente que realiza planejamento e raciocínio. Uma base de conhecimento e um banco de dados persistentes lembram quais projetos estão ativos.

  • Já o OpenDevin é baseado em GPT-4, mas tem acesso a mais de 100 modelos via litellm , um pacote que simplifica as chamadas de API. Os desenvolvedores do OpenDevin pretendem combinar a interface do usuário do Devin e permitir que o sistema avalie sua própria precisão. 

  • O SWE-Agent aborda bugs e problemas nos repositórios do Github. Ele pode usar qualquer modelo de linguagem. Usando o GPT-4, ele resolveu 12,3% das tarefas no conjunto de dados do SWE-bench de problemas reais do GitHub. (Devin resolveu 13,9 por cento das tarefas do banco SWE. Claude 3, o modelo com maior pontuação não treinado especificamente para codificação, resolveu 4,8 por cento das tarefas do banco SWE.)

Por trás das notícias: 

Ferramentas de preenchimento de código, como Github Copilot e Code Llama, rapidamente se tornaram omnipresentes. AutoGPT, lançado em 2023, é um agente de IA generalista de código aberto baseado em GPT-4 que tem sido usado para escrever e depurar código. Recentemente, a Replit, conhecida por seus aplicativos de preenchimento de código e chatbot Ghostwriter, começou a construir seus próprios LLMs para reparo automatizado de código. 


Por que é importante: 

Os agentes de codificação se distinguem por técnicas que permitem que grandes modelos de linguagem planejem e reflitam sobre seu trabalho, chamem outras ferramentas e colaborem entre si. Os usuários relatam que, diferentemente dos assistentes de codificação anteriores, as novas ferramentas são melhores para sustentar tarefas extensas e corrigir seu próprio trabalho. 


Estamos pensando:

Muitos desenvolvedores de software temem que grandes modelos de linguagem tornem obsoletos os codificadores humanos. Duvidamos que a IA substitua os programadores, mas acreditamos que os programadores que usam IA substituirão aqueles que não o fazem. As ferramentas baseadas em agentes ainda têm um longo caminho a percorrer, mas parece provável que elas aumentem as habilidades dos programadores em um pipeline de desenvolvimento maior.

21 visualizações0 comentário

Posts recentes

Ver tudo

Comentarios

Obtuvo 0 de 5 estrellas.
Aún no hay calificaciones

Agrega una calificación
bottom of page