A Openai acabou de lançar seus primeiros modelos de peso aberto em mais de cinco anos. Os dois modelos de idiomas, GPT-OSS-120B e GPT-20B, podem ser executados localmente em dispositivos de consumo e são ajustados para fins específicos. Para Openaieles representam uma mudança para longe de sua recente estratégia de focar em lançamentos proprietários, à medida que a empresa se transfer em direção a um grupo de modelos de IA mais amplo e mais aberto que estão disponíveis para os usuários.
“Estamos empolgados em tornar esse modelo, resultado de bilhões de dólares em pesquisa, disponíveis para o mundo para colocar a IA nas mãos da maioria das pessoas possível”, disse o CEO da Openai, Sam Altman, em comunicado por e -mail. Tanto o GPT-OSS-120B quanto Ferramentas da AI. O último modelo de peso aberto lançado pelo OpenAI foi GPT-2em 2019.
O que diferencia um modelo de peso aberto é o fato de que seus “pesos” estão disponíveis ao público, o que significa que qualquer pessoa pode espiar os parâmetros internos para ter uma idéia de como isso processa informações. Em vez de reduzir os modelos proprietários do OpenAI com uma opção gratuita, o co -fundador Greg Brockman vê esse lançamento como “complementar” aos serviços pagos da empresa, como a interface de programação de aplicativos atualmente usada por muitos desenvolvedores. “Os modelos de peso aberto têm um conjunto de pontos fortes muito diferente”, disse Brockman em um briefing com repórteres. Ao contrário do ChatGPT, você pode executar um modelo GPT-ROSS sem uma conexão com a Web e atrás de um firewall.
Ambos os modelos GPT Usam Raciocínio da cadeia de pensamento abordagens, que OpenIAI implantado pela primeira vez em seu modelo O1 no outono passado. Em vez de apenas fornecer uma saída, essa abordagem possui ferramentas generativas de IA, passam por várias etapas para responder a um immediate. Esses novos modelos somente de texto não são multimodais, mas podem navegar na net, chamar modelos baseados em nuvem para ajudar com tarefas, executar código e navegar no software program como um Agente da IA. O menor dos dois modelos, GPT-20B, é compacto o suficiente para ser executado localmente em um dispositivo de consumo com mais de 16 GB de memória.
Os dois novos modelos do OpenAI estão disponíveis no Licença Apache 2.0uma escolha well-liked para modelos de peso aberto. Com o Apache 2.0, os modelos podem ser usados para fins comerciais, redistribuídos e incluídos como parte de outro software program licenciado. Modelo de peso aberto lançamentos do Alibaba’s Qwen assim como Mistral Também opere no Apache 2.0.
Anunciado publicamente em março, o lançamento desses modelos aberto foi inicialmente adiado para testes de segurança adicionais. A liberação de um modelo de peso aberto é potencialmente mais perigoso do que uma versão fechada, pois take away barreiras em torno de quem pode usar a ferramenta, e qualquer pessoa pode tentar ajustar uma versão do GPT-OSS para fins não intencionais.
Além das avaliações o OpenAI normalmente é executado em seus modelos proprietários, a startup personalizou a opção de peso aberto para ver como ela poderia ser potencialmente usada por um “ator ruim” que baixa a ferramenta. “Na verdade, ajustamos o modelo internamente em algumas dessas áreas de risco”, disse Eric Wallace, pesquisador de segurança da Openai, “e medimos o quão alto poderíamos empurrá-los”. Nos testes do OpenAI, o modelo de peso aberto não atingiu um alto nível de risco, conforme medido por seu estrutura de preparação.