Alibaba lança nova série de LLMs AI de código aberto de última geração chamada Qwen3

  • Categoria do post:Notícias

Parece que a gigante do comércio eletrônico Alibaba, da China, está avançando no mundo da inteligência artificial mais uma vez. A empresa acabou de lançar uma nova série de Modelos de Linguagem de Grande Porte (LLMs) chamados Qwen 3. Eles parecem estar liderando o mercado em termos de designs de modelo abertos e excelente desempenho em comparação com os rivais Google e OpenAI.

Os modelos são compostos por uma mistura de especialistas e seis variantes densas para oito novos modelos. Esse método envolve a integração de diferentes tipos de modelos especializados em um único. Apenas os modelos relevantes receberiam tarefas e seriam ativados por meio de configurações internas. De acordo com a equipe, essa visão de 235 bilhões de parâmetros é projetada usando benchmarks importantes estabelecidos por terceiros, como ArenaHard, e recebe altas avaliações de desempenho para domínios difíceis, como engenharia de software e matemática. Dizem até que está no mesmo nível de competição que o Gemini 2.5 Pro do Google.

No geral, os dados de benchmark posicionam os modelos disponíveis como um dos mais poderosos e obtêm uma grande superioridade, dependendo do que a indústria tem a oferecer. Há um modelo híbrido que é treinado usando capacidades de raciocínio híbridas. Isso permite aos usuários alternar entre respostas rápidas e corretas e aquelas mais complexas que requerem períodos de tempo maiores. Esse foi um método usado por especialistas anteriores da Nous Research para coletivos de pesquisa.

Através do Qwen3, os usuários têm a chance de se envolver em um modo de pensamento mais intenso com a ajuda de botões marcados com Qwen Chat ou por meio de diferentes prompts ou uma API. Tudo depende de quão complexa a tarefa pode ser no final.

Os usuários têm a oportunidade de acessar e lançar modelos em várias plataformas e podem interagir diretamente através de uma interface de chat na web para o Qwen e alguns aplicativos móveis. Muitos ficaram impressionados em sua primeira utilização, pois conseguiam produzir imagens com grande precisão e rapidez após um prompt adequado. Ver a mistura perfeita de texto com imagem foi uma revelação para alguns.

Uma desvantagem notada até agora diz respeito às restrições ligadas ao Conteúdo Chinês que fazem com que os usuários tenham que fazer login com bastante frequência, gostem disso ou não. No que diz respeito ao treinamento do modelo, o Qwen3 se destaca em relação ao seu antecessor, o Qwen 2.5. Isso pode ter a ver com o fato de que seu conjunto de dados de pré-treinamento é quase o dobro do tamanho e equivale a 36 trilhões de tokens.

Esses modelos são uma prova para o mundo de que a competição na corrida da inteligência artificial continua aquecida, à medida que os provedores de AI desejam oferecer os melhores e mais acessíveis modelos que permanecem poderosos em design e elegantes na aparência. Lembre-se, o cenário de AI continua evoluindo, e este novo produto da Alibaba marca um grande marco, inovando nos clássicos LLMs.