
OEm 5 de março, a gigante da tecnologia chinesa Alibaba divulgou seu mais recente padrão de raciocínio de IA, QWQ-32B, resultando em um pico de 8% nas ações listadas na empresa em Hong Kong. Embora menos capaz do que os principais sistemas de IA da América, uma vez que o O3 do OpenAI ou o soneto Claude 3,7 do Antropic, o padrão tem um desempenho, muito uma vez que o padrão do concorrente chinês Deepseek, R1, exigindo consideravelmente menos poder de computação para se desenvolver e executar. Seus criadores dizem que o QWQ-32B incorpora um “espírito filosófico macróbio”, abordando problemas com “maravilha e incerteza genuína”.
“Isso reflete a competitividade mais ampla do ecossistema de AI da Frontier da China”, diz Scott Singer, um estudioso visitante do Programa de Tecnologia e Assuntos Internacionais da Carnegie Endowment for International Peace. Esse ecossistema inclui o padrão R1 de Deepseek e Hunyuan, de Tencent, que o co-fundador do Antrópico, Jack Clark, disse que é por algumas medidas “de classe mundial”. Dito isto, as avaliações do mais recente padrão do Alibaba são preliminares, tanto devido ao duelo inerente de medir as capacidades do padrão e, porque até agora o padrão só foi estimado pelo próprio Alibaba. “O envolvente de informação não é muito rico agora”, diz Singer.
Outro passo no caminho para AGI
Desde o lançamento do padrão R1 da Deepseek em janeiro, enviou ondas através do mercado global de ações, o ecossistema de tecnologia da China está no meio das atenções-particularmente à medida que os EUA se vêem cada vez mais correndo contra a China para produzir mais lucidez sintético (AGI)-pesquisas de IA altamente avançadas capazes de realizar o trabalho cognitivo, a partir do design gráfico para a máquina, a máquina de relear. Espera -se que a AGI conferesse uma vantagem militar e estratégica decisiva a qualquer empresa ou governo que o crie primeiro, pois esse sistema pode ser capaz de se envolver em uma guerra cibernética avançada ou na geração de novas armas de devastação em tamanho (embora os especialistas sejam humanos altamente céticos serão capazes de reter um controle sobre um sistema, independentemente de quem cria criadores).
“Estamos confiantes de que a combinação de modelos de instalação mais fortes com aprendizagem de reforço alimentados por recursos computacionais em graduação nos impulsionará mais para perceber a AGI”, escreveu a equipe por trás do mais recente padrão do Alibaba. A procura para produzir a AGI permeia a maioria dos principais laboratórios de IA. O objetivo dito de Deepseek é “desvendar o mistério de Agi com curiosidade”. Enquanto isso, a missão do Openai é “prometer que a lucidez universal sintético – os sistemas AIs geralmente mais inteligentes que os seres humanos – beneficiem toda a humanidade”. Os principais CEOs da IA, incluindo Sam Altman, Dario Amodei e Elon Musk, esperam que os sistemas semelhantes a AGI sejam construídos no procuração atual do presidente Trump.
Leia mais: Uma vez que a China está avançando na IA, apesar das restrições de chips nos EUA
A vez da China
O último lançamento da IA do Alibaba ocorre exclusivamente duas semanas em seguida o co-fundador da empresa, Jack Ma, foi retratado na primeira fileira em uma reunião entre o presidente Xi Jinping e os proeminentes líderes empresariais do país. Desde 2020, quando MA criticou publicamente os reguladores estaduais e os bancos estatais por sufocantes de inovação e operar com uma “mentalidade da loja de penhores”, o bilionário chinês está amplamente ausente dos holofotes do público. Nesse período, o governo chinês reprimiu a indústria de tecnologia, impondo regras mais rigorosas sobre uma vez que as empresas poderiam usar dados e competir no mercado, além de assumir mais controle sobre as principais plataformas digitais.
Singer diz que, até 2022, ficou evidente que a maior prenúncio para o país não era a indústria de tecnologia, mas a estagnação econômica. “Essa história de estagnação econômica, e tentando revertê -la, realmente moldou muita política nos últimos 18 meses”, diz Singer. A China está se movendo rapidamente para adotar a tecnologia de ponta, com pelo menos 13 governos da cidade e 10 empresas de força estatal já tendo implantado modelos Deepseek em seus sistemas.
Inovação técnica
O padrão do Alibaba representa uma prosseguimento das tendências existentes: nos últimos anos, os sistemas de IA aumentaram consistentemente no desempenho enquanto se tornam mais baratos para percorrer. A organização de pesquisa sem fins lucrativos Epoch AI estima que a quantidade de força de computação usada para treinar sistemas de IA vem aumentando em mais de 4x a cada ano, enquanto, graças a melhorias regulares no design de algoritmos, que o poder de computação está sendo usado três vezes mais eficientemente a cada ano. Em outras palavras, um sistema que exigia, por exemplo, 10.000 chips de computador avançados para treinar no ano pretérito poderiam ser treinados com exclusivamente um terço uma vez que muitos leste ano.
Apesar das melhorias de eficiência, Singer adverte que os chips de computação sofisticados permanecem cruciais para o desenvolvimento avançado de IA-uma veras que nos faz controles de exportação sobre esses chips um duelo contínuo para empresas de IA chinesas uma vez que Alibaba e Deepseek, do qual CEO citou o aproximação a chips, em vez de verba ou talento, uma vez que seu maior gargalo.
O QWQ (pronunciado uma vez que a Quill) é o mais recente a ingressar em uma novidade geração de sistemas cobrados uma vez que “modelos de raciocínio”, que alguns consideram simbolizar um novo paradigma na IA. Anteriormente, os sistemas de IA melhoraram, dimensionando a quantidade de força de computação usada para treiná -los e a quantidade e a qualidade dos dados nos quais foram treinados. Nesse novo paradigma, a ênfase está em tomar um padrão que já foi treinado-nesse caso, QWEN 2.5-32B-e escalar a quantidade de computação que o sistema usa para responder a uma determinada consulta. Uma vez que escreve a equipe de Qwen, “quando recebeu tempo para refletir, questionar e refletir, o entendimento do padrão sobre matemática e programação floresce uma vez que uma buraco de flor para o sol”. Isso é consistente com as tendências observadas com os modelos ocidentais, onde técnicas que lhes permitem “pensar” por mais tempo produziram melhorias significativas no desempenho em problemas analíticos complexos.
O QWQ do Alibaba foi lançado “Open Weight”, o que significa que os pesos que constituem o modelo-acessíveis na forma de um registo de computador-podem ser baixados e executados localmente, inclusive em um laptop de ponta. Curiosamente, uma prévia do padrão, lançada em novembro pretérito, atraiu consideravelmente menos atenção. Singer observa que “o mercado de ações geralmente é reativo aos lançamentos de modelos e não à trajetória da tecnologia”, que deve continuar melhorando rapidamente nos dois lados do Pacífico. “O ecossistema chinês tem um monte de jogadores, todos lançando modelos muito poderosos e convincentes, e não está evidente quem emergirá, quando tudo estiver dito e feito, uma vez que tendo o melhor padrão”, diz ele.