Alibaba investe em IA de modelo mundial para superar limites de LLM

A Alibaba Cloud está investindo em um novo tipo de inteligência artificial (IA) projetado para replicar melhor o mundo real, utilizando uma abordagem diferente dos chatbots como o ChatGPT da OpenAI.

108288591 17756532761775653274 45117984313 1080pnbcnews

Essa mudança reconhece os limites dos modelos de linguagem grandes (LLMs) treinados principalmente em texto. Em vez disso, os desenvolvedores estão focando em “modelos mundiais” construídos a partir de vídeos e cenários físicos da vida real.

Para acompanhar essa tendência, a Alibaba liderou um investimento de 2 bilhões de yuans (US$ 290 milhões) na ShengShu, startup por trás da ferramenta de geração de vídeo por IA Vidu, conforme anunciado pela empresa nesta sexta-feira. A TAL Education e a Baidu Ventures também participaram da rodada de financiamento Série B.

O investimento ocorre cerca de dois meses após a ShengShu levantar 600 milhões de yuans de parceiros como a Qiming Venture Partners. A startup não divulgou sua avaliação.

O que você precisa saber

A ShengShu recebeu um investimento de US$ 290 milhões liderado pela Alibaba Cloud.
O foco é no desenvolvimento de um “modelo mundial” que utiliza IA para conectar o mundo digital e o físico.
A tecnologia visa melhorar a capacidade de sistemas de IA em modelar e prever comportamentos do mundo real.

Competição em modelos mundiais

A ShengShu acredita que um modelo mundial geral, construído com dados multimodais como visão, áudio e tato, captura de forma mais natural o funcionamento do mundo físico do que os LLMs. A empresa visa conectar percepção e ação, permitindo que sistemas de IA modelem e prevejam o comportamento do mundo real de forma consistente.

O modelo mais recente da ShengShu, Vidu Q3 Pro, lançado em janeiro, está entre os 10 melhores modelos de IA para geração de vídeos a partir de texto e imagens, segundo a Artificial Analysis.

A empresa lançou o Vidu globalmente meses antes da OpenAI disponibilizar sua ferramenta de geração de vídeo por IA, Sora. Empresas chinesas de vídeos curtos como Kuaishou e ByteDance também lançaram ferramentas de IA semelhantes para geração de vídeos.

Expansão de investimentos da Alibaba

A Alibaba tem expandido seus investimentos em startups relacionadas. No mês passado, a gigante chinesa de tecnologia e a Baidu Ventures lideraram um investimento de US$ 50 milhões na Tripo AI, uma plataforma que usa IA para gerar modelos 3D digitais a partir de fotografias.

Em setembro, a Alibaba também liderou um investimento de US$ 60 milhões na PixVerse, que lançou um modelo mundial de IA no início deste ano, permitindo aos usuários direcionar o desenrolar de um vídeo durante sua geração. A Alibaba também lançou modelos de IA de código aberto para geração de vídeo e um para potencializar robôs.

A Shengshu informou que possui parcerias estratégicas com empresas que desenvolvem IA incorporada — sistemas como robôs humanoides que interagem com o mundo físico — para uso em ambientes industriais, comerciais e domésticos.

Modelos mundiais são cruciais para a robótica, pois a tecnologia precisa de mais do que LLMs para funcionar. Para replicar a inteligência humana, a IA precisará de raciocínio, compreensão do mundo físico e aprendizado contínuo. Enquanto a IA para a categoria de aprendizado ainda não foi desenvolvida, os chatbots baseados em LLMs criaram o elemento de conhecimento, tornando os modelos mundiais uma área chave que requer um avanço.

Fonte: Cnbc