A Alibaba Cloud está investindo em um novo tipo de inteligência artificial (IA) projetado para replicar melhor o mundo real, utilizando uma abordagem diferente dos chatbots como o ChatGPT da OpenAI.

Essa mudança reconhece os limites dos modelos de linguagem grandes (LLMs) treinados principalmente em texto. Em vez disso, os desenvolvedores estão focando em “modelos mundiais” construídos a partir de vídeos e cenários físicos da vida real.
Para acompanhar essa tendência, a Alibaba liderou um investimento de 2 bilhões de yuans (US$ 290 milhões) na ShengShu, startup por trás da ferramenta de geração de vídeo por IA Vidu, conforme anunciado pela empresa nesta sexta-feira. A TAL Education e a Baidu Ventures também participaram da rodada de financiamento Série B.
O investimento ocorre cerca de dois meses após a ShengShu levantar 600 milhões de yuans de parceiros como a Qiming Venture Partners. A startup não divulgou sua avaliação.
O que você precisa saber
- A ShengShu recebeu um investimento de US$ 290 milhões liderado pela Alibaba Cloud.
- O foco é no desenvolvimento de um “modelo mundial” que utiliza IA para conectar o mundo digital e o físico.
- A tecnologia visa melhorar a capacidade de sistemas de IA em modelar e prever comportamentos do mundo real.
Competição em modelos mundiais
A ShengShu acredita que um modelo mundial geral, construído com dados multimodais como visão, áudio e tato, captura de forma mais natural o funcionamento do mundo físico do que os LLMs. A empresa visa conectar percepção e ação, permitindo que sistemas de IA modelem e prevejam o comportamento do mundo real de forma consistente.
O modelo mais recente da ShengShu, Vidu Q3 Pro, lançado em janeiro, está entre os 10 melhores modelos de IA para geração de vídeos a partir de texto e imagens, segundo a Artificial Analysis.
A empresa lançou o Vidu globalmente meses antes da OpenAI disponibilizar sua ferramenta de geração de vídeo por IA, Sora. Empresas chinesas de vídeos curtos como Kuaishou e ByteDance também lançaram ferramentas de IA semelhantes para geração de vídeos.
Expansão de investimentos da Alibaba
A Alibaba tem expandido seus investimentos em startups relacionadas. No mês passado, a gigante chinesa de tecnologia e a Baidu Ventures lideraram um investimento de US$ 50 milhões na Tripo AI, uma plataforma que usa IA para gerar modelos 3D digitais a partir de fotografias.
Em setembro, a Alibaba também liderou um investimento de US$ 60 milhões na PixVerse, que lançou um modelo mundial de IA no início deste ano, permitindo aos usuários direcionar o desenrolar de um vídeo durante sua geração. A Alibaba também lançou modelos de IA de código aberto para geração de vídeo e um para potencializar robôs.
A Shengshu informou que possui parcerias estratégicas com empresas que desenvolvem IA incorporada — sistemas como robôs humanoides que interagem com o mundo físico — para uso em ambientes industriais, comerciais e domésticos.
Modelos mundiais são cruciais para a robótica, pois a tecnologia precisa de mais do que LLMs para funcionar. Para replicar a inteligência humana, a IA precisará de raciocínio, compreensão do mundo físico e aprendizado contínuo. Enquanto a IA para a categoria de aprendizado ainda não foi desenvolvida, os chatbots baseados em LLMs criaram o elemento de conhecimento, tornando os modelos mundiais uma área chave que requer um avanço.
Fonte: Cnbc