ilustração em computador retrata inteligência artificial

Rebuli�o causado pelo ChatGPT, que conquistou a marca recorde de 100 milh�es de usu�rios em dois meses, exigiu uma resposta r�pida de concorrentes

Reprodu��o/ Pixabay
No f�rtil terreno encontrado pela intelig�ncia artificial (IA) do tipo geradora de conte�do nos �ltimos meses, empresas chinesas t�m sido praticamente as �nicas a fazer alguma frente � predomin�ncia das big tech dos EUA. Uma s�rie de an�ncios de sistemas chineses voltados � linguagem marca uma resposta na corrida que ganhou destaque com o lan�amento do ChatGPT, no final do ano passado.

 

Por mais que existam nomes de destaque em outras localidades, � do setor privado desses dois pa�ses que t�m surgido boa parte das principais novidades recentes. Publicamente, as empresas chinesas apertaram o passo desde mar�o, e nomes como Alibaba, Baidu, Huawei e Tencent divulgaram perspectivas de lan�amentos ou aprimoramentos em suas vers�es dos chamados grandes modelos de linguagem --rivais do GPT, o motor do sistema da americana OpenAI.

 

Trata-se de intelig�ncias artificiais focadas em conte�do textual: podem processar a comunica��o escrita, responder perguntas, montar sequ�ncias de frases que parecem ter sido feitas por humanos, fazer tradu��es e gerar c�digos de programa��o. Apesar de nuances na arquitetura dos algoritmos, as vers�es apresentadas por essas empresas chinesas t�m estrutura semelhante �quelas de nomes como Google, Meta (Facebook) e Microsoft, e as tarefas desempenhadas s�o, em ess�ncia, as mesmas.

 

Relat�rio encabe�ado pela Universidade Stanford (EUA) lan�ado no in�cio de abril destaca a participa��o de ambos os pa�ses no setor. E n�o s� competindo. De acordo com o documento, a ponte entre China e Estados Unidos foi a l�der nas colabora��es entre na��es para a produ��o de artigos cient�ficos sobre IA na �ltima d�cada, por mais que o crescimento anual da parceria venha desacelerando.

 

"Apesar de EUA e China continuarem a dominar a �rea de pesquisa e desenvolvimento de IA, os esfor�os est�o se diversificando geograficamente", ressalva o relat�rio, que teve apoio de empresas como Google, OpenAI, Linkedin e Github, as tr�s �ltimas ligadas � Microsoft. A participa��o da �ndia em estudos especializados, por exemplo, vem crescendo. O documento, no entanto, destaca a dianteira chinesa nas produ��es acad�micas sobre IA, enquanto os EUA lideram no quesito investimento com, US$ 47,4 bilh�es (cerca de R$ 234 bilh�es) em 2022 ante US$ 13,4 bilh�es (R$ 66 bilh�es) da segunda colocada China.

 

 

Uma compara��o entre os resultados pr�ticos desse dinheiro gasto n�o � tarefa simples, primeiro devido � disponibilidade: apesar de anunciadas, as vers�es mais atuais desses sistemas n�o s�o de f�cil acesso ao p�blico. Al�m das comunica��es oficiais das empresas, � poss�vel apenas analisar documentos que acompanham algumas dessas tecnologias, com informa��es t�cnicas sobre sua estrutura e desempenho.

 

O rebuli�o causado pelo ChatGPT, que conquistou a marca recorde de 100 milh�es de usu�rios dois meses ap�s seu lan�amento, exigiu uma resposta r�pida de concorrentes que n�o necessariamente tinham produtos no mesmo grau de maturidade, como o Ernie Bot, considerado um dos mais avan�ados na China.

 

O rob� da Baidu, empresa especializada em buscas, tem formato de conversas � la Bing (Microsoft), que tem o GPT por baixo dos panos. A ferramenta prop�e funcionalidades semelhantes, al�m de gera��o de imagens e fala, como demonstrado em v�deos. Hoje s� pode ser acessado por meio de convites seletos.

 

O Ernie tamb�m mostra que o valor gasto n�o conta toda a hist�ria. O relat�rio de Stanford coloca a produ��o de sua vers�o 3.0, lan�ada em 2021 e uma das bases do Bot, como cerca de cinco vezes mais barata do que a do GPT-2, de 2019, e 180 vezes mais barata que a do GPT-3, de 2020. No geral, o gasto tem subido ao longo do tempo. Para redu��o de custos, os artigos t�cnicos da Baidu citam um conjunto de t�cnicas propostas por pesquisadores da Universidade Tsinghua, baseada em Pequim.

 

Impor limites para o comportamento das IAs � uma dificuldade enfrentada pelo setor como um todo. A principal diferen�a � no rigor da linha tra�ada, mais estrita no caso chin�s.

 

Os termos de uso do GLM-130B, modelo especializado em ingl�s e chin�s lan�ado pela Universidade Tsinghua em 2022, incluem restri��es para aplica��es que minem o governo do pa�s. "Voc� n�o usar� este software para qualquer a��o que possa minar a seguran�a ou unidade nacionais da China, prejudicar o interesse p�blico da sociedade ou infringir direitos e interesses de seres humanos", diz trecho da licen�a.

 

Nos EUA, os termos de uso n�o fazem refer�ncia a seguran�a nacional ou interesses do pa�s, mas, para os sistemas criados por empresas como Google e Microsoft, o desafio de limitar as respostas surge ao tentar evitar que as ferramentas falem abobrinhas ou forne�am, por exemplo, orienta��es para criar armas qu�micas. A China tamb�m responsabiliza os criadores dos algoritmos, que dever�o fornecer os detalhes de seus sistemas para um registro estatal, por eventuais conte�dos inapropriados gerados.

 

A dificuldade de manter o conte�do dentro das linhas impostas pelo regime chin�s j� levou � suspens�o de outras tecnologias semelhantes, mesmo as projetadas no pr�prio pa�s, onde conte�dos da internet com temas considerados sens�veis pelo governo s�o barrados. O ChatGPT tamb�m n�o funciona por l�.

 

Como os grandes modelos de linguagem s�o gerados ao analisar bilh�es de textos, em que a IA detecta padr�es e passa a reproduzi-los, uma alternativa pode ser limitar a informa��o que alimenta os rob�s, embora essa filtragem traga desafios. Como o conte�do � volumoso, � dif�cil descartar tudo o que pode ser problem�tico, e adotar um conjunto j� previamente censurado, por outro lado, pode reduzir demais a quantidade de entradas para o modelo, derrubando seu desempenho.

 

 

Assim como a OpenAI, a Baidu n�o esclarece que dados usou para montar seu software mais moderno. A revista Wired especula que o conte�do veio da internet chinesa, ou seja, com limita��es devido � censura.

 

Nesses sistemas, num primeiro momento, tudo o que � absorvido est� para jogo, incluindo conte�dos perigosos, imprecisos ou eticamente reprov�veis. Na sequ�ncia, inicia-se um outro processo de treinamento com humanos para definir o que o rob� pode ou n�o dizer. Nada disso � 100% eficaz.

 

Na pr�tica, ap�s testar o Ernie, jornais como The Washington Post e Nikkei Asia relataram uma experi�ncia menos flu�da do que com o GPT. Em partes, pelas restri��es impostas pelo governo chin�s. Ao ser questionado sobre o l�der do pa�s, Xi Jinping, o sistema afirma ser um rob� que ainda est� aprendendo e, na sequ�ncia, for�a o recome�o da conversa, relata a publica��o americana.

Al�m do direcionamento fornecido por humanos, os pesquisadores da Baidu dizem que tamb�m conseguiram melhorias na qualidade das informa��es ao incluir uma camada de "conhecimentos" factuais para o rob�. Assim, o Ernie obteve resultados expressivos em testes de refer�ncia.

 

S� que ele n�o est� sozinho. Nesses ensaios, as ferramentas s�o submetidas a tarefas padronizadas para medir seu desempenho. Um rob� que classifica imagens, por exemplo, analisa um conjunto de fotos catalogadas por humanos para ver o quanto acerta -na pr�tica, as miss�es s�o bem mais complexas.

 

� o que possibilita algum tipo de compara��o entre os sistemas, mas isso s� vai at� a p�gina dois. De acordo com os pesquisadores de Stanford, essas refer�ncias est�o ficando saturadas: ap�s avan�os a galope registrados ano a ano h� at� pouco tempo, h� hoje pouqu�ssimo avan�o no desempenho a cada lan�amento porque as medidas n�o foram feitas para comportar as tecnologias atuais.

 

No fim, muitas dessas ferramentas podem alardear resultados expressivos em algumas das principais refer�ncias usadas hoje. E fica em aberto onde exatamente est�o as falhas de cada um. O Ernie 3.0 chegou a liderar o SuperGLUE, conjunto de testes para rob�s focados em linguagem criado em 2019 por pesquisadores das universidades Nova York e Washington, do Facebook, da Deepmind e da Samsung. Agora, o modelo da Baidu � o quarto colocado na lista liderada pelo Vega, da varejista chinesa JD.

 

N�o trata-se, por�m, de uma m�trica geral das melhores IAs. � uma medida entre v�rias dispon�veis, e alguns concorrentes de peso, entre os quais o GPT-4, nem sequer foram oficialmente aferidos nessa r�gua. Sem contar que os sistemas podem ter vers�es otimizadas para se dar melhor em determinadas provas.

 

A ferramenta da OpenAI � destaque retumbante em uma s�rie de outros testes. Lidera um bastante popular no setor, o MMLU. Numa compara��o direta, um estudo feito por pesquisadores da universidade Hainan (China) -ainda n�o publicado oficialmente e sem revis�o por pares-- analisa GPT-4, Ernie e Tongyi Qianwen (Alibaba). Com uma bateria de tarefas feitas para entender o desempenho dos sistemas ao extrair e interpretar informa��es, a conclus�o � a de que o modelo da OpenAI � o mais maduro.