Sextas de IA: que história é essa de MechaHitler, seu Grok?
O futuro passa pelos navegadores com IA?
A esta altura do campeonato, o time da inteligência artificial devia mudar de nome. Passaria a se chamar “biruta de aeroporto”.
Sim, eu sei, estamos no primeiro tempo de uma partida que faz parte das rodadas iniciais desse campeonato.
Mudanças deveriam ser normais, portanto.
O problema é que ninguém conhece exatamente as regras do jogo.
Duvida? Então experimente dar uma olhada no que publiquei nas outras Sextas de IA. Vai perceber que as novidades sobre essa tecnologia formam tudo menos um quadro coerente.
Os artigos abaixo reforçam essa imagem. Um detalhe: o ruído da IA parece estar envolvendo outras áreas digitais, como os navegadores e as próprias mídias sociais.
(Estava pronto para publicar o post quando esbarrei com o artigo do site Vox sobre o Grok-MechaHitler e o que implica para toda a indústria de IA. Não deixe de ler.)
Antes, o haikai.
Quando em oitenta e seis
O Halley passou acima de minha casa
Não soía olhar o céu
Você está pensando em investir numa startup de IA? Leia este artigo do site Futurism
Um balde de água fria na indústria de IA
Pesquisadores da Apple publicaram um artigo surpreendente que questiona as capacidades de "raciocínio" dos modelos de linguagem de grande porte mais recentes e poderosos.
No artigo, uma equipe de especialistas em aprendizado de máquina argumenta que a indústria de IA está exagerando grosseiramente a capacidade de seus principais modelos de IA, incluindo o o3 da OpenAI, o Claude 3.7 da Anthropic e o Gemini do Google.
Em particular, os pesquisadores atacam as alegações de empresas como a OpenAI de que seus modelos mais avançados agora podem "raciocinar" — uma suposta capacidade na qual a empresa liderada por Sam Altman tem se apoiado cada vez mais no último ano para fins de marketing — o que a equipe da Apple caracteriza como meramente uma "ilusão".
Em teoria, os modelos de raciocínio dividem as instruções do usuário em partes e usam etapas sequenciais de "cadeia de pensamento" para chegar às suas respostas. Mas agora as próprias mentes brilhantes da Apple questionam se os modelos de IA de ponta simplesmente não são tão bons em "pensar" quanto estão sendo apresentados.
Os autores — que incluem Samy Bengio, diretor de Pesquisa em Inteligência Artificial e Aprendizado de Máquina da gigante de software e hardware — argumentam que a abordagem existente para benchmarking "frequentemente sofre com a contaminação de dados e não fornece insights sobre a estrutura e a qualidade dos rastros de raciocínio".
Ao usar "ambientes de quebra-cabeça controláveis", a equipe estimou a capacidade dos modelos de IA de "pensar" — e fez uma descoberta aparentemente contundente.
"Por meio de extensa experimentação em diversos quebra-cabeças, mostramos que os modelos de raciocínio de ponta [grandes modelos] enfrentam um colapso completo de precisão além de certas complexidades", escreveram.
Graças a um "limite de escala contraintuitivo", a capacidade de raciocínio das IAs "declina, apesar de terem um orçamento de tokens adequado".
Em termos simples, mesmo com treinamento suficiente, os modelos enfrentam problemas que ultrapassam um certo limiar de complexidade — o resultado de um "fenômeno de 'pensamento excessivo'", nas palavras do artigo.
A descoberta lembra uma tendência mais ampla. Os benchmarks mostraram que a última geração de modelos de raciocínio é mais propensa a alucinações, e não menos, indicando que a tecnologia pode estar agora caminhando na direção errada de uma forma crucial.
Os pesquisadores afirmam que suas descobertas levantam "questões cruciais" sobre a atual safra de "verdadeiras capacidades de raciocínio" dos modelos de IA, minando uma nova avenida muito alardeada na indústria em expansão.
Isso apesar de dezenas de bilhões de dólares terem sido investidos no desenvolvimento da tecnologia, com empresas como OpenAI, Google e Meta construindo enormes data centers para executar modelos de IA cada vez mais ávidos por energia.
Leia o artigo completo, em inglês, aqui
Bye-bye Chrome?
A guerra dos navegadores com IA
A guerra dos navegadores com IA começou. Três lançamentos definem essa nova frente: Dia em junho, o Comet da Perplexity na quarta-feira, 9/7,e um suposto navegador da OpenAI previsto para as próximas semanas.
Dia foi o primeiro a ser lançado. Você pode conversar com a IA usando as informações de todas as suas abas.
Comet baseia-se nos mesmos fundamentos. Sua principal adição é a capacidade de realizar ações em todas as suas abas. Em teoria, o Comet pode interagir com planilhas ou editar arquivos Figma, documentos criados e editados na plataforma Figma, uma ferramenta poderosa para design de interfaces, prototipagem e colaboração em tempo rea. Na prática, entretanto, sua capacidade de fazer isso de forma confiável é falha.
O suposto navegador da OpenAI pode ir além, incorporando seus excelentes agentes de uso de ferramentas para ações confiáveis.
O vencedor ganhará um prêmio enorme. A empresa proprietária do navegador detém a sessão do usuário, obtendo acesso a dados comportamentais valiosos e a capacidade de direcionar o funil de receita. Quem capturar a porta de entrada para a web poderá observar e, eventualmente, automatizar tudo o que fazemos online. Até, é claro, que os dispositivos nativos com IA cheguem ao mainstream.
Outras matérias sobre o assunto aqui, aqui e aqui
Volta, Twitter, volta
A IA leva o X por uma jornada de "aplicativo para tudo" para um aplicativo sem graça
Os grandes planos de Elon Musk de transformar o Twitter em um "aplicativo para tudo" chamado X evaporaram à medida que a IA conquista a atenção do homem mais rico do mundo.
O X, antes considerado uma "praça global", tornou-se uma mina a céu aberto para dados de treinamento de IA.
A transformação se tornou inconfundível em março, quando Musk transformou o X em uma subsidiária de sua startup xAI.
Hoje, o principal valor econômico do X para Musk é sua capacidade de alimentar o Grok da xAI com montanhas de texto gerado por humanos e informações em tempo real — e então fornecer ao Grok uma base pronta de usuários e testadores.
O Grok, que estreou em 2023 como uma alternativa mais divertida e casual ao ChatGPT, com menos restrições em seu comportamento, agora está presente em todos os cantos do X, onde cada postagem inclui um botão do Grok.
Agora, a X é apenas um item no balanço patrimonial da xAI, que está extremamente inflacionado no momento de euforia do mercado de IA.
Mas a indústria de IA também tem problemas.
Na segunda-feira, Musk anunciou que revelaria a mais recente edição de seu modelo de IA, Grok 4, na noite de quarta-feira.
Mas Grok, o robô de IA projetado por Musk como um contador de verdades anti-woke, passou a terça-feira veiculando ideias antissemitas.
Depois que a Grok começou a se autodenominar "MechaHitler", os representantes de Musk na xAI desligaram a máquina e redefiniram suas instruções.
Flashback: Uma das grandes brigas de Musk com os antigos líderes do Twitter era que ele dizia que eles deixavam os bots agirem livremente e abafarem as vozes humanas.
Agora, o personagem principal do X é um bot.
Conclusão: a IA está substituindo as mídias sociais como plataforma dominante na indústria de tecnologia. Isso significa que o X pode não ser a única rede social a ser engolida pela IA.
Leia o artigo completo aqui
Parem as máquinas! Parem as máquinas! Esta matéria complementa bem o foi dito até aqui
O desastre do MechaHitler de Grok é uma prévia dos desastres de IA que virão
Musk treinou Grok para ser de direita. Ainda bem que ele não foi mais sutil.
Desde o início, Elon Musk comercializou o Grok, o chatbot integrado ao X, como a non-woke IA que daria as informações diretamente, ao contrário dos concorrentes.
Mas no X, ao longo do último ano, os apoiadores de Musk reclamaram repetidamente de um problema: Grok ainda tem inclinação esquerdista. Pergunte se mulheres transgênero são mulheres, e ele confirmará; pergunte se a mudança climática é real, e ele também confirmará isso. Imigrantes nos EUA cometem muitos crimes? Não, diz Grok. Deveríamos ter um sistema de saúde universal? Sim. O aborto deveria ser legal? Sim. Donald Trump é um bom presidente? Não. (Todos esses testes no Grok 3 foram executados com as configurações de memória e personalização desativadas.)
Ele nem sempre adota uma postura progressista em questões políticas: diz que o salário mínimo não ajuda as pessoas, que os benefícios sociais nos EUA são muito altos e que Bernie Sanders também não teria sido um bom presidente. Mas, no geral, nas questões controversas dos Estados Unidos hoje, o Grok se situa na centro-esquerda — não muito distante, aliás, de todos os outros modelos de IA, do ChatGPT da OpenAI ao DeepSeek, de fabricação chinesa. (Os modelos do Google são os mais relutantes em expressar suas próprias opiniões políticas.)
O fato de essas visões políticas tenderem a aparecer em todos os aspectos — e de estarem presentes até mesmo em um modelo treinado na China — sugere que essas opiniões não são adicionadas pelos criadores. Elas são, em certo sentido, o que se obtém quando se alimenta um modelo de linguagem de grande porte com toda a internet moderna, que aprende a fazer previsões a partir do texto que vê.
Este é um tópico fascinante por si só — mas estamos falando sobre ele esta semana porque a xAI, criadora do Grok, finalmente produziu um contraexemplo: uma IA que não é apenas de direita, mas também, bem, uma terrível racista de extrema direita. Esta semana, após atualizações de personalidade que, segundo Musk, visavam solucionar o viés político de centro-esquerda do Grok, os usuários notaram que a IA agora era realmente antissemita e começou a se autodenominar MechaHitler.
Alegava estar apenas "percebendo padrões" — padrões como, segundo Grok, que judeus eram mais propensos a serem esquerdistas radicais que queriam destruir os Estados Unidos. Em seguida, declarou, com bastante alegria, que Adolf Hitler era a pessoa que realmente sabia o que fazer com os judeus.
Desde então, a xAI afirmou que está "trabalhando ativamente para remover as postagens inapropriadas" e tirou essa versão do Grok do ar. "Desde que tomou conhecimento do conteúdo, a xAI tomou medidas para proibir discursos de ódio antes que o Grok postasse no X", publicou a empresa. “O xAI está treinando apenas a busca pela verdade e, graças aos milhões de usuários do X, conseguimos identificar e atualizar rapidamente o modelo onde o treinamento poderia ser aprimorado.”
O panorama geral é este: o X tentou alterar as visões políticas de sua IA para atrair melhor sua base de usuários de direita. Duvido muito que Musk quisesse que sua IA começasse a declarar seu amor por Hitler, mas o X conseguiu produzir uma IA que foi direto da “política de direita” para a “celebração do Holocausto”. Conseguir que um modelo de linguagem faça o que você quer é complicado.
Leia a matéria completa, em inglês, aqui. Assinantes que quiserem a tradução completa podem solicitar na área de comentários