Postado em 6 de dezembro de 2024 por sn-admin
No início do mês, o 3DJuegos noticiou que cientistas conseguiram criar uma inteligência artificial capaz de se reproduzir sozinha. Assim, ela não necessita de intervenção humana pois é capaz tanto de evoluir quanto de criar outros modelos de linguagem sem autorização dos criadores. No entanto, especialistas consideram que a IA está prestes a atingir o seu limite nos sistemas de formação tradicionais e, tendo em conta o que um laboratório na China conseguiu, parece que esta impressão não é tão certa como alguns acreditam.
Conforme indicado pelo TechCrunch, a empresa chinesa DeepSeek apresentou seu modelo de raciocínio de IA denominado DeepSeek-R1, um agente projetado para competir com o modelo o1 da OpenAI. A principal virtude desses modelos é que eles são capazes de “raciocinar” sobre as consultas, gastando mais tempo analisando as perguntas antes de respondê-las e, portanto, tendo a capacidade de evitar erros comuns. E, conforme indicado por testes populares como AIME ou MATH, o DeepSeek-R1 corresponde aos recursos do o1-preview, mas enfrenta dificuldades com problemas lógicos como o jogo da velha.
Restrições políticas e regulamentações governamentais
A isto devemos acrescentar que pode ser facilmente “desbloqueado” e, infelizmente para alguns, bloqueia temas políticos delicados devido às regulamentações do governo do país asiático. Portanto, eles não respondem perguntas relacionadas a Xi Jinping ou à Praça da Paz Celestial, por exemplo. Na verdade, o DeepSeek-R1 funciona em linha com as políticas de IA na China, uma vez que estas exigem que os modelos reflitam “valores socialistas fundamentais” e, portanto, restrinjam o uso de certas fontes de formação.
Para o DeepSeek-R1, seus criadores optaram pela computação em tempo de teste, uma abordagem que lhes dá tempo de processamento adicional para concluir tarefas. Graças a isso, aproveitam o que é considerado uma alternativa às tradicionais leis de escalabilidade. E, para tirar partido das suas virtudes, utiliza clusters de servidores com 10 mil GPUs Nvidia A100, condição que aproveitam graças ao financiamento da High-Flyer Capital Management que cobre o custo de 130 milhões de euros. Isto, somado à intenção de liberar o código-fonte e oferecer uma API, estabelece um importante paradigma de colaboração dentro do setor.
Fonte: BR