Sua tentativa de usar inteligência artificial para criar uma bomba nuclear antrópica será bom

23 Agosto 2025

A Anthropic desenvolveu um veículo que trabalha com IA que detecta e impede que a IA chatbots tenta projetar armas nucleares.
A empresa trabalhou com o Ministério da Energia dos EUA para garantir que a IA possa determinar essas iniciativas.
As alegações antrópicas provaram ter identificado solicitações sobre nucleares perigosos com precisão de 96% e já influenciaram Claude.

Se você é alguém perguntando a Claude como fazer sanduíches, você está bem. Se você é uma pessoa pedindo a Ai Chatbot como construir uma bomba nuclear, não pode apenas obter nenhum plano, mas também pode encontrar suas próprias perguntas nítidas. Isso é graças ao recém -distribuído detector de solicitações nucleares problemáticas do Antrópico.

Como outros sistemas para detectar as consultas de Claude que não devem responder, o novo usuário do classificador navega seus discursos e, neste caso, ele se volta para a zona de “arma nuclear”. A Anthropic criou um recurso de classificação conjunta com a Administração Nacional de Segurança Nuclear do Departamento de Energia dos EUA (NNSA) e forneceu todas as informações necessárias para determinar como essas bombas estavam funcionando ou se ele estava procurando um plano. É realizado com precisão de 96% nos testes.

Link da fonte