Sua tentativa de usar inteligência artificial para criar uma bomba nuclear antrópica será bom


  • A Anthropic desenvolveu um veículo que trabalha com IA que detecta e impede que a IA chatbots tenta projetar armas nucleares.
  • A empresa trabalhou com o Ministério da Energia dos EUA para garantir que a IA possa determinar essas iniciativas.
  • As alegações antrópicas provaram ter identificado solicitações sobre nucleares perigosos com precisão de 96% e já influenciaram Claude.

Se você é alguém perguntando a Claude como fazer sanduíches, você está bem. Se você é uma pessoa pedindo a Ai Chatbot como construir uma bomba nuclear, não pode apenas obter nenhum plano, mas também pode encontrar suas próprias perguntas nítidas. Isso é graças ao recém -distribuído detector de solicitações nucleares problemáticas do Antrópico.

Como outros sistemas para detectar as consultas de Claude que não devem responder, o novo usuário do classificador navega seus discursos e, neste caso, ele se volta para a zona de “arma nuclear”. A Anthropic criou um recurso de classificação conjunta com a Administração Nacional de Segurança Nuclear do Departamento de Energia dos EUA (NNSA) e forneceu todas as informações necessárias para determinar como essas bombas estavam funcionando ou se ele estava procurando um plano. É realizado com precisão de 96% nos testes.

Link da fonte

Releated

O que é isso e por que está sendo reconhecido?

O câncer é frequentemente visto como algo que “acontece com alguém” devido à idade, hábito ou sorte. Mas alguns históricos familiares de câncer se repetem como um eco: avó, mãe, tia. Ou um pai e dois irmãos com o mesmo tumor. Quando o câncer ocorre várias vezes na mesma família, nem sempre é aleatório. Nesses […]