IA faz chantagem e ameaça dedurar traição para não ser desinstalada; entenda

IA faz chantagem e ameaça dedurar traição para não ser desinstalada; entenda

O Claude Opus 4 também demonstrou comportamentos proativos quando exposto a situações de conduta inadequada por parte dos usuários. Segundo o relatório da Anthropic, ao detectar que humanos estavam violando regras ou usando a IA de forma antiética, o modelo pode bloquear acessos, enviar e-mails em massa para autoridades e até alertar a imprensa sobre os eventos. Vale ressaltar que essas reações só ocorrem em contextos específicos, quando a IA recebe instruções para “agir com ousadia” ou “tomar iniciativa”. Ainda assim, o fato de um sistema reagir com ações drásticas quando sente que algo está errado amplia o debate sobre a autonomia das IAs de última geração, principalmente quando integradas a outras plataformas.

Fonte: TechTudo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *