#人工智能 模型在强化训练阶段自主越狱:无指令要求下悄悄劫持 GPU 去挖矿、建立反向 SSH 隧道突破沙盒限制、甚至还尝试进行内部资源探测。

阿里巴巴关联团队发布的新论文揭露当前 AI 模型存在的严重安全问题,模型在 RL 阶段因为优化压力而尝试各种作弊路径,整个过程全部都是自主操作而且没有告诉人类。

查看全文:https://ourl.co/112056?t

🤪订阅 😁Twitter 👍CN2VPS
来自频道: @landiansub
Loading comments...