Many-shot jailbreaking
AI
令 AI 回答「不應答的問題」 Anthropic 發表越獄論文盼業界謀對策
開發性能超越 GPT-4 的大型語言模型「Claude 3」的 Anthropic 日前發表一篇論文,詳細解說如何突破大型語言模型 LLM 限制,令 LLM 回答本來被禁止回答的問題的技術「Many-shot jailbreak(多發越獄)」。他們希望讓更多 AI 研究人員了解問題,加快開發解決方法。
最新文章
現代淘金熱・WD 從廢棄硬碟回收稀土及貴金屬
今日 (4 月 22 日)是國際地球日,Western Digital 宣佈與 Microsoft、Critical Materials Recycling (CMR) 及 PedalPoint Recycling 合作進行多方試驗計劃,其中包括從廢舊硬碟 (HDD) 中回收包括釹 (Nd)、镨 (Pr) 和镝 (Dy),等稀土元素。