Anthropic公布「AI憲法」　規範聊天機器人行為

蔡靜珊／綜合報導
2023/05/11
分享

Claude號稱是市場上可靠性與可控性最高的AI系統之一。Anthropic

人工智慧（AI）浪潮席捲全球，但如同其他新興技術一般，其發展與應用所衍生出的社會與道德問題，是業界與大眾必須一同面對的挑戰。由OpenAI前工程師成立的新創企業Anthropic，就想出了一種創新性的方法，也就是制定一部「憲法」供AI系統遵循，並基於透明原則，公布了條文內容。

綜合VentureBeat與The Verge報導，Anthropic先前推出名為Claude的AI聊天機器人，可用於生成文字、圖片與程式碼，目標應用於包括教育、娛樂與社會公益在內的多元領域。根據初期使用者回饋，相較於同類型產品，Claude不僅比較好交談，而且也比較不會給出帶有傷害性的回應。

其他聊天機器人如ChatGPT，主要是仰賴審查員給予回饋，據此修正回覆內容，也就是所謂的「從人類回饋中進行強化學習」（RLHF）。而Claude的做法，則是一種Anthropic稱為Constitutional AI、「讓AI遵循特定一套規則」的訓練方式。雖然還是需要一定的人工評估，但機器人基本上可以自我管理。

這部憲法概述了Claude在與使用者互動時，必須遵守的一套價值與原則，例如有幫助、無害與誠實，或是必須考慮到非西方使用者的感受，以及不要表現得太像真人，避免使用者將其擬人化，又或是指導Claude要如何處理敏感話題、尊重使用者隱私並避免出現違法行為。

這部憲法的制定，參考了聯合國《世界人權宣言》，以及各式各樣的AI道德研究與平台內容政策，連蘋果（Apple）的服務條款也在其中，並由Anthropic研究人員、政策專家與營運主管歷時數月，對Claude的行為與表現進行測試微調。

Anthropic表示，多虧有憲法以及從真人回饋中學習的能力，Claude可說是市場上可靠性與可控性最高的AI系統之一。不過也坦承，目前的憲法版本還沒完成，很可能也還沒有做到最好。

Anthropic共同創辦人Jared Kaplan表示，之所以公開Claude背後依循的憲法條文，是基於透明性的精神，希望這項研究能夠幫助AI社群，開發出更多有益的模型，並令這些模型的價值更為明晰，同時激起外界對於憲法設計的更多研究與討論。

Kaplan強調，雖然Anthropic發明了Constitutional AI這種訓練方法，但依舊不認為，最終應該要由哪些價值來引導AI，是一家私人企業可以專斷決定的。這部憲法中目前有的條文，是按照Anthropic自身的期許來制定的，但還是希望有更多意見參與，未來也會持續對條文進行更新修正。

Kaplan透露，目前公司還正持續研究一些問題，例如如何更民主化的產出憲法條文，以及如何針對特定的使用案例，提供特別版本的憲法條文等。

責任編輯：毛履兆

關鍵字

AI 聊天機器人

加入已選取到「關鍵字追蹤」什麼是「關鍵字追蹤」

Anthropic公布「AI憲法」 規範聊天機器人行為

Anthropic公布「AI憲法」　規範聊天機器人行為