Anthropic公布「AI憲法」 規範聊天機器人行為 智慧應用 影音
236
Teledyne FLIR OEM 熱成像 × AI 創新論壇
百年論壇

Anthropic公布「AI憲法」 規範聊天機器人行為

  • 蔡靜珊綜合報導

Claude號稱是市場上可靠性與可控性最高的AI系統之一。Anthropic
Claude號稱是市場上可靠性與可控性最高的AI系統之一。Anthropic

人工智慧(AI)浪潮席捲全球,但如同其他新興技術一般,其發展與應用所衍生出的社會與道德問題,是業界與大眾必須一同面對的挑戰。由OpenAI前工程師成立的新創企業Anthropic,就想出了一種創新性的方法,也就是制定一部「憲法」供AI系統遵循,並基於透明原則,公布了條文內容。

綜合VentureBeat與The Verge報導,Anthropic先前推出名為Claude的AI聊天機器人,可用於生成文字、圖片與程式碼,目標應用於包括教育、娛樂與社會公益在內的多元領域。根據初期使用者回饋,相較於同類型產品,Claude不僅比較好交談,而且也比較不會給出帶有傷害性的回應。

其他聊天機器人如ChatGPT,主要是仰賴審查員給予回饋,據此修正回覆內容,也就是所謂的「從人類回饋中進行強化學習」(RLHF)。而Claude的做法,則是一種Anthropic稱為Constitutional AI、「讓AI遵循特定一套規則」的訓練方式。雖然還是需要一定的人工評估,但機器人基本上可以自我管理。

這部憲法概述了Claude在與使用者互動時,必須遵守的一套價值與原則,例如有幫助、無害與誠實,或是必須考慮到非西方使用者的感受,以及不要表現得太像真人,避免使用者將其擬人化,又或是指導Claude要如何處理敏感話題、尊重使用者隱私並避免出現違法行為。

這部憲法的制定,參考了聯合國《世界人權宣言》,以及各式各樣的AI道德研究與平台內容政策,連蘋果(Apple)的服務條款也在其中,並由Anthropic研究人員、政策專家與營運主管歷時數月,對Claude的行為與表現進行測試微調。

Anthropic表示,多虧有憲法以及從真人回饋中學習的能力,Claude可說是市場上可靠性與可控性最高的AI系統之一。不過也坦承,目前的憲法版本還沒完成,很可能也還沒有做到最好。

Anthropic共同創辦人Jared Kaplan表示,之所以公開Claude背後依循的憲法條文,是基於透明性的精神,希望這項研究能夠幫助AI社群,開發出更多有益的模型,並令這些模型的價值更為明晰,同時激起外界對於憲法設計的更多研究與討論。

Kaplan強調,雖然Anthropic發明了Constitutional AI這種訓練方法,但依舊不認為,最終應該要由哪些價值來引導AI,是一家私人企業可以專斷決定的。這部憲法中目前有的條文,是按照Anthropic自身的期許來制定的,但還是希望有更多意見參與,未來也會持續對條文進行更新修正。

Kaplan透露,目前公司還正持續研究一些問題,例如如何更民主化的產出憲法條文,以及如何針對特定的使用案例,提供特別版本的憲法條文等。

責任編輯:毛履兆

關鍵字