化解幻覺與欺騙問題 OpenAI要AI在自白中主動認錯
- 張品萱/綜合報導
OpenAI公開最新安全研究,首度以「自白」(confession)機制訓練大型語言模型(LLM),要求回答後誠實自評是否有撒謊、取巧或偏離指令,並揭露不確定性與判斷取捨。理解LLM為何欺騙、出錯或出現偏離指令的行為,是AI安全的...
會員登入
會員服務申請/試用
申請專線:
+886-02-87125398。
(週一至週五工作日9:00~18:00)
+886-02-87125398。
(週一至週五工作日9:00~18:00)
關鍵字






