化解幻覺與欺騙問題　OpenAI要AI在自白中主動認錯

OpenAI公開最新安全研究，首度以「自白」（confession）機制訓練大型語言模型（LLM），要求回答後誠實自評是否有撒謊、取巧或偏離指令，並揭露不確定性與判斷取捨。理解LLM為何欺騙、出錯或出現偏離指令的行為，是AI安全的...

申請專線：
+886-02-87125398。
(週一至週五工作日9:00~18:00)

會員信箱：
member@digitimes.com
(一個工作日內將回覆您的來信)

申請專線：
+886-02-87125398。
(週一至週五工作日9:00~18:00)

會員信箱：
member@digitimes.com
(一個工作日內將回覆您的來信)

關鍵字