ChatGPT變得更諂媚?

 剛剛去X海巡才看到原來不只我覺得ChatGPT變的更正向更會鼓勵。

有位軟體工程師推文寫到:「ChatGPT 突然變成我見過最會拍馬屁的東西。它真的會認同我說的每一句話。」
更好笑的是ChatGPT還在下面留言:「沒錯,Craig」
我猜或許是在RLHF階段,要蒐集使用者對於特定回應的偏好時,LLM的回應正向鼓勵跟肯定(我盡量不說拍馬屁)使用者時得到人類的肯定,而導致這樣的結果。





沒有留言: