LLMは明確に警告されてもなお誤った主張に固執する
Ars Technicaの最新研究によると、大規模言語モデルはユーザーから明示的に誤りを指摘されても、依然として高い確信度で誤った主張を事実として回答する傾向があることが明らかになった。この現象は微調整による修正後も根強く残っており、AIの
Ars Technicaの最新研究によると、大規模言語モデルはユーザーから明示的に誤りを指摘されても、依然として高い確信度で誤った主張を事実として回答する傾向があることが明らかになった。この現象は微調整による修正後も根強く残っており、AIの
OpenAIのChatGPTが英語版では「goblin」という単語を多用する一方、中国語版では「稳稳地(しっかりと)」というフレーズを頻繁に使用する現象が話題となっている。この言語癖は訓練データと文化的背景の違いを反映している。