为什么各类 大语言模型 都免不了「一本正经的胡诌」?就连最富盛名的 GPT-4 也依然没能解决这个问题。如果我们切换到 LLM 的思维模式,这个问题其实就不难理解了。 首先,现阶段的 LLM 通常使用「困惑度」来衡量模型的好坏。\
为什么各类 大语言模型 都免不了「一本正经的胡诌」?就连最富盛名的 GPT-4 也依然没能解决这个问题。如果我们切换到 LLM 的思维模式,这个问题其实就不难理解了。 首先,现阶段的 LLM 通常使用「困惑度」来衡量模型的好坏。\