最近 GPT 语音模式降智严重。以前我打开 ChatGPT,新开一个对话进入语音模式就能获得较好的体验;但最近 if 新开对话直接进入语音模式,系统会默认指向 GPT-4o 且无法切换。如果你要求切换模型,GPT 会回答:“抱歉,现在只有 GPT-4o 可用。”
这个 GPT-4o 模型的特点是响应速度非常快,但在回答需要推理总结的问题时表现欠佳。
比如,你问它一些长篇小说的剧情,如《斗破苍穹》里萧炎获得异火的顺序,它就处理不了,甚至会瞎编剧情。
其他问题也是一样。比如你让它去 Hacker News 上搜寻新闻,它会假装找了,或者提供一些过时的信息。
GPT-4o 甚至会声称 GPT-5 是不存在的。
当我让它去 OpenAI 官网查询时,它会假装查完后再次告知 GPT-5 不存在。直到反复要求几次后,它才会真正去联网搜索,然后改口说:“哦,GPT-5 已经存在了。”
在被折磨了很久之后,我一度想要放弃。但最近我发现了一个小技巧,可以彻底解决这个问题:
- 在 ChatGPT App 中新开一个对话,手动选中 GPT-5.5(或你想要使用的特定模型)。
- 先通过打字的方式发送一句话。
- 对话开启后,再进入语音模式。
这样系统就会锁定你刚才选中的 GPT-5.5 模型,后续所有的语音交流都会默认使用该模型。这个功能非常实用,尤其适合在上班路上和 GPT 交流,体验非常舒服。
虽然 GPT-5.5 的延迟可能比 GPT-4o 高一些(因为模型更高级、参数量更大、推理能力更强,所以反应稍慢),但它的回答效果确实非常出色,这里分享给大家。
最近我非常沉迷使用 Typeless,当前文章使用 Typeless 书写了主要部分,并进行了一定的润色。这相当于语音被转换成书面格式(所有内容都是由人类产生的)。
如果你对 Typeless 这类的工具感兴趣,可以参考我这个链接里面的小技巧:https://github.com/zhaoolee/Typeless (虽然还没写完)