OpenAI GPT-5.2模型上线遭吐槽:智商不稳定 面临谷歌竞争压力
近日,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型。但上线后遭到大量用户吐槽,认为其从常识问答到情感交互,“智商不稳定”。SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7,甚至基础问题也反复出错。一些编程爱好者发现其生成的代码画面仅达“黑白火柴人级别”,情感交互中缺乏亲和力和自然表达。此外,该版本在处理连续对话时不稳定,安全策略实施过于严格。这轮差评潮背后存在期望错位和发布过早等因素。截至发稿,OpenAI尚未公开回应,但表示会持续改善用户体验、优化安全策略。当前,OpenAI仍面临来自谷歌的巨大竞争压力。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: