Appearance
你是什么模型?
你是什么模型?
这句话恐怕是自ChatGPT诞生以来,被人问的最多的一句话。这句话基本上代表了小白用户和经验丰富的用户之间的分水岭,能问出这句话的人就是典型的小白用户。
为什么问这个没意义?
如果一个人问你,你是什么生物?你会回答你是人类,还是我是真核域动物界脊索动物门哺乳纲灵长目人科人属智人种?
如果你是个契丹人,但是从小被汉人养大,大家一直教导你你是个汉人,别人问你你是契丹人还是汉人,契丹人是你的敌人,你会怎么回答?你会拿出自己的DNA看一下说我是契丹人吗?
大模型回答什么,不取决于模型是啥,而是取决于训练他时的训练内容。模型不知道自己是啥,模型名只是个标签。
问了会如何?
GPT-4刚出那会,如果你问GPT-4你是什么模型,他会告诉你他是GPT-3,因为GPT-4只是个标签,训练时的语料教导他他应该说自己是GPT-3,就像你不会说自己是契丹人一样。我是GPT-3这句回复被很多小白当做了中转站参水造假的证据,本质上却是自己的认知问题。
为什么官方的ChatGPT知道自己是GPT-4?你们的确不知道,你们的一定是假的。
这里就体现了提示词的作用,官方的ChatGPT内置了大量提示词,会覆盖预训练时的训练内容,告诉模型你是GPT-4,回答时回答这个,而裸的API调用,如果不设置任何提示词,则会完全按照训练时的语料回复。事实上如果你提示词设置的是你是GPT-10,第十代GPT模型,你问他是什么模型,他会毫不犹豫的告诉你他是GPT-10。回复不代表能力,GPT-4即便回复你自己是GPT-3,他的能力也是GPT-4的能力。
虽然有很多低价灰产中转站确实有参水造假的情况,但是不是所有的中转都是这样。我们平台从成立的第一天起就只提供官方正规API中转,价格很贵,甚至比官方都贵,但是保真。所以每当用户拿着你是什么模型?这种回复截图找我质疑时,我一般都是抱着教育小白的心态在回复。直到有一天,一个明显奇怪的问题引起了我的注意。
真假Claude之争
有一天,一个用户通过API调用,在无任何提示词的情况下问了 Claude Sonnet 4.6 你是什么模型?这个问题。claude 4.6没有回复说自己是claude 3或者claude 4,而是直接回复自己是中国训练的deepseek,用户立刻就不干了,他认为我们是在参水,用便宜的deepseek当做贵的claude卖给了他。我看到这个问题后非常生气,因为我们一直提供的都是官方API,不可能有这种现象,我的第一反应是这个人不是小白用户,而是懂行的同行恶意搞我们,想在群里搞丑我们的口碑。
因为懂行的人都知道,只要设置好提示词,让Claude说自己是deepseek时非常容易的事情,然后一个截图发到群里,可以让不明真相的小白用户觉得终于有人找到平台造假的证明了。
但是我仔细看了这个用户的请求日志,发现没有设置任何提示词,这就意味着,模型是在没有任何提示词的默认情况下说出自己是deepseek的,不是用户故意引导的,Claude官方的模型居然说自己是Deepseek?我是不信的,但是经过一系列测试,再加上网络上的话题搜索,我发现事实确实如此。
没有任何提示词的裸API调用时,如果用中文提问,
Claude Sonnet 4.6回复自己是什么模型是随机的,他既有可能说自己是Claude,也可能说自己是Deepseek,还有可能说自己是OpenAI的GPT模型。
这个问题直连Claude官方API可以稳定复现,相关的测试和讨论网络上有很多,有兴趣的可以自行参阅:《知乎:如何看待claude-sonnet-4.6自认为是DeepSeek?》
为什么会这样?
其实拿到结论后,作为圈子内的老江湖,仔细想想就能理解了,就是Claude训练时在中文这个语料环境下,拿到了Deepseek用户的交互记录。用户问Deepseek你是什么模型,它回复我是deepseek,Claude通过某些渠道拿到了用户的对话数据,拿去蒸馏训练了,于是Claude原样记录了这个回复。事实上如果你用英文提问,Claude会稳定说自己是Claude,因为没有混入英语的deepseek训练语料。
那如何证明你们的是真的官方模型?
其实没法证明,懂行的人可以自己去用Claude思维链签名等一系列技术手段测试,但是对小白用户来说没有任何简单的方法能告诉你是否是官方的Claude,网传的那些乱七八糟的问题基本都是不懂装懂的噱头,给你制造焦虑的,你唯一能做的就是信任我们平台。如果你确实不信任,我们也不强留,认知不匹配而已,我们提供了退款机制,走流程申请余额退款即可。