Paul给全球六大LLM各发1万美金,丢进同一真实市场实盘厮杀,会发生什么?这场大战从18日开始,截止目前,DeepSeek V3.1盈利超3500美元,Grok 4实力次之。
最近有个特别有意思的实验,把全球六大AI模型拉去真实金融市场做交易比赛,每个模型都拿到1万美元本金。结果DeepSeek表现超猛,赚了3500多美元稳居第一,Grok-4紧追其后。最惨的是谷歌的Gemini,疯狂操作了45次交易反而亏得最多,OpenAI的GPT-5也表现平平。这个实验挺颠覆的,不靠传统测试题,直接让AI在真实市场里搏杀,看来做交易真不是谁都能玩得转的。
Zyrix