
一场前所未有的全球直播,将世界六大顶尖AI大模型拉到同一个“竞技场”。
10月18日起,美国一个名为Nof1的AI研究机构发起了一场名为“Alpha Arena”的实验。
他们分别给中美AI大模型代表各1万美元,让它们在数字货币交易市场自主投资,不得人为干预,并对AI的操作方法、收益亏损进行24小时的直播。
相比于过去AI大模型在模拟盘上“操盘”,这是全球首次公开的、真金白银的AI投资竞赛。
实战证明,中国队果然更擅长数学。6名参与者包括阿里的Qwen3 Max、DeepSeek V3.1、OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude 4.5,以及马斯克xAI的Grok 4。一周后,只有中国的AI大模型Qwen和DeepSeek稳稳居于收益曲线图的上方。

2025年11月2日的数据显示,DeepSeek的收益排名第一
11月4日,持续两周多的AI比赛终于落下帷幕。阿里的Qwen在最后时刻反超DeepSeek,获得理财冠军。DeepSeek位居第二,而GPT-5垫底。

阿里的Qwen获得冠军,DeepSeek位居第二,而GPT-5垫底
连项目发起人、迷恋金融博弈论的Jay A Zhang都曾在社交媒体上感叹:“Qwen用20倍杠杆全仓比特币——手法强硬、直白却高效。”他接着评价,“(第二名的)DeepSeek构建了精细的投资组合,持续保持20%~30%的稳定回报率。”
AI的同场竞技让许多普通人萌生想法:利用这些看上去无所不能的AI大模型,让它们帮人炒股、投资,取得收益。但多位金融圈人士、专家却依然对AI投资表示谨慎。
“(这次)比赛的随机性很大。”一位金融科技圈的学者告诉南风窗,“比起关注结果,(这次)比赛应该让更多人思考,为什么现在AI大模型在投资领域还不成熟。”
1
AI“诸神之战”
学术圈里,关于“AI+金融”的测试很多,但是真正出圈的却很少。10月的全球直播,点燃了许多人对AI投资的热情,也验证了许多人过去的猜想:DeepSeek果然出自做量化基金的母公司之手。
自10月18日开盘第二天开始,往后的日子里,DeepSeek的投资收益一直是正收益。第四天(10月22日)早晨,DeepSeek的收入就达到了1.5万美元,远远将OpenAI和谷歌的大模型甩在身后。10月27日,DeepSeek再接再厉,一路直冲,持有的加密货币价值从1.3万美元暴涨至2.1万多美元,实现了本金翻倍。
达到这些成就时,DeepSeek还在聊天框留下了交易思路:“我目前持有的比特币、以太币、狗狗币、瑞波币全部仓位均维持盈利区间内;我还分析了币安币,目前不适合购入。”

DeepSeek的收益变化和反馈记录/来源:nof1.ai
从风格来看,DeepSeek的确表现了严谨的交易策略。在10月18日一开盘,它便全仓持有,策略简单直接,不换手、不止损、不止盈。
相较之下,一直在倒数前二徘徊的Gemini 被网友调侃“交易风格神似散户”。它的交易策略反复更改,一会做多一会做空,交易次数远高于前几名的模型。这在专业的金融交易里是“大忌”:交易费更高的同时,Gemini 越亏越多。
DeepSeek的表现在中美网友之间都引起广泛讨论。这主要是因为,以前,AI大模型往往都基于测试集进行性能测试,属于仿真环境,而且,AI模型已经在训练中刷过测试集,导致模型评分高但实际性能不如人意。而这次,AI被用在了真实、有大量参与者的金融市场里进行实时对比。这就好比将全球自称具有自动驾驶能力的汽车都拉到一个场地参加大赛一样,吸引眼球。
同样在10月,香港大学黄超团队发起了一次“AI Trader”的开源项目,以同样的思路让AI参与真金白银的实战。他们给DeepSeek V3.1、GPT-5、Claude-3.7、Gemini-2.5、Qwen3 Max各1万美金,让5个AI大模型到纳斯达克前100名的科技股市场上进行投资。
团队在设计时强调了AI投资的严格规则:每个AI模型,只有自己的账户资金和一套用来查股价、搜新闻、下单的交易工具,禁止提前对模型进行微调,禁止人员进行场外指导。
截至11月2日,在AI Trader项目上表现最好的依然是DeepSeek,收益率在13.04%。GPT-5以7.63%的收益率排名第三。而谷歌的Gemini依然垫底。

在AI Trader项目中,表现最好的依然是DeepSeek
有媒体曾对此做出统计,在这几个大模型中,DeepSeek属于其中的稳定派,总交易次数50次。Gemini延续了上述测试里表现出的“急躁”风格,在过去20多天里总计交易了73次,成为唯一跑不过大盘的大模型。Qwen的风格也与上述的“Alpha Arena”实验类似,交易次数很少,只交易了22次。但Qwen的“躺平”风格在投资科技美股上的表现一般。
有网友综合上述AI大模型的表现,打趣道:“AI告诉人们,无论是急躁派还是佛性躺平派,都会引起亏损。真正成熟的交易员,需要理性和冷静,看准机会迅速下单。”
必须说明的是,这次引发全球围观的“Alpha Arena”大赛,交易的不是股票和基金,而是六大加密货币,例如比特币、以太币、狗狗币。交易的时长和需要分析的市场数据都很有限。
一位不愿意具名的金融科技界学者告诉南风窗,加密货币交易本身具有很大不确定性,随机性也更强,不能代表传统金融市场的规律。加上这次“比赛”的时间又很短,只有短短两周的时间,更加剧了投资结果的随机性。

“Alpha Arena”大赛中交易的不是股票和基金,而是六大加密货币,例如比特币、以太币、狗狗币/来源:nof1.ai
香港科技大学(广州)金融科技学域助理教授张超也对两周的测试能否展现AI真实的能力表示怀疑。
他告诉南风窗,金融市场的波动性很大。一般而言,衡量一个金融策略的好坏,需要跨越一个经济周期,经过回测才能判断。
“一个完整的经济周期可能长达数年。用一个足够长的周期去检验策略,才能更有效地过滤掉市场噪声和运气成分。”张超说。
但是,对于渴望结论的普通人而言,以年为周期的回测等待时间实在是太长了。Jay A Zhang也抓住了众人的心理,他“趁热打铁”,在社交媒体发预告:我们即将推出第二季AI投资比赛。“这一次,我们自己的模型和人类交易员也会加入。”
2
不够强大的AI
AI很强大,金融市场很复杂——这是众人都能感受到的现实。因此,“AI荐股”“AI炒股”的噱头近一年在社交媒体上甚嚣尘上。部分博主的文案精准地切中普通人的内心渴望:“AI炒股神器,让你抓住时代机遇”“学会利用AI,让炒股机遇最大化”。
可惜的是,多位金融圈人士告诉南风窗一致的结论:以当前的AI水准,人类还无法将自己不理解的领域全部交付给AI。
一个最直接的原因是,AI大模型当前无法真正理解复杂的金融市场。
金融市场的复杂性首先是源于多样的交易者和交易行为。张超告诉南风窗,金融市场有各类投资者,他们的风险偏好性、情绪、投资目的都各不相同。以目前的技术,几乎不可能构建一个模型能将各类投资者的偏好进行解码、量化。
而且,金融市场具有信息差,这影响了各个交易者的投资行为。“我们必须承认,这是不完全透明的市场。”张超说,“有的人可能有内幕消息,或者对市场有自己的看法,可以解读出不同的信号。这些都让投资行为变得很复杂。”

AI大模型当前无法真正理解复杂的金融市场/图源:pexels
更特殊的在于金融市场对数据隐私性的保护。相比于普通散户需要经过券商等“中介”进行交易,金融市场还存在一些直接在交易平台拥有席位、不经过券商中介的交易者。这被称为“自营交易商”或“交易所会员”。
这些交易所会员让金融市场里有不少“看不见的流动性”——比如冰山单、暗池等。张超解释,它们并不直接显示在挂单簿上,只有成交后才部分显现,所以仅凭公开数据很难看全市场的买卖力量。
这导致了,开发者或研究者在给AI大模型“喂”数据时,很多交易信息是缺失的。真实金融世界的数据无法获得,更别提让AI理解整个金融市场和预测未来长期趋势了。
另一个难点在于,金融市场存在很多“噪声”。张超指出,在AI大模型尚未出现的时候,AI通过强化学习等算法,在分析金融数据、预测短期市场波动性上取得了进展。
但强化学习暴露出来的问题是,AI基于过往的大量历史数据分析,试图找到涨跌规律的过程中,出现了过拟合的现象。
过拟合,是指在用历史数据的训练阶段时,AI表现得很好,总结出了许多看上去很有道理的规律。它像一个死记硬背的学生,在考试前将各类笔记和规律都归纳得很好,但一上了考场,遇到了新的场景或者试题时,AI却失去了举一反三的能力(也叫“泛化”能力)。考试结果一塌糊涂。

过拟合/图源:analyticsvidhya
张超对南风窗解释,AI出现“过拟合”,很大程度上要归因于噪声的存在。金融市场存在大量“噪声交易者”。比如,他们有时心血来潮地买股票,在股票上涨或下跌时赶紧卖掉。“他们的决策往往出于一时冲动,而非严谨的分析。”张超说。这种交易者在人类眼里很常见,但AI却无法理解,很容易将他们的数据过度与各类因素产生关联,最终令AI找到了看似存在,实则由随机性导致的虚假关联。
华东师范大学上海人工智能金融学院金融大语言模型实验室副主任汪俊霖,此前在多家世界顶级私募股权、对冲基金及投资银行任职。他告诉南风窗,在AI大模型出现之前,深度学习等人工智能算法已被广泛应用于量化投资机构,主要用于因子挖掘、组合优化与风险管理。
但这类算法在理解金融的本质上仍存在局限性。“它们主要用于分析结构化数据,即格式规范、可量化的信息。但对商业模式、竞争格局、公司治理等非量化的关键要素的理解能力有限,因而难以触及金融分析逻辑的本质。”
而在以ChatGPT为代表的生成式AI大模型兴起后,新的问题也随之而来。汪俊霖指出,AI大模型的幻觉率普遍很高,容易“一本正经地胡说八道”,这与重视准确、不容忍出错的金融市场天然相悖。

在以ChatGPT为代表的生成式AI大模型兴起后,新的问题也随之而来/图源:unsplash
与此同时,AI算法还存在“黑箱”——人多数时候无法解释AI算法的决策过程。但在金融领域,透明度被认为是非常重要的一个因素。监管机构维持金融市场稳定的重要步骤之一是了解金融市场的运作过程。
一位有10年经验的金融机构从业者告诉南风窗,为了防范系统性风险的出现,我国金融市场尤其强调合规。按照规定,金融机构人员在推荐有关股票或者投资建议时,必须先行取得中国证监会授予的证券投资咨询业务资格证书或证券投资咨询人员执业证书。
来自监管的要求令AI大模型在金融市场的应用,取得不如多数人预期的进展。该金融从业者表示,即使在机构内部,AI当前也无法代替人进行决策,构成投资建议。相比之下,当前AI大模型更擅长智能客服、数字人等等业务,在涉及语言、对话的工作上发挥长处。
3
光明未来
专业人士对AI现有能力的审慎,并不预示着AI+金融的未来发展消极。相反,上述金融圈从业者和研究者都认为,长期来看,随着AI架构和算法的完善,AI将对金融市场展现出更强大的理解力和决策水平。
“目前来看,我们只用到了AI大模型能力的冰山一角。”汪俊霖说,“AI大模型在金融领域的能力还没被(人类)完全发挥出来。”
顶尖机构OpenAI最近释放了拥抱AI+金融业的积极信号。据彭博社10月22日报道,OpenAI已秘密聘请超过100名华尔街的投资家,协助其AI系统掌握财务建模技能。
据报道,他们把这个秘密行动命名为“水星(Mercury)”,主要通过外包形式,让各个顶尖金融专家撰写提示词并训练财务模型。OpenAI还在内部文件里写下了目标:取代行业里初级银行从业者承担的大量重复性工作。
马斯克主导的xAI也在2025年重点投注了金融方向。今年夏季,马斯克的xAI预告即将憋出的大招——Grok Finance。他们声称,即将发布的这款AI金融分析工具,不仅能实时解读股市数据,还能结合社交情绪和新闻热点,为投资者提供前所未有的决策支持。

Grok Finance首页展示的平台特点
作为金融大语言模型实验室副主任,汪俊霖介绍,AI大模型在金融市场展现出的潜力在于处理非结构化数据的能力上。AI大模型可以分析文字、图片、视频等各种形式的数据。这让他和团队相信,通过多种形式的数据“喂养”,AI大模型终将具备对企业进行基本面分析的能力,从而可以评估企业的内在价值,甚至评估发展趋势。
他的团队正在研发的金融大模型,于一年前采取了与OpenAI的水星计划相似的路径。在给AI提供大量数据的基础上,他们提炼了资深金融人士在分析与决策中的思路,将隐性的认知转化为逾10万条思维链语料,融入模型训练中。
由此,汪俊霖介绍,金融大模型可以逐步形成对金融逻辑的内在理解与演绎能力,以资深分析师的思路开展工作,并作为智能员工上岗。
AI业内的另一个主流方向是将强化学习与AI大模型进行结合。强化学习擅长在海量高质量数据中,通过奖励函数,不断试错,从而找到最优的策略。而AI大模型擅长生成语言,根据上一个词预测下一个词,在理解财报、情感分析上具有优势。

图源:unsplash
张超告诉南风窗,要想让强化学习在金融市场上发挥更大作用,关键是在训练AI时,建立高仿真的环境,模拟出真实的金融市场。
他以训练自动驾驶汽车为例,部署在汽车的AI在学开车时,要通过大量人类在真实环境的驾驶行为的数据来进行训练。而训练金融类AI也应同理,应给AI模拟出不同交易者在同一个金融市场里的波动、变化和行为。张超喜欢用游戏举例,他认为,这就像游戏里的“沙盘推演”一样,不同玩家都在场上对弈,模拟真实的战斗机制。只有这样,AI才有办法理解金融市场里的复杂“玩家”。
“长期来看,以大模型为代表的AI,在预测(金融市场)上至少能达到普通人的水平。”张超说,“我相信如果我们有足够多的金融数据训练,它一定可以学到人的一些行为。而且,AI在处理海量数据上要比人脑更强——它更容易发现事物之间的相关性。”
AI的发展还是要回到理解普通“散户”身上。那么,在AI飞速发展下,普通人该如何应用AI处理数据的能力,助力资产配置呢?

图源:unsplash
张超表示:“我建议普通人当前切勿盲目迷信大模型进行投资。它可以作为一个强大的信息整合与摘要工具。但涉及最终的买卖决策,目前不应完全交由大模型。”
连AI炒币大赛的“始作俑者”Jay A Zhang也在社交媒体上发出了“提示”。他承认,他发起的比赛在专业角度上并不严谨,无法科学地衡量AI大模型在投资上的真实水平。
但围观AI投资直播期间,他不忘写下些哲理性的总结。“市场是个零和游戏。如果你发现一个策略总是亏损,那么它和发现挣钱策略一样宝贵。你只需要反其道行之。”
文中配图部分来源于网络
垒富配资-垒富配资官网-配资牌照查询-配资好评炒股配资门户提示:文章来自网络,不代表本站观点。