本站消息,10 月 20 日,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。
截止发稿,DeepSeek 和 Grok 收益率均超 14%,排名前二,Gemini 2.5 Pro 则已亏损 42.57%。
编者按:本文介绍了一种基于 Claude Code 与 Obsidian 搭建的个人知识系统,其核心不再是传统 RAG 模式下每次查询、临时检索的用法,而是尝试让 AI 持续构建并维护一个可演化的知识库(Wiki)。从结构上看,该系统可以拆...
编者按:当 AI 能力开始逼近通用工具的边界,网络安全的含义也在发生变化。它不再只是针对黑客、病毒或数据泄露的防御问题,而正在演变为一场能力不对称的博弈。随着 Anthropic 推出的 Claude Mythos 展现出接近顶级专家的漏洞...
编者按:从石器时代的威胁,到两周停火的迅速落地,这场围绕伊朗的冲突在短时间内经历了急剧转折。表面上看,局势降温、市场反弹,但更深层的结构性问题并未因此得到解决。一方面,Donald Trump 在政治与经济压力下选择下台阶,通过停火暂时缓解...
编者按:近日,《The New York Times》发布长篇调查报道,重新追问一个困扰加密行业 17 年的问题:中本聪究竟是谁?不同于以往基于零散爆料或单一线索的猜测,这篇报道沿着 Cypherpunks 历史档案展开,通过技术路径、写作...