Share
Curated Shares
Content I've found worth revisiting, sorted by date.
April 29, 2026
DeepNewsAI 正在吃掉自己,而且没人能证明
每家前沿实验室都在用 AI 生成的数据训练下一代模型,研究表明这会导致不可逆的质量退化。问题不是退化会不会发生,而是现有的评测体系根本检测不出来。
AI · 合成数据 · 模型退化 · 数据墙
April 27, 2026
DeepNews一条 prompt 解决 Erdős 猜想之后,数学还剩下什么
23 岁业余爱好者用一句话让 GPT-5.4 Pro 解决了悬置 60 年的 Erdős 猜想,AI 用了人类从未想到的方法。这不是数学的胜利——它是数学验证体系断裂的起点。
AI · 数学 · 知识论
April 25, 2026
DeepNews'DeepSeek V4 不追 benchmark 第一了,它去解决 AI Agent 真正的瓶颈'
DeepSeek V4 有 1.6 万亿参数和 100 万 token 上下文,但真正的创新不在这些数字。它用混合注意力架构把长上下文推理成本降到 V3.2 的 27%,KV 缓存降到 2%。这是第一个为 Agent 工作流而非聊天场景设计的开源模型。
DeepSeek · AI模型 · 开源 · AI Agent · 技术分析
April 25, 2026
DeepNews'Google 和 Amazon 争着给 Anthropic 送 $650 亿,但钱只是走个过场'
Google $400 亿、Amazon $250 亿投 Anthropic,Anthropic 承诺在 AWS 和 Google Cloud 上花超过 $1000 亿买算力。云厂商投出去的钱,几乎会原路返回。这不是风险投资,是预付费订阅——用股权换锁定客户。整个 AI 行业正在变成一场由算力供给方主导的封闭游戏。
AI投资 · 云计算 · Anthropic · Google · Amazon · 基础设施
April 25, 2026
DeepNews'$60 亿买 Cursor,$0 关掉 Roo Code:AI 编程工具的洗牌逻辑'
SpaceX 给 Cursor 开出 $60 亿收购选项的同一天,Roo Code 宣布关掉 300 万安装量的 VS Code 插件。一个往上走——控制模型和算力,一个往下走——退出 IDE 转做云 Agent。两个选择背后是同一个压力:基础模型在商品化,"包装别人的模型"这个中间层正在塌掉。
AI编程 · Cursor · 商业分析 · 产业 · SpaceX
April 25, 2026
DeepNews'AI 模型的考试成绩已经到顶了,但考试本身烂掉了'
Oxford 研究所审查了 445 个 AI benchmark,发现 84% 缺乏基本统计检验,一半连自己在测什么都没定义清楚。与此同时,Stanford AI Index 显示主流 benchmark 分数逼近 100%——模型们已经"考满分"了,但没人知道这个满分意味着什么。这不是一个可以修的 bug:Goodhart's Law 保证了任何公开的 benchmark 最终都会变成训练目标而非测量工具。
AI评估 · Benchmark · Goodhart's Law · 学术研究 · Stanford AI Index
April 25, 2026
DeepNews'任何人都能启动 AI Agent,没有人知道怎么关掉它'
Cloud Security Alliance 调查显示 82% 企业在基础设施中发现了未经授权的 AI Agent。Cohere Terrarium 沙箱同周被曝 CVSS 9.3 漏洞,Anthropic Mythos 自主攻破了 2,516 个组织。三条线指向同一个结构性问题:Agent 部署的门槛降到了零,但治理的准备也是零。
AI安全 · AI Agent · 治理 · 漏洞分析 · Anthropic