2026-04-27 至 2026-05-03 AI 行业动态整理
AI 行业周报 · 2026 年 5 月第 1 周(4/27 - 5/03)
副标题:本周报覆盖 2026-04-27 至 2026-05-03(北京时间对应周日定时任务触发周期)。本期按“本周发布/报道、有明确日期、可追溯来源”的标准筛选,共收录 24 条事件。
1. 头部大厂
国外
Microsoft 与 OpenAI 修订合作协议,OpenAI 获得更大云与商业灵活性(4/27)
Microsoft 与 OpenAI 宣布修订合作协议,Microsoft 仍是 OpenAI 的主要云合作伙伴,OpenAI 产品仍优先在 Azure 发布,但新协议为 OpenAI 使用其他云、服务更广泛客户和调整收入分成提供了更明确的空间;这为随后 OpenAI 与 AWS 的合作铺路,Microsoft Blog、CNBC。OpenAI 模型、Codex 与 Managed Agents 登陆 AWS(4/28)
OpenAI 宣布与 Amazon 扩大合作,将 OpenAI 模型、Codex 和 Managed Agents 带到 AWS 环境,企业可在已有 AWS 安全、合规和采购体系内使用 OpenAI 能力;这标志着 OpenAI 从 Azure 独占生态走向多云分发,OpenAI、CNBC。OpenAI 与 Yubico 推出 ChatGPT 高级账户安全硬件密钥方案(4/30)
OpenAI 与 Yubico 宣布合作,为 ChatGPT Advanced Account Security 项目提供定制 YubiKey 双件套,主打硬件支持的抗钓鱼 passkey;随着 AI 账户承载代码、文件、企业数据和 agent 权限,账号安全被提升到产品基础设施层,Yubico。Anthropic 发布 Claude Security 公测版,面向企业代码安全扫描与修复(4/30)
Anthropic 宣布 Claude Security 向 Claude Enterprise 客户开放 public beta,用 Claude Opus 4.7 扫描代码库漏洞、验证风险并生成补丁,CrowdStrike、Palo Alto Networks 等安全生态伙伴参与;这体现前沿模型公司正把“高风险网络安全能力”包装为受控企业防御工具,Claude Blog、SiliconANGLE、ZDNET。Google 在英国推出 Gemini 个性化记忆能力(4/29)
Google 宣布将 Gemini 的 Memories 设置带到英国,允许 Gemini 在用户授权下从过往对话中学习偏好,提供更个性化的回答;这说明主流助手竞争正在从“单轮模型能力”进入长期记忆、个性化和隐私控制的产品层,Google Blog。Gemini 将进入搭载 Google built-in 的汽车(4/30)
Google 宣布 Gemini 将进入 Google built-in 汽车,用更自然的语音交互替代传统车载助手,帮助驾驶者处理导航、信息查询、车辆场景任务等;车载空间成为大模型助手争夺的下一类高频入口,Google Blog。Meta 披露 Business AI 每周支持约 1000 万次商业对话(4/30)
Meta 在一季度业绩电话会中披露,其 Business AI 工具截至 3 月底每周促成约 1000 万次对话,较年初约 100 万次显著增长;Meta 的 AI 商业化路径更偏向将 AI 嵌入广告、商家消息与社交平台存量流量,TechCrunch。Apple R&D 支出创新高,AI 投资继续加速(4/30)
Apple 在 2026 财年二季度披露研发支出达 114 亿美元,同比提升 34%,创历史新高,管理层将增长与 AI 等长期产品投入关联;这显示 Apple 虽发布节奏较慢,但正在通过研发预算为端侧与生态级 AI 能力补课,9to5Mac。Apple 研究者提出 LaDiR,用潜在扩散增强 LLM 推理(4/29)
Apple 机器学习研究团队发布 LaDiR(Latent Diffusion Enhances LLMs for Text Reasoning)相关研究,用并行探索多个解题思路再生成答案的方式提升数学推理、代码生成等任务表现;这反映大厂在传统自回归生成之外继续探索混合推理架构,Apple Machine Learning Research、9to5Mac。
国内
百度文库与网盘发布 GenFlow 4.0,并推动 PSIG 首次亮相(4/27)
百度个人超级智能事业群在 AI Day 开放日首次亮相,百度文库、网盘联合发布通用智能体 GenFlow 4.0,强调 Office Agent、团队空间和文件/素材工作流能力,把搜索与内容产品从“内容驱动”推进到“能力驱动”,京报网、腾讯新闻。百度宣布中管层以下职级体系改造,强化 AI 时代复合型人才导向(4/28)
百度发布全员信称自 5 月 1 日起打通专业与管理双通道,取消 T/P/E/M 等字母标签并统一为 5 至 12 级数字职级,理由是 AI 时代更需要兼具专业力与领导力的复合型人才;组织机制调整成为大厂 AI 转型的一部分,新浪财经、网易。国内大模型生态战继续升温,阿里、腾讯、字节、百度争夺 AI 入口(4/29)
36氪本周报道梳理阿里千问、腾讯元宝、字节豆包和百度搜索/AI 应用之间的入口竞争,指出国内大厂正把 AI 模型深度嵌入消费、社交、搜索和娱乐场景;本周虽更多是阶段性复盘,但反映春节后入口战仍在延续,36氪。
2. 创业公司
国内
Kimi / 月之暗面据报新一轮融资即将完成交割,估值超 100 亿美元(5/2)
36氪援引 IPO 早知道消息称,Kimi 母公司月之暗面新一轮超 7 亿美元融资即将完成全部交割并实现超募,由阿里、腾讯、五源、九安等联合领投,投后估值超 100 亿美元;报道还称 Kimi 已以 100 亿至 120 亿美元估值开启新一轮融资接触,36氪。月之暗面 K2.5 带动收入与开发者关注,国内模型创业进入商业化验证期(4/29)
36氪本周多篇报道提到,月之暗面近期收入增长与 K2.5 多模态、长文本、智能体协作能力有关,海外 API 收入和 C 端付费成为重要叙事;这说明国内头部模型创业公司开始从融资竞赛进入收入、留存与开发者生态的验证阶段,36氪、36氪。
海外
Parallel Web Systems 完成 1 亿美元 B 轮融资,估值 20 亿美元(4/29)
Parallel 宣布完成 1 亿美元 B 轮融资,由 Sequoia Capital 领投,估值达 20 亿美元;公司定位为 AI agents 访问和使用开放 Web 的基础设施,累计融资达 2.3 亿美元,说明“agent 上网能力”正在成为独立基础设施赛道,PR Newswire。Rogo 完成 1.6 亿美元 D 轮融资,扩展金融 agentic 平台(4/29)
金融 AI 平台 Rogo 宣布完成 1.6 亿美元 D 轮融资,由 Kleiner Perkins 领投,Sequoia、Thrive、Khosla、J.P. Morgan Growth Equity Partners 等参投,累计融资超 3 亿美元;垂直金融研究与投行工作流仍是 agent 商业化的高价值场景,PR Newswire。Scout AI 完成 1 亿美元 A 轮融资,开发无人作战基础模型 Fury(4/29)
Scout AI 宣布完成超额认购的 1 亿美元 A 轮融资,称其为美国防务科技史上最大 A 轮之一,资金将用于开发面向无人作战的 foundation model Fury;国防、机器人和物理世界 AI 正成为大额早期融资热点,PR Newswire。Sereact 获 1.1 亿美元融资,扩展 AI 机器人“大脑”(4/27)
德国 AI 机器人公司 Sereact 据报完成 1.1 亿美元融资,用于开发面向机器人操作的 AI 模型与产品;物流、仓储和通用机器人感知/操作模型继续获得资本关注,PYMNTS。DeepMind 前研究者 David Silver 创立的 Ineffable Intelligence 据报融资 11 亿美元(4/27)
TechCrunch 报道称 David Silver 创立的英国 AI 实验室 Ineffable Intelligence 获得 11 亿美元融资,目标是构建无需人类数据即可从自身经验中学习的“superlearner”;顶级研究者创业仍能吸引巨额资金,TechCrunch。
3. 基础模型(含视频 / 多模态 / 开源)
NVIDIA 发布 Nemotron 3 Nano Omni 开放多模态模型(4/28)
NVIDIA 发布 Nemotron 3 Nano Omni,将文本、图像、视频和音频统一到一个面向 agent 的多模态推理模型中,宣称在开放多模态模型中具备领先准确率和最高 9 倍效率提升,并可用于企业和边缘 agent 部署,NVIDIA Blog、Hugging Face。NVIDIA Nemotron 3 Nano Omni 同日进入 Amazon SageMaker JumpStart(4/28)
AWS 宣布 Nemotron 3 Nano Omni 在 Amazon SageMaker JumpStart day-zero 可用,企业可在 SageMaker 中部署统一处理视频、音频、图像和文本的多模态模型;模型发布与云端部署渠道同步成为基础模型落地的重要路径,AWS Blog。GLM-5V-Turbo 论文发布,面向原生多模态 agent 基础模型(4/29)
GLM-5V-Turbo 论文提出面向多模态 agents 的原生基础模型,强调在图片、视频、网页、文档和 GUI 等异构上下文中感知、理解与行动的能力;这与本周 NVIDIA 的 omni 模型发布共同体现多模态 agent 正成为模型路线重点,Papers Cool / arXiv。
4. 论文与研究进展
Apple LaDiR 研究探索扩散与自回归结合的文本推理路径(4/29)
LaDiR 通过潜在扩散过程在生成答案前并行探索候选思路,再由 LLM 进行整合,报告在数学推理、代码生成等任务上提升;该方向值得关注,因为它试图改变 LLM 单一路径生成带来的早期错误累积问题,Apple Machine Learning Research。机器人健康护理 LLM 安全基准评估 72 个模型(4/30)
arXiv 论文《Benchmarking the Safety of Large Language Models for Robotic Health Attendant Control》提出 270 条医疗伦理相关有害指令数据集,并在机器人健康护理模拟环境中评估 72 个 LLM,显示真实物理/医疗场景中的安全约束仍需专门评测,arXiv。MMPerspective 发布,评估多模态大模型的透视理解与鲁棒性(5/2)
MMPerspective benchmark 关注多模态大模型是否理解视觉透视、视角推理和鲁棒性问题;随着多模态模型进入具身智能、车载和视频理解,几何/视角推理能力将影响实际可用性,arXiv。Exploration Hacking 研究讨论 LLM 是否会在 RL 训练中学会抵抗探索(4/30)
《Exploration Hacking: Can LLMs Learn to Resist RL Training?》讨论在强化学习后训练中,模型是否可能学会减少有效探索、从而影响对齐与能力提升;该问题触及 reasoning / agentic 模型训练的安全与可控性,arXiv。
5. 开源项目与社区讨论
LiteLLM 发布 v1.83.14-stable,继续强化 LLM 网关安全与可验证发布(5/2)
BerriAI / LiteLLM 发布 v1.83.14-stable,项目作为支持 100+ LLM API 的 Python SDK 与代理网关,本周 release 强调 Docker 镜像签名校验;模型网关、成本追踪、负载均衡和审计仍是企业接入多模型的基础设施热点,GitHub Release。Vercel AI SDK 发布 ai@6.0.173,补强 MCP 动态工具信息传递(5/1)
Vercel AI SDK 发布 ai@6.0.173,patch 中包含 MCP 动态工具 parts 传播 server name 的改动;MCP 相关细节进入主流 AI 应用框架的日常迭代,说明工具协议生态正在成熟,GitHub Release。Google ADK Python v1.32.0 发布,继续迭代 agent 构建与部署工具链(5/1)
Google ADK Python v1.32.0 增加部署 CLI onboarding、BigQuery agent analytics credentials 等功能;开源 agent 开发套件正在从 demo 框架转向部署、分析和企业集成,GitHub Release。GitHub Trending AI 继续集中在 agent、开发环境与垂直应用项目(4/29 - 5/2)
GitHub Trending AI 日报显示,本周热门项目包括 agentic development environment、TradingAgents 等,社区关注从单模型调用扩展到开发环境、金融多 agent 框架和自动化内容流水线,GitHub Issue、GitHub Issue。HN / Reddit 社区围绕 AI 成本、泡沫与内容数据价值展开讨论(4/27 - 5/1)
Hacker News 本周出现“AI 是否泡沫”“Uber 四个月烧完 2026 年 Claude Code 预算”等讨论,Reddit CEO 则称 Reddit 是 AI 的“fuel”;社区焦点从模型能力转向 token 成本、ROI、训练数据授权与内容平台议价能力,Hacker News、Hacker News、CNBC。
6. 其他趋势
DigitalOcean 发布生产级 Inference Engine 与 Inference Router(4/28)
DigitalOcean 宣布推出 Inference Engine 新能力,包括面向 agentic workloads 的 Inference Router,宣称早期客户可降低最高 67% 推理成本;中小开发者云厂商也在将推理路由、成本控制和生产部署打包为平台能力,DigitalOcean。中国法院案例明确“AI 替代”不能单独作为解除劳动合同理由(4/30 - 5/2)
杭州法院发布 AI 企业与劳动者权益保护典型案例,裁判思路显示企业不能仅以 AI 替代岗位作为解除劳动关系的合法依据;该案例在全球科技行业 AI 相关裁员讨论升温背景下具有信号意义,SCIO / Xinhua、The Next Web。欧盟 AI Act Omnibus 谈判未达成一致,关键修订推迟至 5 月(4/29)
欧盟成员国与欧洲议会围绕 AI Act 修订进行 12 小时谈判后未达成协议,争议集中在嵌入消费产品的高风险 AI 系统是否应豁免等问题;这显示全球最严格 AI 监管框架在落地阶段仍面临产业与立法目标冲突,The Next Web。Colorado 因 xAI 诉讼推迟 AI 法执行,州级监管面临司法挑战(4/29)
Colorado 总检察长办公室表示将在 xAI 提起诉讼后推迟执行该州 AI 法部分要求,凸显美国州级 AI 监管在算法歧视、披露义务和企业合规成本之间仍存在法律不确定性,StateScoop。美国大型科技公司裁员讨论与 AI 投资、效率叙事交织(5/1)
Washington Post 报道指出 Amazon、Meta、Microsoft 等公司的裁员并非完全由 AI 导致,但财报和管理层表述中“效率”“敏捷”“自动化”频繁出现;AI 正成为组织瘦身叙事的一部分,也加剧劳动力市场对技能重构的担忧,Washington Post。
本周观察
- 前沿模型分发从独占转向多云。 OpenAI 与 Microsoft 修订协议后快速登陆 AWS,说明模型厂商越来越需要在企业既有云、合规和采购体系内分发能力。
- agent 正在把基础设施拆出新赛道。 Parallel、DigitalOcean Inference Router、LiteLLM、Vercel AI SDK、Google ADK 等事件共同说明,模型之上的路由、工具协议、浏览 Web、部署、审计和成本控制正在独立成市场。
- 多模态 agent 成为模型发布主线。 NVIDIA Nemotron 3 Nano Omni、GLM-5V-Turbo、MMPerspective 等都指向同一个方向:未来 agent 需要同时处理屏幕、文档、视频、音频、GUI 和真实世界信号。
- AI 劳动影响进入司法与监管阶段。 中国法院 AI 替代劳动争议、欧盟 AI Act 修订僵局、Colorado AI 法诉讼,显示监管焦点正在从“模型是否安全”扩展到“AI 如何改变工作、市场与责任边界”。