OpenAI、Anthropic、Google、Apple、MiniMax、Kimi 与 AI 基础设施一周动态

AI 行业周报 · 2026 年 6 月第 2 周（6/8 - 6/14）

副标题：本周报覆盖 2026-06-08 至 2026-06-14（北京时间周日定时任务触发周期）。本期按“本周发布/报道、有明确日期、可追溯来源”的标准筛选，优先保留官方公告、权威媒体、论文页、GitHub 项目页和一手公司博客；跳过仅为历史背景、无本周发生时间或低可信聚合的内容，共收录 53 条事件。

1. 头部大厂

国外

OpenAI 支持欧盟 AI 生成内容透明度实践准则（6/11）
OpenAI 发文表示支持欧盟关于 AI 生成内容透明度的 Code of Practice，称会继续推进来源标识、内容凭证和透明度工具，以配合 EU AI Act 落地；前沿模型公司正在把“生成内容 provenance”从自愿产品功能升级为合规基础设施，OpenAI。
OpenAI Academy 推出面向工作场景的三门新课程（6/12）
OpenAI Academy 发布 AI Foundations、Applied AI Foundations、Agents and Workflows 三门课程，目标是帮助团队从理解 AI、应用 AI 到构建可复用 agent 工作流；这说明 OpenAI 继续把企业 adoption 的瓶颈定义为“组织学习 + 工作流重构”，而不仅是模型访问，OpenAI。
OpenAI 拟收购 Ona，把持久云端工作环境纳入 Codex 团队（6/11）
Ona 宣布已签署协议加入 OpenAI，交易完成后团队将并入 Codex；Ona 提供面向 AI agent 的安全、预配置、可持续运行云端工作环境，OpenAI 借此强化 Codex 执行长任务和企业部署能力，Ona、CNBC。
Visa 与 OpenAI 合作推进 agentic commerce 支付能力（6/10）
Visa 宣布与 OpenAI 建立战略合作，将 Visa 的网络、tokenization、风控与授权能力接入 OpenAI 的 agentic commerce 体验，让 AI agent 可在用户设定权限、限额和审批规则下发起交易；支付网络正在成为 AI agent 从“建议”走向“代办”的关键基础设施，Visa、Visa Perspectives。
OpenAI 被报道已秘密提交 IPO 文件（6/9）
CNBC 报道 OpenAI 已确认秘密提交 S-1 IPO 文件，若推进上市，将成为美国资本市场最受关注的 AI 公司上市之一；这也会把前沿模型公司的治理、营收、算力成本和安全承诺置于更严格的公开市场审视之下，CNBC。
Anthropic 发布 Claude Fable 5 与 Claude Mythos 5（6/9）
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5，其中 Fable 5 是面向公众开放的 Mythos-class 模型，Mythos 5 则面向 Project Glasswing 等受信任场景；发布叙事强调强能力、长任务、软件工程和安全护栏的并行，Anthropic、TechCrunch。
Anthropic 因美国出口管制暂停部分最强模型的外国访问（6/13）
TIME 与 Decrypt 报道，美国政府以国家安全和 jailbreak 风险为由要求限制 Claude Fable 5 / Mythos 5 的外国访问，Anthropic 随后暂停相关访问并提出异议；前沿模型安全问题正在与出口管制、国籍访问和企业内部研发权限交织，TIME、Decrypt。
Anthropic 与 TCS 合作扩展企业 Claude 部署（6/11）
TechCrunch 报道 Anthropic 与 Tata Consultancy Services 合作，TCS 将组建专门单元为客户部署 Claude，并为自身员工提供 Claude；前沿模型公司正在通过大型 IT 服务商进入更复杂的企业变革和系统集成场景，TechCrunch。
Google 发布 Gemini 3.5 Live Translate 实时语音翻译（6/9）
Google 发布 Gemini 3.5 Live Translate，支持 70 多种语言的低延迟语音到语音翻译，并强调保留说话风格与实时流式处理；语音模型竞争正在从转写、TTS 走向跨语言实时沟通基础设施，Google Blog、Ars Technica。
Google 为小企业推出 Gemini 新功能并扩大 Gemini in Chrome 覆盖（6/10）
Google 宣布 Gemini App 新增连接 Google Business Profile、主动式 Business notebooks 等小企业能力，同时 Gemini in Chrome 扩展到更多市场；Gemini 正从通用助手继续嵌入搜索、本地商家、浏览器和运营工作流，Google Blog、Google Chrome Blog。
Google 将 Gemini 模型带给 Apple 开发者生态（6/8 - 6/9）
Google 与 Firebase 发文介绍 Apple Foundation Models framework 支持第三方模型适配后，开发者可在 Apple 应用中调用云端 Gemini 模型；这强化了“设备端系统能力 + 云端大模型适配器”的平台化趋势，Google Blog、Firebase Blog。
Apple WWDC 2026 聚焦 Siri AI、Apple Intelligence 与 AFM Cloud Pro（6/8 - 6/9）
多家媒体报道 Apple 在 WWDC 2026 推出更强的 Siri AI、Apple Intelligence 更新和 Apple Foundation Models Cloud Pro，并围绕 Google、Nvidia 与 Private Cloud Compute 展开叙事；Apple 的 AI 路线继续强调设备端、隐私云和系统级上下文整合，TechCrunch、CNBC、MacRumors。
Meta 解释其 AI 算力与自研芯片基础设施路线（6/10）
Meta 发文介绍 AI compute power，强调 MTIA 自研芯片、AI 优化数据中心、推理/训练效率和供应链伙伴；在模型能力竞争之外，头部平台正在以算力、芯片和数据中心效率作为长期 AI 竞争壁垒，Meta。

国内

阿里进行 AI 大重组，成立 Token Foundry（6/9）
36氪报道阿里合并通义大模型事业部与未来生活实验室成立 Token Foundry，由吴泳铭挂帅、周靖人升任首席科学家并牵头 AI 未来研究院；阿里试图把模型、视频生成、世界模型、自研芯片和 MaaS 分发纳入“Token 全生命周期”体系，36氪。
阿里 PPU、百度昆仑芯与华为昇腾推动国产 AI 芯片讨论继续升温（6/10）
36氪报道阿里平头哥 PPU、百度昆仑芯、华为昇腾等国产算力方案在性能、成本和规模化部署上受到关注，并将中国 AI 芯片市场描述为进入“华为时刻”；国内 AI 竞争继续从模型层延伸到推理算力、供应链和软硬件协同，36氪。
互联网大厂继续涌入 AI 制药，路径分化明显（6/12）
36氪梳理字节、百度、腾讯、阿里、京东在 AI 制药和医疗 AI 方向的不同路线：字节拆分 AI 制药业务线、百度依托百图生科、腾讯探索 AI 药物设计、阿里健康和京东健康则侧重医疗大模型与服务闭环；AI 正在从通用应用进入高门槛垂直产业，36氪。
字节、阿里等加速进入汽车智能化场景（6/10）
新浪财经报道字节火山引擎与赛力斯新品牌 AIVA 深度合作，阿里高德与比亚迪充电网络融合，同时华为、腾讯、百度等也加强车企合作；汽车正成为大模型、多模态交互、云边协同和智能座舱能力的综合落地场景，新浪财经。

2. 创业公司

国内

MiniMax 港股上市，市值超过 700 亿港元（6/11）
36氪报道 MiniMax 在港上市，发行价 165 港元、募资约 41.89 亿港元，开盘市值超过 700 亿港元，基石投资者包括阿里、米哈游、腾讯等；中国大模型创业公司正从一级市场融资进入公开市场估值检验阶段，36氪。
Kimi / 月之暗面再传约 20 亿美元融资与赴港 IPO 提速（6/9 - 6/12）
36氪多篇报道显示月之暗面接近完成新一轮约 20 亿美元融资，估值区间被报道在 200 亿至 300 亿美元之间，并开始加速赴港 IPO 准备；同时 Kimi K2.6、Kimi Work Beta 与 agent 化任务执行能力成为资本叙事核心，36氪、36氪。
智谱与 MiniMax 解禁期临近，Kimi 高估值面临公开市场参照（6/12）
36氪报道智谱与 MiniMax 将进入解禁期，股价波动和流动性变化可能影响市场对 Kimi 新融资估值的判断；中国 AI 创业公司开始同时面对“模型能力、商业收入、上市流动性和估值锚”的多重考核，36氪。

海外

Jeff Bezos 参与的 Prometheus 融资 120 亿美元，押注 physical AI（6/11 - 6/12）
TechCrunch 报道 Jeff Bezos 与 Vik Bajaj 共同创办的 physical AI 初创公司 Prometheus 完成 120 亿美元融资，估值达 410 亿美元，目标是构建面向物理世界的“artificial general engineer”；资本正在把 AI 下一阶段想象力投向机器人、制造和真实世界工程，TechCrunch。
NEURA Robotics 宣布最高 14 亿美元 C 轮融资（6/10）
NEURA Robotics 宣布最高 14 亿美元 C 轮融资，投资方包括 Tether、Qualcomm、Amazon、NVIDIA、Bosch、Schaeffler 等，用于扩展 cognitive robots、Neuraverse、NEURA Gyms 和制造部署能力；physical AI / humanoid 正成为超大额融资热点，Morningstar / Business Wire。
Coram 完成 3500 万美元 B 轮，构建保护物理空间的 autonomous agents（6/11）
Coram 宣布完成 3500 万美元 B 轮融资，由 Ansa Capital 和 Battery Ventures 领投，累计融资 6600 万美元，用于构建可保护现实物理空间的 autonomous agents；安防、摄像头和物理场景自动化正在成为 agent 商业化方向之一，Coram。
ChatSee.ai 获 650 万美元融资，聚焦 AI agent failure intelligence（6/12）
ChatSee.ai 宣布获得 True Ventures 领投的 650 万美元融资，定位为 autonomous AI systems 的 failure intelligence layer，帮助企业识别、理解和缓解 agent 失败；随着 agent 进入生产环境，“失败可观测性”正在成为独立工具层，PR Newswire。
Equal AI 完成 3000 万美元 B 轮，扩展印度消费 AI 助手（6/12）
KnowStartup 报道印度消费 AI 公司 Equal AI 完成 3000 万美元 B 轮，由 Prosus Ventures 和 Tomales Bay Capital 领投，用于扩展 AI call assistant 以及通信、金融、生活方式、购物和 concierge 服务；新兴市场的手机端 AI 助手仍在争夺高频入口，KnowStartup。
Scatter Lab 因 AI 角色聊天应用 Zeta 完成 500 亿韩元融资（6/14）
Seoul Economic Daily 报道 Scatter Lab 凭借 AI 角色聊天应用 Zeta 获得 500 亿韩元融资；AI companionship、角色聊天和娱乐型 agent 继续证明消费端付费与增长潜力，但也会带来内容安全和未成年人保护议题，Seoul Economic Daily。

3. 基础模型（含视频 / 多模态 / 开源）

MiniMax 发布 T2V-01-Director 与 I2V-01-Director 视频生成模型（6/13）
MiniMax 宣布海螺视频 T2V-01-Director、I2V-01-Director 上线，强调“镜头控制”能力，可组合 15 种单镜头运动以生成更专业的视频片段；视频生成模型竞争正在从清晰度、时长扩展到可控镜头语言和创作流程，MiniMax。
MiniMax 发布 M2.5 / M2.5-Lightning，强化 coding 与 agentic tool use（6/14）
MiniMax 发布 M2.5 系列，称其面向真实生产力任务，在 coding、agentic tool use、search 和 office tasks 上增强，并给出 SWE-Bench Verified、BrowseComp 等指标；国内模型厂商继续把“长任务 + 工具调用 + 办公/编程”作为通用模型商业化主战场，MiniMax。
智谱 / Z.ai 发布 GLM-5.2，主打 100 万 token 上下文与长程 coding（6/13）
多个模型索引和社区页面记录 GLM-5.2 于 6 月 13 日上线，主打 1M token context、长程任务、工具调用和 coding 场景，并预告更开放的版本；国产开源/开放权重模型继续把长上下文和 agent 工程能力作为差异化方向，Models.dev、Hacker News、DEV Community。
印度 MeitY 推出 Varya AI 视频模型，强调主权文化适配（6/12）
Free Press Journal 报道印度电子和信息技术部推出由 Avataar AI 开发的 Varya AI 视频模型，称其面向印度文化场景、速度和成本优于全球同类，并计划在 AI Kosh 开放权重；主权 AI 叙事正从语言模型扩展到视频生成，Free Press Journal。
Resemble AI 发布 Chatterbox Multilingual v3，开源 TTS 默认嵌入水印（6/10）
Resemble AI 发布 Chatterbox Multilingual v3，支持 21 种语言和 4 种方言，保留 MIT license，并默认在自托管音频输出中嵌入 PerTh watermark；语音模型开源生态开始把 provenance、水印和 EU AI Act 合规放到模型发布叙事中，Resemble AI。

4. 论文与研究进展

多模态智能体用于配电缺陷检测评测（6/12）
arXiv 论文评估 foundation models 作为配电缺陷检测的统一认知引擎，覆盖感知、推理和工具使用三类能力，并构建领域数据集与多任务 benchmark；行业场景正在推动多模态 agent 从通用 VQA 走向闭环维护和工单生成，arXiv。
UXBench / UI-UX 研究多模态 LLM 的移动界面推理能力（6/12）
论文提出 UXBench，包含 2000 个 UI-based VQA 样本与 8 类细粒度任务，并用强化学习框架改进 MLLM 在布局关系、视觉层级和内容一致性上的推理；AI agent 操作手机和网页前，需要更可靠的界面理解与 UX 诊断能力，arXiv。
Agent Skill Evaluation and Evolution 梳理智能体技能评测与进化框架（6/9）
arXiv 论文提出 skill evaluation / evolution 的框架与 benchmark 综述，强调多模态技能、轨迹蒸馏、技能安全和持续演化；agent 生态的重点正在从“单次任务完成率”转向“技能资产如何诊断、维护和安全复用”，arXiv。
Hi-VLA 系统研究机器人层级 VLA 策略编排（6/9）
“What Matters in Orchestrating Robot Policies” 系统研究 hierarchical vision-language-action agents，在短程、长程和需要推理的机器人任务中比较 planner、controller、切换机制与记忆表示；机器人 agent 的能力瓶颈越来越像软件 agent：不仅要强模型，还要强编排，Papers.cool / arXiv。
Critic-MCoT 用 DPO 与错误样本合成提升多模态 CoT 推理（6/9）
ScienceDirect 论文提出 Critic-MCoT，通过 Iterative Adversarial Refinement 生成错误样本和修正样本，并用 DPO 强化多模态 Chain-of-Thought 各步骤；多模态推理研究继续从“最终答案正确”深入到“每一步推理是否可靠”，ScienceDirect。
RC-DPO 研究用推理质量条件化偏好优化降低多模态幻觉（6/11）
UBOS 介绍的研究提出 Reasoning-Conditioned Direct Preference Optimization，通过把偏好学习条件化在视觉扎根推理轨迹质量上，降低多模态大推理模型幻觉并提升准确率；多模态安全的核心正在转向“可解释、可审计的推理轨迹”，UBOS。

5. 开源项目与社区讨论

Google 开源 OpenRL，自托管 LLM 后训练 API（6/11）
Google Open Source 发布 OpenRL，一个可在本地、NVIDIA GPU 或 GKE 上运行的自托管 post-training API，抽象强化学习微调基础设施，并提供与 Tinker 兼容的 endpoint；后训练、RL 和可控微调正在从少数大厂内部能力外溢为可运营基础设施，Google Open Source Blog。
Databricks 发布开源 Omnigent，统一组合和控制多种 agents（6/13）
Databricks 发布 Apache 2.0 alpha 项目 Omnigent，定位为 agent meta-harness，可把 Claude Code、Codex、Pi、OpenAI / Claude SDK 等包装到统一 API 中，实现策略控制、组合编排和实时协作；agent 工具链正在从单一 harness 走向跨模型、跨执行器的控制平面，Databricks。
llm-cli-gateway v2.3.0 为 37 个 MCP 工具增加安全注解（6/7 UTC / 6/8 北京时间）
verivus-oss/llm-cli-gateway 发布 v2.3.0，为 Claude Code、Codex、Gemini、Grok、Mistral 等 CLI 统一 MCP gateway 的 37 个工具增加 readOnly、destructive、idempotent、openWorld 等注解和 invariant tests；MCP 工具生态正在显式化权限语义和 UI 安全提示，GitHub。
Goose 作为本地开源 AI agent 获得社区关注，强调 70+ MCP 扩展（6/7 UTC / 6/8 北京时间）
Developers Digest 报道 Goose 登上 GitHub 趋势榜，支持桌面、CLI、API、多 LLM provider 和 70+ MCP extensions，并由 Linux Foundation 旗下 Agentic AI Foundation 治理；本地 agent 正通过 MCP 扩展从单机助手变成可连接内部系统的工作台，Developers Digest。
PewDiePie 发布本地优先开源 AI workspace Odysseus（6/10）
NetInfluencer 报道 PewDiePie 发布免费、开源、自托管 AI workspace Odysseus，强调本地模型、外部 API 兼容、无遥测和创作者数据隐私，短时间获得大量 GitHub stars；AI 工具的消费端开源运动正在把隐私、本地控制权和反订阅叙事结合起来，NetInfluencer。
OpenCode 被报道达到 160K GitHub stars 与 750 万月活开发者（6/11）
Abhishek Gautam 报道 OpenCode 在 2026 年 6 月达到 160K stars 和 750 万月活开发者，主打 model-agnostic AI coding CLI，可连接 75+ AI providers；开发者工具竞争正在从“哪家模型最强”转向“谁能让团队自由组合模型、成本和部署位置”，Abhishek Gautam。
Hacker News 热议 Claude Fable 5 的代码与推理表现（6/9）
Claude Fable 5 相关 HN 讨论集中在 coding、bug finding、推理效率、成本和实际工程质量上，许多评论把关注点放在真实任务评估而非 benchmark；开发者社区对前沿模型的评价越来越依赖“能否稳定改复杂代码库”，Hacker News。
Hacker News 热议 Anthropic 出口管制时间线（6/14）
HN 讨论“The whirlwind 24 hours that led to export controls on Anthropic”时，围绕 jailbreak 风险是否被夸大、政府管制动机、Dario Amodei 的公开表态和模型访问限制展开争议；前沿模型政策事件正在迅速变成开发者社区的高热议题，Hacker News。
“AI slop”指控被研究为新的社区 gatekeeping 形式（6/12）
Unite.AI 报道一项研究分析 Reddit 与 Hacker News 上约 2500 万条评论，发现“AI slop”到 2026 年已成为压倒性的贬义 AI 标签，并常在缺少证据时用于排斥内容；AI 内容识别与社区信任问题正在从技术检测变成社会规范冲突，Unite.AI。

6. 其他趋势

Backblaze 发布 Genblaze，多供应商生成式媒体流水线 SDK（6/11）
Backblaze 发布开源 Python SDK Genblaze，用统一 API 管理视频、图像、音频生成供应商，记录 hash-bound provenance manifest，并支持对象存储持久化与 replay；生成式媒体生产正在需要可追溯、可复现、可审计的工程流水线，Backblaze。
CData Connect AI 6 月更新扩展数据源、Skills 与治理能力（6/9）
CData 发布 Connect AI 6 月更新，新增 17 个数据源、Connect AI Skills、Azure Key Vault 集成等治理能力，目标是为企业 LLM / MCP 场景提供稳定数据连接和上下文控制；企业 AI 基础设施继续围绕“数据连接 + 权限 + token 成本 + 可治理上下文”演进，CData。
Kakunin 发布面向 Gemini 与 OpenAI agent 生态的加密合规 SDK（6/14）
Kakunin 宣布推出 cryptographic compliance shield，覆盖 Google Antigravity、OpenAI Swarm 和 OpenAI Assistants API，提供 pre-flight scope verification、active-agent enforcement 和 tamper-evident auditing；agent 生态的合规工具开始从日志审计走向加密身份和运行前权限证明，PRWeb。
Claude in Amazon Bedrock 被报道推出原生 Messages API endpoint（6/11）
TheRouter.ai 报道 Amazon Bedrock 中 Claude 模型新增 bedrock-mantle endpoint，以 Anthropic Messages API 形式提供 SSE 调用，并面向多 provider routing 团队简化集成；多云模型平台正朝着“统一消息协议 + 区域/全球 endpoint + 数据驻留选项”演进，TheRouter.ai。
Great American AI Act 草案引发联邦 AI 框架与州法边界讨论（6/9）
Fisher Phillips 与 FPF 解读 6 月 4 日发布的 Great American AI Act 讨论稿，重点包括 frontier AI 透明度、安全事件报告、独立验证、举报人保护、联邦测试床，以及对州级模型开发规则的三年预置；美国 AI 监管焦点继续在“统一联邦框架 vs 州级先行监管”之间拉扯，Fisher Phillips、FPF。
California SB 951 被解读为 AI / 自动化裁员通知义务信号（6/8）
Shaw Law Group 解读 California Senate Bill 951，称其可能要求大雇主在 AI 或自动化导致 25 个以上岗位损失时提前 90 天通知，并引入 technology hiring disruption notice；即使法案仍在推进中，也显示 AI 对就业影响正在进入更具体的劳动法程序，Shaw Law Group。
Connecticut AI 法继续被律所集中解读，覆盖就业、医疗和在线安全（6/8 - 6/9）
多家律所本周继续解读 Connecticut CART Act / Public Act 26-15，重点包括自动化就业决策披露、AI 参与裁员时的 WARN 披露、医疗和在线安全要求；企业使用 AI 的合规边界正在从“模型开发”延伸到 HR、消费者保护和未成年人安全，Employment Law Insights、RopesDataPhiles。

AI Weekly

#AI #LLM #Agent #AI Weekly

AI 行业周报 · 2026 年 6 月第 2 周（6/8 - 6/14）

https://blog.wh1isper.top/2026/06/14/ai-weekly-2026-06-14/

作者

Wh1isper

发布于

2026年6月14日

许可协议

Environment as Agentic Infrastructure 上一篇

AI 行业周报 · 2026 年 6 月第 1 周（6/1 - 6/7）下一篇