openFuyao 社区 2026年3月-5月 运作报告
概述
2026年3月至5月,openFuyao社区在稳步发展的基础上,持续推进技术演进与生态协同共建。
技术演进方面,发布超节点接入与使能等关键技术;v26.03版本发布,InferNex AI推理加速能力全面升级,平均首token时延降低30%,端到端时延降低10%;v26.06版本测试版本开展功能验证中;新增近20项技术提案,涵盖基础设施、部署工具、AI推理多个方向。
生态进展方面,京东、移动云、灵雀云、工商银行等成员单位在KADC 2026 openFuyao分论坛分享社区技术落地实践。统信软件发布基于openFuyao 的商业发行版,打造可持续演进的云底座。
社区动态方面,社区委员会线下研讨会明确年度技术竞争力协同共建方向及任务,技术委员会全票通过正式成立Agent沙箱SIG。社区开展技术直播,解读社区发行版及关键技术特性。 携手生态伙伴与业界大咖先后亮相华为中国合作伙伴大会、KubeCon Europe、openEuler Developer Day、鲲鹏昇腾开发者大会等技术盛会,持续扩大社区技术影响力。openFuyao五大生态案例入选国家级软件示范案例。
社区活力

技术演进
版本进展
openFuyao v26.06测试版本功能验证中
openFuyao v26.06测试版本由社区各SIG组及用户、社区发行版伙伴开展功能验证中。 openFuyao v26.06版本release plan&特性清单: https://gitcode.com/openFuyao/release-management/blob/main/openFuyao-26.06/release-plan.md
InferNex AI推理加速能力全面升级,新增弹性伸缩与决策系统,优化分布式KVCache管理能力,平均首token时延降低30%,端到端时延降低10%。同时围绕昇腾NPU DRA适配、灵衢超节点使能等完成系统性升级。本次更新全方位提升AI推理的运维稳定性与部署效能。
技术提案
NPU虚拟化支持
在Ascend节点上引入XPUShare能力,实现"单物理NPU多Pod并发共享",并提供显存配额、算力配额、动态配额更新和可观测性能力。
InferNex 接入 KServe 适配层
实现 InferNex 推理套件与 KServe 的兼容接入,用户既可使用标准 LLMInferenceService,也可直接使用 InferNexService CRD 声明式部署整套 InferNex 推理套件,由适配层自动完成编排与路由打通。
infernex前置校验
InferNex前置校验工具在用户执行Helm部署前对目标环境进行系统性验证,覆盖NPU驱动与设备插件、硬件资源可用性、主机文件与挂载、网络与通信链路、集群状态及版本兼容性等关键环节,实现环境问题提前发现,降低部署失败风险并提升系统稳定性。
权重分发加速
为模型权重提供统一的分发与就绪能力,面向冷启动场景,实现完整权重从源端分发到目标节点;面向扩容场景,完成扩容实例的权重快速加载到显存。
cache-indexer重构增强
cache-indexer 基于事件订阅/轮询机制构建包含L1推理引擎显存缓存和L3内存/SSD缓存的双层独立索引,对外统一提供 KVCache 双层级命中率查询接口,支持推理系统优化推理请求调度,提高全局KVCache复用率。
InferNex分布式LLM推理加速系统架构设计
InferNex推理加速套件架构设计包含四大子系统和端到端部署,提供硬件亲和的企业级分布式推理加速能力。
基于推理时延预测与算力饱和度的路由策略
LLM推理负载具有输出长度随机、请求到达分布随机的特点,仅依赖当前状态做路由决策容易产生偏差。为此,在智能路由引入未来时延预测、后端算力饱和度的感知能力,以提升决策准确性。
Mooncake Store V3架构跨机多阶段读写与正向传输能力
在Mooncake Store V3架构新增正向数据传输能力,支持由数据访问方本机直接发起传输,实现了跨机Put/Get时由访问方或归属方灵活选择TE发起方向,覆盖更多网络拓扑与部署约束,解决了昇腾超节点等特定硬件反向传输代价高的问题。
安装部署前置环境校验工具
为了保障安装部署的成功运行,需要构建一个前置环境检查工具,检查环境中是否有残留文件和冲突程序,以及集群中时间是否同步。提高用户部署集群的流畅度和成功率。
众核2606版本需求设计
面向众核混部场景,构建'微架构级指标采集 → 干扰分析 → 干扰感知调度 → 可选 Kata 虚拟机隔离'的全链路系统。旨在零代码侵入的前提下,自动规避底层资源竞争的高干扰节点,有效保障在线业务 SLA(显著降低 P99 延迟抖动),并提升集群混部密度。
支持BKECluster中静态pod相关配置自识别与更新
支持用户修改管理集群中的BKECluster静态pod参数,实现管控面中所有静态pod的自动更新。
支持Containerd可选安装
UStack有栈容器云平台基于Docker运行。openFuyao安装时会清理Docker相关服务,导致UStack容器云故障。本提案旨在安装openFuyao时检测是否有docker containerd实例,若有则跳过containerd安装,使UStack可正常工作。
……(更多提案略)
技术博客
技术讲堂系列技术文章上线,从特性介绍、实现原理等多维度全面解读社区技术能力:
- 快速安装管理面:从安装引导集群、安装业务集群到使用openFuyao管理面的全流程操作。
- Cluster API安装指导:通过声明式API和控制器模式实现Kubernetes集群的生命周期管理自动化。
- AI推理鹰眼(Eagle Eye):面向AI推理场景的可观测体系,提供从业务运行态、系统运行态到硬件健康的全链路指标采集、实时传输与智能诊断。
- AI推理赫尔墨斯智能路由(Hermes-router):用于接收用户推理请求并转发至合适的推理服务后端。
- Mooncake Store热点缓存优化:通过PD分离及闲置的CPU、DRAM和SSD资源来实现KVCache的解耦缓存。
- 超大规模集群:通过系统性优化,稳定支撑1.6万节点的单集群,并为未来50万卡规模设计多集群协同架构。
生态进展
系列AI原生社区技术实践发布
鲲鹏昇腾开发者大会2026(KADC 2026)openFuyao分论坛上,京东、移动云、灵雀云、工商银行分享了社区技术落地实践:
- 京东:分享面向大规模AI原生工作负载的高可用弹性调度框架;
- 移动云:分享移动云超大规模集群实践、Kata+NPU 集群安全容器调度关键技术探索与实践;
- 灵雀云:分享基于openFuyao的海外落地实践;
- 工商银行:分享K8s-on-K8s 架构下大规模集群终态自治运维实践。
持续助力生态伙伴商业闭环
统信软件技术有限公司以OpenStack+openFuyao+Ceph打通云基础设施能力,构建可持续演进的云底座,为用户提供更贴近生产环境的容器云能力。
社区动态
筹备委员会与技术委员会召开线下研讨会
围绕履职审视、年度重点工作及核心技术问题展开研讨,明确了下一阶段社区治理规划与技术竞争力联合构建计划。
筹备委员会全票通过按章程启动成员单位履职审视:
- 触发情形:长期缺席会议(连续3次及以上)、半年内无实质贡献、违背开源核心价值观、行为与社区根本利益冲突且无法调解。
- 审视节点:2026年12月30日首轮评估。
筹备委员会明确成员单位技术共建任务:
| 成员单位 | 多样化算力使能与调度 | AI推理 | 社区发行版 | Agent沙箱 | 智能运维 | |||
|---|---|---|---|---|---|---|---|---|
| 超节点接入 | 超大规模集群 | NPU-DRA&软切分 | AI原生计算平台 | AI推理加速 | 容器平台发行版 | 沙箱调度 | AI Ops 可观测体系 | |
| 工商银行 | ✓ | ✓安装部署Owner | ✓ | |||||
| 京东 | ✓Owner | |||||||
| 联通云 | ✓ | ✓ | ✓ | |||||
| 移动云 | ✓Owner | ✓ | ✓ | ✓ | ||||
| 天翼云 | ✓ | ✓Owner | ||||||
| 华鲲振宇 | ✓ | ✓ | ||||||
| 博云 | ✓ | ✓ | ✓ | ✓ | ||||
技术委员会明确下一阶段的技术发展方向与竞争力共建任务:
| 技术方向 | 课题规划 | 课题情况 | 共建成员单位 |
|---|---|---|---|
| AI当代和下一代推理 | 10个 | 预防性切流决策引擎、灵衢KVCache零拷贝直访、ComputeProfile算力等效模型、pdAutoScaler SLO驱动框架、DSA/HA稀疏KVCache管理、智能缓存预热引擎、K8s拓扑感知调度插件、NPU亚健康检测评分模型、动态拓扑感知路径选优、P2P多播权重分发引擎 | 工商银行、联通云、移动云、天翼云、博云、广电五舟、华鲲振宇等 |
| Agent沙箱 | 6个 | 多沙箱运行时、高并发调度、安全访问策略、可观测性体系、规范与兼容性、性能基准测试 | 移动云、联通云、博云等 |
| 多样化算力使能和调度 | 12个 | vNPU软切分、NPU DRA、GPU/国产卡快速部署、高级算力调度策略、UB池化for资源高效使用、UB池化for性能加速、AI卡池化@DRA、kubevirt支持arm、虚机容器资源统一调度、多样运行时管理、异构平台支持、多样运行时下 AI 算力调度 | 华鲲振宇、移动云等 |
| 安装部署 | 8个 | 集群前置环境检查、引导节点功能单一化、提供节点级运维能力、声明式升级框架、安装升级框架增强、组件自动化生命周期管理、K8s关键组件灵活可配比部署、支持外接etcd集群 | 工商银行、博云等 |
| Release/QA | 4个规划 | 伙伴协同测试、测试能力提升、AI辅助测试研发、兼容性认证 | 按照"贡献和投入"准则,明确伙伴权益,深化合作 |
技术委员会全票通过正式成立Agent Sandbox SIG Agent Sandbox SIG,专注于解决AI Agent代码执行安全与效率的核心技术小组,针对传统容器无法有效隔离LLM不可控行为的风险,致力于构建基于Kubernetes的高安全MicroVM级隔离环境,为AI Agent提供标准化的安全运行环境。
开展技术直播
深度解读社区发行版与关键技术。openFuyao社区架构师姚晓忠为广大开发者及用户深度讲解社区首个LTS版本及v26.03版本升级特性与技术价值,吸引500+开发者线上观看与提问交流。接下来,除社区发行版外,还将带来关键特性解读直播,欢迎各位开发者在线围观互动。

亮相业界技术盛会分享社区前沿技术与落地实践
openFuyao携商业发行版伙伴亮相华为中国合作伙伴大会2026
[深圳,2026年03月19-20日]openFuyao与博云、灵雀云、华鲲振宇等商业发行版伙伴亮相中国华为合作伙伴大会,全方位呈现社区AI原生技术商业化落地实践。

openFuyao亮相KubeCon Europe 2026
[荷兰,阿姆斯特丹,2026年03月23-26日] KubeCon+CloudNativeCon Europe2026于阿姆斯特丹 RAI 会展中心举办,openFuyao设专属展台分享InferNex AI推理加速套件等社区核心技术成果,深化国际开源生态协同。

openFuyao亮相openEuler Developer Day 2026
[长沙,2026年04月25日] openFuyao社区参与openEuler Developer Day2026 活动,在《超节点技术创新》专题环节分享社区超节点云管接入技术,并深入探讨灵衢超节点K8s适配方案。

openFuyao携手生态伙伴与业界大咖亮相KADC 2026
[北京,2026年05月22-23日] openFuyao成立一周年之际,携前沿技术成果与生态实践重磅亮相鲲鹏昇腾开发者大会2026(KADC 2026),发布超节点接入与使能等关键技术与实践探索,与生态伙伴、业界大咖共话AI原生时代多样化算力集群软件生态。

社区五大生态案例
入选国家级软件示范案例。第五届中国国际软件发展大会上,openFuyao社区申报的联通数科、灵雀云、华鲲振宇、博云、广电五舟5个生态伙伴创新案例,全部成功入选"2025年软件和信息技术服务业示范案例",这一国家级荣誉充分彰显了openFuyao AI原生生态的技术实力与产业价值。

社区官网开发者体验优化
官网新增特性组件、应用中心、镜像中心下载页面。为方便开发者查看openFuyao社区的应用生态,快速检索社区支持的全部镜像与Helm Chart,官网下载版块新增以下三个页面:
- 应用中心:展示支持的社区/三方Helm Chart清单,提供维护SIG、下载链接、版本列表、依赖组件等信息。
- 镜像中心:展示支持的社区/三方镜像清单,提供维护SIG、下载链接、版本列表、镜像规格等信息。
- 特性组件:以特性维度展示社区组件的场景化能力,包含功能描述、安装说明、版本列表、下载链接等。其中功能描述链接到已有的"用户指南"文档。

