我们王智彬老师在计算机数据库系统领域取得了一系列重要研究进展,相关成果接连发表于国际顶级会议SIGMOD和VLDB。
第一项工作关注大模型推理系统中的关键性能瓶颈——KV Cache管理。随着大语言模型(LLM)的广泛应用,诸如长提示(long-prompt)和检索增强生成(RAG)等技术场景日益普遍。这些场景中,大量共享前缀(如系统指令、检索文档)会导致KV Cache的冗余存储和重复计算,严重占用宝贵的GPU显存资源,限制了推理系统的吞吐量和并发能力。为此,研究团队提出了一个名为HotPrefix的高效KV Cache管理与调度机制(被SIGMOD 2026录用)。该机制创新性地设计了“热度感知布谷鸟过滤器”,能够以极低的开销动态追踪不同前缀KV Cache的访问热度。基于精确的热度感知,HotPrefix实现了GPU与CPU内存之间高效的协同调度,通过“选择性准入”策略将高热度缓存数据卸载至CPU,并利用“高效预取”机制在需要时将其提前加载回GPU。实验证明,该方法能显著提升KV Cache的GPU命中率,与vLLM等现有先进系统相比,最高可将长提示场景下的端到端推理性能(时延与吞吐量)提升2.25倍,为解决大模型落地应用中的性能难题提供了关键方案。
SIGMOD 2026 Yuhang Li, Rong Gu, Chengying Huan, Zhibin Wang, Renjie Yao, Chen Tian, Guihai Chen HotPrefix: Hotness-Aware KV Cache Scheduling for Efficient Prefix Sharing in LLM Inference Systems

第二项工作致力于解决图数据分析中的隐私保护问题。图分析(如社交网络中的“三角关系”挖掘)应用价值巨大,但往往涉及用户连接关系等敏感信息。现有的差分隐私(DP)技术方案面临两难困境:中心化模型(CDP)虽然结果准确,但依赖一个完全可信的服务器,在去中心化场景中难以实现;而去中心化模型(LDP)虽无需可信方,却因注入过多噪声而导致结果准确性不佳。针对此,研究团队提出了Sectric:一个兼顾准确性、隐私性和效率的三角关系计数协议(发表于PVLDB)。Sectric开创性地采用密码学辅助方案,设计了全新的“三方私有集合成员测试”(3PPSMT)密码学原语,并用节点邻居集合代替传统的邻接向量进行计算。这一设计在不依赖任何可信第三方的前提下,达到了与中心化模型同等的计算准确度和隐私保护水平,同时将计算开销从O(|V|^2)级别显著降低至O(d_max |V|)级别,尤其适用于大规模稀疏图。该工作成功弥合了现有隐私保护图计算方案在信任假设和计算效用之间的鸿沟,为去中心化环境下的隐私安全数据分析提供了理论创新与实用技术。
VLDB 2025 MinZe Xu, Zhentai Xie, Zhibin Wang, Guangzhan Wang, Longbin Lai, Yuan Zhang, Chen Tian, Sheng Zhong. Sectric: Towards Accurate, Privacy-preserving and Efficient Triangle Counting.

第三项工作聚焦于解决数据湖场景下图数据管理效率低下的挑战。数据湖虽能存储海量异构数据,但其通用的列式存储格式(如Parquet)并未对图数据结构进行优化,导致邻居节点查询、标签过滤等图分析核心操作效率低下。为此,研究团队设计并研发了GraphAr:一种面向数据湖的高效图数据存储方案(发表于PVLDB)。GraphAr巧妙地构建于现有Parquet格式之上,通过标准化的YAML元数据文件与精心设计的数据布局(如CSR/CSC压缩稀疏行/列格式),完整地表达了工业界广泛应用的标签属性图(LPG)模型。更重要的是,它针对图操作进行了深度优化,设计了页对齐集合(PAC)数据结构,并结合现代CPU的位操作指令集(BMI)与单指令多数据流(SIMD)技术,开发了创新的编解码算法。这些优化使得邻居查询和标签过滤等操作的性能得到极致提升。评测结果显示,GraphAr的邻居查询速度比传统方法平均提升4452倍,端到端图分析负载性能提升29.5倍。该工作使得在数据湖上直接进行高性能图分析成为可能,极大地拓展了数据湖的应用边界。
VLDB 2025 Xue Li, Weibin Zeng, Zhibin Wang, Diwen Zhu, Jingbo Xu, Wenyuan Yu, Jingren Zhou. GraphAr: An Efficient Storage Scheme for Graph Data in Data Lakes.

欢迎对数据库感兴趣的老师和同学来信交流:wzbwangzhibin@gmail.com