突破大模型“隐私-效用-效率”不可能三角!上海团队提出客户端加密云端推理新方案

发布时间:2026-06-26

隐私、效用、效率,三者能否兼得?长期以来,这构成了大模型推理服务难以突破的 “不可能三角”——如何在享受云端大模型强大能力的同时守住隐私底线,是产业落地的核心难题。

微信图片_20260626091324

近日,上海科学院下属的上海计算机软件技术开发中心(上海市生成式人工智能质检中心)人工智能团队提出一项名为OSNIP的创新框架,通过轻量部署的方式,实现了高安全性、近无损效用与低延迟的兼顾,为敏感数据安全上云提供了可落地的技术方案。这一成果以论文形式被国际顶级会议ICML 2026收录。

AI时代的隐私困境

当前,“模型即服务”(MaaS)的快速普及,让调用顶尖大模型的门槛一再降低。用户只需将提示词上传云端,几秒就能获得精准结果。然而,当提示词中包含商业策略、产品思路甚至未公开代码时,如何确保这些隐私不被泄露?

上海软件中心人工智能部副部长马泽宇向记者描述了来自产业一线的困境,“越大的客户越不敢用真正厉害的模型。”这些客户不缺预算,而是担心商业机密一旦离开本地,就可能被服务商留存或用作训练。此前三星采购ChatGPT服务后部分核心源码泄露的案例,让很多企业心有余悸,大多选择退而求其次,在本地部署能力有限的小模型,无法同步享受云端模型的技术迭代红利。而若要本地搭建高并发、高可用的大模型服务,又需投入巨额算力硬件成本,落地门槛极高。

针对这一隐私难题,业界进行了大量探索,但传统路线各有致命短板。同态加密等密码学方案安全性强但计算量极大,推理延迟可能从毫秒级飙升至小时级,无法满足实时交互需求。差分隐私路线效率很高,但通过注入噪声替换敏感信息的方式,会破坏语义,拉低回答质量。

“现有路线要么让模型变慢,要么让模型变笨,大模型厂商和用户都难以接受。”在马泽宇看来,真正具备产业价值的方案,必须突破“隐私-效用-效率”兼得的“不可能三角”,让对数据安全敏感的用户,能够无负担地使用最新、最强的云端大模型。围绕这一目标,团队展开攻关。

利用人机思维差异“反向加密”

团队没有沿用 “强化加密” 或 “注入噪声” 的传统思路,而是向大模型内部寻找答案。他们注意到,大模型处理信息并非依赖人类熟悉的离散文字,而是在一个高维连续的内部表征空间中运行。这一视角与此前研究者截然不同,成为突破 “不可能三角” 的关键。

微信图片_20260626091351

灵感源于团队在对抗样本领域的多年技术积累。“给一张熊猫图片加上人眼完全无法察觉的微小噪声,人类看上去还是熊猫,但神经网络会大概率将其识别为长臂猿。” 马泽宇用对抗样本领域的经典案例解释道,同一输入在人眼中毫无变化,在模型眼中却可能面目全非。这意味着,人类与模型的内部“思考”模式存在显著差异。

“我们这个工作就是利用人机的思维差异反向而行。”马泽宇说。既然存在一种噪声能迷惑模型却骗不过人类,那能不能“反向加密”,设计一种扰动,迷惑不了大模型,却能迷惑试图窥探的人?

沿着这一思路,团队深入分析了大语言模型(LLM)内部表征的高维特性,基于流形假设从理论上证明:模型表征空间中天然存在一个“混淆语义零空间”(Obfuscated Semantic Null Space)——落入这一空间的表征对攻击者是乱码,对大模型却与原文等价。只需将提示词表征精准投影到这一区域,扰动就会被模型内部自然吸收,无需任何去噪重建,即可实现隐私保护。

安全高效的隐私保护方案

从理论证明到产业可用,还需落地为可复用的技术工具。基于上述发现,团队设计并推出了基于混淆语义零空间投影的隐私保护框架OSNIP(Obfuscated Semantic Null Space Injection for Privacy)。

微信图片_20260626091354

整套方案仅需在客户端或可信第三方部署一个轻量加密器,即可对用户输入进行实时加密处理。

实测数据显示,在Llama、Qwen等多款主流开源模型上,面对业界公认的KNN逆向攻击,OSNIP可将攻击成功率降至0.00%,几乎实现了近零泄露。与此同时,在涵盖推理、知识、常识等十项通用评测任务中,模型回答质量保留率近乎100%,额外延迟仅0.96毫秒,完全满足工业级实时对话的要求。

微信图片_20260626091357

微信图片_20260626091400

“这套方案对云端大模型厂商来说改造很小。”马泽宇介绍,用户若无隐私需求可正常调用模型,有保密需求时则通过加密模块上传,以极小的性能代价实现高效隐私保护,可落地性很强。

据介绍,从理论发现到框架成型,整个研究仅历时三个月便完成攻关。谈及下一步规划,团队透露,技术上正向更大参数规模的模型及多模态场景拓展,探索图片、视频等场景下的隐私保护。同时,团队正与多家大模型厂商协作,推动云端模型开放能接受表征向量的API接口,加速技术的工程化落地。

“大模型隐私保护不应是少数厂商的专利”,马泽宇表示,团队选择公开论文,正是希望“推动整个行业范式转变,让轻量化隐私保护成为行业共识,最终让更多用户受益。”

随着工程化持续推进,这条由上海团队原创的云端大模型隐私保护技术路径,将为行业提供一种安全高效的落地新选项。一个聪明强大又值得信赖的AI助手,正从技术构想一步步走进现实。

论文链接:https://arxiv.org/abs/2601.22752