皮蛋熊([email protected])
系统软件专家 | GPU/vGPU 架构 | 虚拟化 | ARM / x86 平台适配 | 内核驱动开发
博客主页 | 详细个人经历
教育背景
电子科技大学 | 控制科学与工程(硕士)| 2019.09 – 2022.06
华东交通大学 | 电气工程及其自动化(学士)| 2012.09 – 2016.07
专业技能
- 编程技能:C/C++、Python和Shell;Linux/Windows 内核、驱动开发;熟悉 GDB、IDA、X64Dbg逆向分析
- 虚拟化:深度掌握 vGPU、SR-IOV、MDEV 架构,熟悉 QEMU、KVM和libvirt
- 平台适配:丰富的 ARM64、x86 架构开发和适配经验(自有SoC、Intel、AMD、鲲鹏、海光、飞腾等)
- GPU 架构:深入理解 NVIDIA、MT、IMG GPU 驱动栈;熟悉GPU工作原理
- AI 加速:熟悉 CUDA、PyTorch等推理栈
- 业余探索:于GPU、NAS圈中贡献力量
工作经历
摩尔线程智能科技有限公司 | GPU 虚拟化工程师 | 2022.07 – 至今
1. vGPU SR-IOV 架构设计与实现
- 主导 SR-IOV 软件方案设计(文档、驱动、固件),实现 Guest/Host GPU 隔离访问与调度
- 提出并实现动态显存分配、二级页表隔离等核心机制
- 发明专利公开号:CN118502936A
2. 调研高效的GPU页表监控方案
- 完成高效的GPU页表监控方案,解决因GPU芯片中2nd MMU缺乏导致GPU页表只能填HPA带来的虚拟机安全隐患
- 设计完成切实可行的GPU页表保护方法,并优化性能直至无法感知,最后超过性能超过未启动保护前的性能。
- 发明专利公开号:CN:CN116894275A TW:TW202511997A PCT:WO2025051279A1
2. ARM64 平台 vGPU 支持
- 完成 vGPU 在鲲鹏、某国产 ARM SoC 上的整体适配,涉及 IRQ remap、PCI BAR 映射、SMMU 重构
- 成功实现 WoA (Windows on ARM) 上使用 vGPU 提供加速,为业界首例
- 发布版本并完成测试与兼容适配
4. 动态MPC切换调研
- 完成动态切换MPC功能,解决不同虚拟机中性能隔离和性能动态分配的难题
- 仔细探索GPU中MPC的设计、确定动态调整MPC时的限制
- 设计软件完成切分,调试linux kmd和wddm kmd,解决因切分出现的花屏、TDR、死机等各类问题
- 完美实现不影响虚拟机运行的前提下完成底层MPC规格变更,类似于NVIDIA中在运行时候调整MIG配置(NV并不支持这类操作)
3. GPU 虚拟化创新项目
- PCIe 性能瓶颈分析与根因定位,解决长达两年的 outbound 带宽性能低问题(期间组里专家、组外专家均有尝试,但都铩羽而归)
- 深度参与SoC平台的某款产品从MRD到PRD,贡献我对该产品市场理解、软件定义和优势打法等
- 调研并实现 vGPU + Docker 云桌面方案
- 虚拟显示器支持、多平台 vGPU 热升级等
业余探索与开源贡献
于业余时间探索GPU、NAS圈中的疑难杂症,相关项目均是网友期盼的无人区,所有完成任务均是全网首发:
- 群晖 Nvidia GPU 驱动适配:群晖因缺乏GPU驱动导致大量应用受限;为此我为群晖系统适配了Nvidia驱动,逆向处理系统库,完善调用链;实现GPU功能的正常使能与系统级嵌入、完善AI监控加速功能,覆盖全系列 Synology 设备,为玩家在群晖中使用nvidia显卡设备带来了福音:新年礼物!群晖GPU驱动,不留遗憾,全机型适配!
- Intel DG1 在 PVE / 群晖上的完整支持:Intel DG1出世便伴随各种驱动问题、直通问题,直接导致NAS用户只能干瞪眼;为此我修复了驱动问题、并将其porting到群晖中和提供可直通的PVE内核,为玩家在Linux中使用DG1带来了福音: 全网首发!NAS独显转码新王晋级, Intel DG1驱动适配计划第一阶段完成!
- NVIDIA 30/40 系 vGPU 解锁逆向:自30系问世,因其改为SR-IOV实现vGPU,导致vgpu unlock社区各路大牛轮番上阵,均以失败告终。为系统、深入的学习NV vGPU方案,我定下unlock 30/40系目标,从正向、逆向手段进行探索,花费7个月的个人时间完成。(未公开,保护厂商利益,仅分享探索的技能和经验) 【再次突破】时隔四年,英伟达30/40系vGPU相继被攻破,游戏显卡虚拟化风云再起?
也曾在学习逆向和算法的过程中留有足迹:
- Surveillance Station 授权密钥逆向:调研授权逻辑、激活算法和密钥生成逻辑(未公开,保护厂商利益) 群晖监控(SurveillanceStation)授权调研报告
项目亮点总结
- 专利级创新:两项已公开发明专利,聚焦 GPU 虚拟化的开发、安全与性能调优
- 平台广泛适配:涵盖 x86/ARM、Linux/Windows、KVM/QEMU、Docker/VDI/各国内厂商系统 等各类场景
- 从顶层深入底层:从 Windows UMD到Windows KMD、从Linux UMD到Linux KMD、从Guest到Host、从Host到固件均具备实现经验
- 交付与发布:完成多个版本的发布、CI集成、Bug修复与测试联调
评论区