侧边栏壁纸
博主头像
蔚然小站博主等级

未来会有的,不要辜负了梦想

  • 累计撰写 42 篇文章
  • 累计创建 16 个标签
  • 累计收到 151 条评论

目 录CONTENT

文章目录

个人简历

皮蛋熊
2025-07-29 / 0 评论 / 26 阅读 / 4857 字

皮蛋熊([email protected]

系统软件专家 | GPU/vGPU 架构 | 虚拟化 | ARM / x86 平台适配 | 内核驱动开发
博客主页 | 详细个人经历


教育背景

电子科技大学 | 控制科学与工程(硕士)| 2019.09 – 2022.06

华东交通大学 | 电气工程及其自动化(学士)| 2012.09 – 2016.07


专业技能

  • 编程技能:C/C++、Python和Shell;Linux/Windows 内核、驱动开发;熟悉 GDB、IDA、X64Dbg逆向分析
  • 虚拟化:深度掌握 vGPU、SR-IOV、MDEV 架构,熟悉 QEMU、KVM和libvirt
  • 平台适配:丰富的 ARM64、x86 架构开发和适配经验(自有SoC、Intel、AMD、鲲鹏、海光、飞腾等)
  • GPU 架构:深入理解 NVIDIA、MT、IMG GPU 驱动栈;熟悉GPU工作原理
  • AI 加速:熟悉 CUDA、PyTorch等推理栈
  • 业余探索于GPU、NAS圈中贡献力量

工作经历

摩尔线程智能科技有限公司 | GPU 虚拟化工程师 | 2022.07 – 至今

1. vGPU SR-IOV 架构设计与实现

  • 主导 SR-IOV 软件方案设计(文档、驱动、固件),实现 Guest/Host GPU 隔离访问与调度
  • 提出并实现动态显存分配、二级页表隔离等核心机制
  • 发明专利公开号:CN118502936A

2. 调研高效的GPU页表监控方案

  • 完成高效的GPU页表监控方案,解决因GPU芯片中2nd MMU缺乏导致GPU页表只能填HPA带来的虚拟机安全隐患
  • 设计完成切实可行的GPU页表保护方法,并优化性能直至无法感知,最后超过性能超过未启动保护前的性能
  • 发明专利公开号:CN:CN116894275A TW:TW202511997A PCT:WO2025051279A1

2. ARM64 平台 vGPU 支持

  • 完成 vGPU 在鲲鹏、某国产 ARM SoC 上的整体适配,涉及 IRQ remap、PCI BAR 映射、SMMU 重构
  • 成功实现 WoA (Windows on ARM) 上使用 vGPU 提供加速,为业界首例
  • 发布版本并完成测试与兼容适配

4. 动态MPC切换调研

  • 完成动态切换MPC功能,解决不同虚拟机中性能隔离和性能动态分配的难题
  • 仔细探索GPU中MPC的设计、确定动态调整MPC时的限制
  • 设计软件完成切分,调试linux kmd和wddm kmd,解决因切分出现的花屏、TDR、死机等各类问题
  • 完美实现不影响虚拟机运行的前提下完成底层MPC规格变更,类似于NVIDIA中在运行时候调整MIG配置(NV并不支持这类操作)

3. GPU 虚拟化创新项目

  • PCIe 性能瓶颈分析与根因定位,解决长达两年的 outbound 带宽性能低问题(期间组里专家、组外专家均有尝试,但都铩羽而归)
  • 深度参与SoC平台的某款产品从MRD到PRD,贡献我对该产品市场理解、软件定义和优势打法等
  • 调研并实现 vGPU + Docker 云桌面方案
  • 虚拟显示器支持、多平台 vGPU 热升级等

业余探索与开源贡献

于业余时间探索GPU、NAS圈中的疑难杂症,相关项目均是网友期盼的无人区,所有完成任务均是全网首发

也曾在学习逆向和算法的过程中留有足迹:


项目亮点总结

  • 专利级创新:两项已公开发明专利,聚焦 GPU 虚拟化的开发、安全与性能调优
  • 平台广泛适配:涵盖 x86/ARM、Linux/Windows、KVM/QEMU、Docker/VDI/各国内厂商系统 等各类场景
  • 从顶层深入底层:从 Windows UMD到Windows KMD、从Linux UMD到Linux KMD、从Guest到Host、从Host到固件均具备实现经验
  • 交付与发布:完成多个版本的发布、CI集成、Bug修复与测试联调

评论区