MindStudio Monitor
✨ 最新消息¶
- [2025.12.30] MindStudio Monitor 项目全面开源
ℹ️ 简介¶
MindStudio Monitor(msMonitor)是面向昇腾集群场景的在线性能监测与动态采集工具,基于 dynolog(Meta CPU-GPU监控系统) 和 msPTI(MindStudio Profiler Tools Interface,MindStudio 性能分析工具接口)构建,支持npu-monitor、nputrace和Monitor API等能力。
支持框架 Profiler:Ascend PyTorch Profiler | MindSpore Profiler
核心组件如下:
| 组件 | 作用 | 文档 |
|---|---|---|
Dynolog daemon |
服务端守护进程,负责接收 dyno 请求并触发监测与采集。 | dynolog |
Dyno CLI |
客户端命令行入口,用于下发 npu-monitor 和 nputrace 命令。 |
dyno |
msPTI Monitor |
基于 msPTI 的采集模块,负责获取并上报性能数据。 | - |
⚙️ 功能介绍¶
msMonitor 提供以下核心能力:
| 功能名称 | 功能简介 | 文档 |
|---|---|---|
| npu-monitor | 轻量常驻后台,持续监测关键算子耗时,适合在线观察性能波动。 | npu-monitor |
| nputrace | 动态触发框架、CANN 和 Device 侧性能数据采集与解析,无需中断任务运行。 | nputrace |
| Monitor API | 提供 Python 接口,采集计算类算子、通信类算子、API、Runtime API、Mstx 等性能数据。 | Monitor API |
[!note]
由于底层资源限制,
npu-monitor与nputrace不能同时开启。
🚀 快速入门¶
首次使用 msMonitor 时,推荐直接按下面这条主线完成从安装到采集的端到端体验。 请参见 《msMonitor 工具快速入门》。
📦 安装指南¶
msMonitor 工具安装指南包含如下内容:
- 下载软件包安装:适合直接部署使用,推荐优先采用。
- 编译软件包安装:适合源码调试、二次开发与定制构建。
- 升级、卸载与日志。
具体请参见《msMonitor 工具安装指南》。
📘 使用指南¶
msMonitor 工具提供以下核心能力:npu-monitor、nputrace、Monitor API,详细使用说明请参见:
🔹 npu-monitor instruct
🔹 nputrace instruct
🔹 Monitor API
💡 典型案例¶
msMonitor 在大模型训练&推理场景下的使用案例,请参见《msMonitor使用案例》。
❓ FAQ¶
常见问题及解决方案,请参见《msMonitor FAQ》。
🌌 智能检索¶
为提升文档查阅效率,我们提供多种高效检索方式:
🔹 AI 问答(DeepWiki):自然语言问答,快速把握项目架构与模块关系。
🔹 AI 问答(ZRead):中文问答体验更优,精准定位功能用法与细节。
🔹 精确搜索(ReadTheDocs):关键词全文检索,直达接口、参数与报错等信息。
🛠️ 贡献指南¶
欢迎参与项目贡献,请参见 《贡献指南》。
📝 相关说明¶
🔹 《版本说明》
🔹 《许可证声明》
🔹 《文档 License》
🔹 《安全声明》
🔹 《免责声明》
🔹 《漏洞机制说明》
🔹 《公网地址声明》
🤝 建议与交流¶
欢迎大家通过 Issues 反馈问题、需求和建议,我们会尽快响应。 若希望加入社区交流,也可以通过以下入口进一步了解 MindStudio 团队。
诚邀参与满意度问卷调查抽取惊喜好礼😎。
🙏 致谢¶
msMonitor 由华为公司的下列部门联合贡献:
- 昇腾计算 MindStudio 开发部
- 2012 欧拉实验室
感谢来自社区的每一个 Pull Request,欢迎贡献 msMonitor。
关于 MindStudio 团队¶
华为 MindStudio 全流程开发工具链团队致力于提供端到端的昇腾 AI 应用开发解决方案,帮助开发者高效完成训练开发、推理开发和性能调优。 更多信息可访问:


