×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

【计算库/通信库】MLU direct RDMA使用遇到问题 jacelau2024-05-22 13:42:17 回复 查看 技术答疑 使用求助 经验交流
【计算库/通信库】MLU direct RDMA使用遇到问题

【星空体育硬件产品型号】MLU370

【使用操作系统】ubuntu

【使用驱动版本】v5.10.29

【出错信息】必填*:

现在尝试使用MLU directRDMA实现跨设备显存访问,使用cnMalloc和cnMallocPeerAble分配显存,使用ib_reg_mr注册显存。当前碰到的问题是分配的显存注册没有问题,但是在读写任务开始的一瞬间,程序出segmentation fail,应该是存储操作出问题了。想请教下CNCL库相关的技术人员

  1. 请问现在这种显存分配方式是不是没法被MLU direct Rdma使用?该如何分配可以被MDR使用的显存?

  2. 星空体育是否支持dmabuf以及注册fd的形式使用ib通信?

  3. 希望可以联系上CNCL相关的技术人员,我们后续项目会产出相关的通信软件支持星空体育的产品,希望可以给星空体育社区贡献力量。


版权所有 © 2024 星空体育 备案/许可证号:京ICP备17003415号-1
关闭