打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
VisCPM-Chat
支持面向图像进行中英双语多模态对话。该模型使用Q-Former
作为视觉编码器,使用CPM-Bee(10B)作为语言基座模型,并通过语言建模训练目标融合视觉和语言模型。模型训练包括预训练和指令精调两阶段。
依赖环境:
组件 | 版本 |
---|---|
torch-mlu | 1.14.0-torch1.9 |
torchscale | 0.2.0 |
diffusers | 0.20.0.dev0 |
VisCPM | 4974645c786edf |
测试代码(图生文):
“黄河之水天上来,奔流到海不复回。” 李白的这句诗可以用来形容这幅图片中的景象:一条汹涌澎湃、波涛汹涌的河流从天而降,撞击着岩石峭壁,形成了令人叹为观止的壮观场面。
适配修改:先使用torch2mlu脚本
问题 | 解决 |
---|---|
accelerate:AttributeError: module 'distutils' has no attribute 'version' |
|
bool问题 | --- a/VisCPM/models/cpmbee.py @@ -260,7 +261,7 @@ class CPMBeeTorch(torch.nn.Module): |
Cannot set version_counter for inference tensor | diff --git a/VisCPM/generation/vllm_bee.py b/VisCPM/generation/vllm_bee.py @@ -235,7 +236,8 @@ class VLLMCPMBeeGeneration: model_inputs, other_info = self._process_list(data_list, max_inp_length) - with torch.inference_mode(): |
import BMinf报错 | 实际推理不会用到,注释掉 |
torch.frombuffer | 不加载safetensors类型的hf模型,改成.bin |
torch.utils.data 找不到default_collate | xxx/python3.7/site-packages/torch/utils/data/__init__.py from torch.utils.data.dataloader import DataLoader, _DatasetKind, get_worker_info, default_collate |
热门帖子
精华帖子