Skip to content

文件存储

文件存储是智川云按算力区域提供的共享存储服务。需在目标算力区域开通后使用,开通后该区域内所有实例可共享访问。

概述

特性说明
挂载路径/root/rivermind-fs
开通方式按算力区域单独开通,区域之间互不共享
共享范围开通区域内所有实例
免费额度每个算力区域 20GB
最大容量200GB(如需更多请联系客服)

计费规则

项目说明
单价0.01 元/GB/日
免费额度每个算力区域 20GB 以下免费
计费容量当日(自然日)使用的最大容量
扣费时间次日凌晨扣除当日费用
最低费用超出免费额度后,最低 0.01 元/日

计算公式

每日费用 = (该区域当日最大容量 - 20GB) × 0.01 元/GB

示例:某算力区域当日最大使用 50GB

  • 超出容量:50 - 20 = 30GB
  • 当日费用:30 × 0.01 = 0.30 元

使用场景

  • 数据共享:多个实例间共享数据集、模型文件
  • 协作开发:团队成员共享代码和配置
  • 持久存储:实例释放后数据仍保留
  • 大文件存储:存放超出数据盘容量的大文件

与数据盘对比

特性文件存储数据盘
路径/root/rivermind-fs/root/rivermind-data
共享同区域所有实例共享(跨区域不共享)仅当前实例
生命周期独立于实例随实例释放
性能网络存储,适合大文件本地 SSD,高性能
稳定性受网络波动影响本地存储,更稳定
适用场景共享数据、持久存储训练数据、高频读写
训练建议不建议直接训练推荐用于训练

基本操作

控制台可视化操作(适合简单管理)

在控制台的「文件存储」页面,可直接进行以下操作:

  • 上传文件
  • 新建文件夹
  • 下载文件

适合日常的轻量文件管理与快速处理。

SSH 命令行管理(推荐复杂操作)

对于移动文件(夹)、批量整理、压缩/解压等复杂操作,建议通过 SSH 远程连接 到实例后,在终端使用命令行管理文件存储。

如需从本地上传大量数据,也建议使用 SSH 方式(如 scprsync)传输到 /root/rivermind-fs/

查看文件存储

bash
# 查看挂载情况
df -h /root/rivermind-fs

# 查看目录内容
ls -la /root/rivermind-fs

存放数据

bash
# 复制数据到文件存储
cp -r /root/rivermind-data/dataset /root/rivermind-fs/

# 移动大文件到文件存储
mv /root/rivermind-data/large_model.pth /root/rivermind-fs/models/

从文件存储读取

bash
# 推荐:训练前先复制到数据盘
cp -r /root/rivermind-fs/dataset /root/rivermind-data/
python train.py --data /root/rivermind-data/dataset

# 共享场景可直接读取文件存储
ls /root/rivermind-fs/project/results_a/

最佳实践

目录规划

/root/rivermind-fs/
├── datasets/          # 共享数据集
├── models/            # 预训练模型
├── checkpoints/       # 训练检查点
└── shared/            # 团队共享文件

性能优化

  • 大文件存储:适合存放大文件(模型、数据集)
  • 训练建议:不建议直接在文件存储中训练,建议先复制到数据盘
  • 高频读写:高频读写和频繁 checkpoint 建议使用数据盘
bash
# 训练前同步到数据盘
rsync -a /root/rivermind-fs/datasets/imagenet/ /root/rivermind-data/imagenet/

多实例协作

bash
# 实例 A:保存训练结果
cp -r ./output /root/rivermind-fs/project/results_a/

# 实例 B:读取实例 A 的结果
ls /root/rivermind-fs/project/results_a/

注意事项

重要

  • 文件存储为网络存储,性能低于本地数据盘
  • 读写性能和稳定性不如数据盘,不建议直接在文件存储中训练
  • 高频小文件读写或频繁 checkpoint 建议使用数据盘
  • 删除文件存储中的数据需谨慎,所有实例都会受影响
  • 需要超过 200GB 容量请联系客服
  • 连续 3 个月未登录或欠费 50 元以上,平台保留删除数据的权利

常见问题

文件存储和数据盘如何选择?

  • 需要多实例共享 → 文件存储
  • 需要高性能读写 → 数据盘
  • 需要稳定训练读写 → 数据盘
  • 需要持久保存 → 文件存储

文件存储满了怎么办?

清理不需要的文件,或联系客服扩容(超过 200GB)。

实例释放后文件存储数据还在吗?

是的,文件存储独立于实例,数据会保留。

可以直接在文件存储里训练吗?

不建议。文件存储是网络存储,读写性能和稳定性不如数据盘。建议训练前将数据复制到数据盘,训练完成后再将结果回传到文件存储。

相关文档

智算无疆 川流不息