文件存储
文件存储是智川云按算力区域提供的共享存储服务。需在目标算力区域开通后使用,开通后该区域内所有实例可共享访问。
概述
| 特性 | 说明 |
|---|---|
| 挂载路径 | /root/rivermind-fs |
| 开通方式 | 按算力区域单独开通,区域之间互不共享 |
| 共享范围 | 开通区域内所有实例 |
| 免费额度 | 每个算力区域 20GB |
| 最大容量 | 200GB(如需更多请联系客服) |
计费规则
| 项目 | 说明 |
|---|---|
| 单价 | 0.01 元/GB/日 |
| 免费额度 | 每个算力区域 20GB 以下免费 |
| 计费容量 | 当日(自然日)使用的最大容量 |
| 扣费时间 | 次日凌晨扣除当日费用 |
| 最低费用 | 超出免费额度后,最低 0.01 元/日 |
计算公式:
每日费用 = (该区域当日最大容量 - 20GB) × 0.01 元/GB示例:某算力区域当日最大使用 50GB
- 超出容量:50 - 20 = 30GB
- 当日费用:30 × 0.01 = 0.30 元
使用场景
- 数据共享:多个实例间共享数据集、模型文件
- 协作开发:团队成员共享代码和配置
- 持久存储:实例释放后数据仍保留
- 大文件存储:存放超出数据盘容量的大文件
与数据盘对比
| 特性 | 文件存储 | 数据盘 |
|---|---|---|
| 路径 | /root/rivermind-fs | /root/rivermind-data |
| 共享 | 同区域所有实例共享(跨区域不共享) | 仅当前实例 |
| 生命周期 | 独立于实例 | 随实例释放 |
| 性能 | 网络存储,适合大文件 | 本地 SSD,高性能 |
| 稳定性 | 受网络波动影响 | 本地存储,更稳定 |
| 适用场景 | 共享数据、持久存储 | 训练数据、高频读写 |
| 训练建议 | 不建议直接训练 | 推荐用于训练 |
基本操作
控制台可视化操作(适合简单管理)
在控制台的「文件存储」页面,可直接进行以下操作:
- 上传文件
- 新建文件夹
- 下载文件
适合日常的轻量文件管理与快速处理。
SSH 命令行管理(推荐复杂操作)
对于移动文件(夹)、批量整理、压缩/解压等复杂操作,建议通过 SSH 远程连接 到实例后,在终端使用命令行管理文件存储。
如需从本地上传大量数据,也建议使用 SSH 方式(如 scp、rsync)传输到 /root/rivermind-fs/。
查看文件存储
bash
# 查看挂载情况
df -h /root/rivermind-fs
# 查看目录内容
ls -la /root/rivermind-fs存放数据
bash
# 复制数据到文件存储
cp -r /root/rivermind-data/dataset /root/rivermind-fs/
# 移动大文件到文件存储
mv /root/rivermind-data/large_model.pth /root/rivermind-fs/models/从文件存储读取
bash
# 推荐:训练前先复制到数据盘
cp -r /root/rivermind-fs/dataset /root/rivermind-data/
python train.py --data /root/rivermind-data/dataset
# 共享场景可直接读取文件存储
ls /root/rivermind-fs/project/results_a/最佳实践
目录规划
/root/rivermind-fs/
├── datasets/ # 共享数据集
├── models/ # 预训练模型
├── checkpoints/ # 训练检查点
└── shared/ # 团队共享文件性能优化
- 大文件存储:适合存放大文件(模型、数据集)
- 训练建议:不建议直接在文件存储中训练,建议先复制到数据盘
- 高频读写:高频读写和频繁 checkpoint 建议使用数据盘
bash
# 训练前同步到数据盘
rsync -a /root/rivermind-fs/datasets/imagenet/ /root/rivermind-data/imagenet/多实例协作
bash
# 实例 A:保存训练结果
cp -r ./output /root/rivermind-fs/project/results_a/
# 实例 B:读取实例 A 的结果
ls /root/rivermind-fs/project/results_a/注意事项
重要
- 文件存储为网络存储,性能低于本地数据盘
- 读写性能和稳定性不如数据盘,不建议直接在文件存储中训练
- 高频小文件读写或频繁 checkpoint 建议使用数据盘
- 删除文件存储中的数据需谨慎,所有实例都会受影响
- 需要超过 200GB 容量请联系客服
- 连续 3 个月未登录或欠费 50 元以上,平台保留删除数据的权利
常见问题
文件存储和数据盘如何选择?
- 需要多实例共享 → 文件存储
- 需要高性能读写 → 数据盘
- 需要稳定训练读写 → 数据盘
- 需要持久保存 → 文件存储
文件存储满了怎么办?
清理不需要的文件,或联系客服扩容(超过 200GB)。
实例释放后文件存储数据还在吗?
是的,文件存储独立于实例,数据会保留。
可以直接在文件存储里训练吗?
不建议。文件存储是网络存储,读写性能和稳定性不如数据盘。建议训练前将数据复制到数据盘,训练完成后再将结果回传到文件存储。
