数据管理概述
智川云实例包含三类存储:系统盘、数据盘、文件存储。它们在性能、生命周期、共享能力和计费方式上差异明显,建议按场景选择。
存储类型速览
| 维度 | 系统盘 | 数据盘 | 文件存储 |
|---|---|---|---|
| 挂载目录 | / | /root/rivermind-data/ | /root/rivermind-fs/ |
| 默认容量 | 30GB | 50GB 起 | 按需(每区域 20GB 免费) |
| 主要用途 | 系统、环境、代码 | 训练数据、任务输出 | 跨实例共享、长期保存 |
| 生命周期 | 随实例释放 | 随实例释放 | 独立于实例 |
| 共享范围 | 仅当前实例 | 仅当前实例 | 同一算力区域内共享 |
| 扩缩容 | 不支持扩缩容 | 支持扩容,不支持缩容 | 按量使用,无需手动扩容 |
| 区域规则 | 随实例创建 | 随实例创建 | 需按算力区域分别开通,区域间不共享 |
| 性能与训练建议 | 本地存储,性能高、稳定性好 | 本地存储,性能高、稳定性好,推荐用于训练 | 网络存储,性能和稳定性低于数据盘,不建议直接训练 |
| 计费要点 | 包含在实例内;保存镜像时包含 | 扩容部分按量计费 | 超出每区域 20GB 免费额度后按量计费 |
重要
- 数据盘会随实例释放而删除,重要数据请提前备份。
- 文件存储独立于实例,实例释放后数据仍保留。
- 不建议直接在文件存储上训练,建议先复制到数据盘再训练。
如何选择
- 系统和运行环境:放系统盘(
/)。 - 训练数据与高频读写:放数据盘(
/root/rivermind-data/)。 - 跨实例共享与长期保存:放文件存储(
/root/rivermind-fs/)。
推荐训练流程:
- 数据长期放在文件存储。
- 开始训练前同步到数据盘。
- 训练完成后将结果回传到文件存储。
数据盘说明
扩容与缩容
- 数据盘支持扩容,最小扩容量为 1GB。
- 数据盘不支持在线缩容。
缩容替代方案
文件存储说明
开通、共享与计费
- 文件存储需按算力区域分别开通,区域之间互不共享。
- 开通后,同一区域内所有实例可共享同一文件存储。
- 每个算力区域提供 20GB 免费额度,超出部分按量计费。
管理方式建议
- 控制台文件存储页面:适合上传文件、新建文件夹、下载文件等简单操作。
- SSH 命令行:适合移动目录、批量整理、压缩/解压等复杂操作。
- 大量数据上传:建议使用
scp或rsync通过 SSH 传输。
数据传输
| 方式 | 适用场景 | 文档 |
|---|---|---|
| JupyterLab | 小文件、临时传输 | JupyterLab |
| SCP/rsync | 命令行传输、大批量文件 | 上传数据 |
| FileZilla | 图形化传输 | FileZilla |
常用空间检查命令
bash
# 查看磁盘与挂载
df -h
# 查看当前目录下各子目录占用
du -sh */ | sort -hr
# 清理常见缓存
pip cache purge
conda clean -a -y
rm -rf ~/.cache/huggingface/hub/备份建议
- 重要数据至少保留两份(本地/对象存储/文件存储)。
- 训练中间结果定期回传文件存储,避免实例异常导致数据丢失。
- 训练环境配置完成后保存镜像,减少重复配置成本。
- 代码使用 Git 管理,数据与代码分离存放。
