Skip to content

数据管理概述

智川云实例包含三类存储:系统盘、数据盘、文件存储。它们在性能、生命周期、共享能力和计费方式上差异明显,建议按场景选择。

存储类型速览

维度系统盘数据盘文件存储
挂载目录//root/rivermind-data//root/rivermind-fs/
默认容量30GB50GB 起按需(每区域 20GB 免费)
主要用途系统、环境、代码训练数据、任务输出跨实例共享、长期保存
生命周期随实例释放随实例释放独立于实例
共享范围仅当前实例仅当前实例同一算力区域内共享
扩缩容不支持扩缩容支持扩容,不支持缩容按量使用,无需手动扩容
区域规则随实例创建随实例创建需按算力区域分别开通,区域间不共享
性能与训练建议本地存储,性能高、稳定性好本地存储,性能高、稳定性好,推荐用于训练网络存储,性能和稳定性低于数据盘,不建议直接训练
计费要点包含在实例内;保存镜像时包含扩容部分按量计费超出每区域 20GB 免费额度后按量计费

重要

  • 数据盘会随实例释放而删除,重要数据请提前备份。
  • 文件存储独立于实例,实例释放后数据仍保留。
  • 不建议直接在文件存储上训练,建议先复制到数据盘再训练。

如何选择

  • 系统和运行环境:放系统盘(/)。
  • 训练数据与高频读写:放数据盘(/root/rivermind-data/)。
  • 跨实例共享与长期保存:放文件存储(/root/rivermind-fs/)。

推荐训练流程

  1. 数据长期放在文件存储。
  2. 开始训练前同步到数据盘。
  3. 训练完成后将结果回传到文件存储。

数据盘说明

扩容与缩容

  • 数据盘支持扩容,最小扩容量为 1GB。
  • 数据盘不支持在线缩容。

缩容替代方案

  1. 新建实例,或克隆实例(可复制系统盘环境和系统盘数据)时不勾选「复制数据盘」。
  2. 为新实例配置目标容量的数据盘。
  3. 使用 复制到数据盘文件存储 迁移数据。
  4. 核对无误后释放旧实例。

详见 数据盘扩容克隆实例

文件存储说明

开通、共享与计费

  • 文件存储需按算力区域分别开通,区域之间互不共享。
  • 开通后,同一区域内所有实例可共享同一文件存储。
  • 每个算力区域提供 20GB 免费额度,超出部分按量计费。

详见 文件存储计费说明

管理方式建议

  • 控制台文件存储页面:适合上传文件、新建文件夹、下载文件等简单操作。
  • SSH 命令行:适合移动目录、批量整理、压缩/解压等复杂操作。
  • 大量数据上传:建议使用 scprsync 通过 SSH 传输。

详见 SSH 远程连接上传数据

数据传输

方式适用场景文档
JupyterLab小文件、临时传输JupyterLab
SCP/rsync命令行传输、大批量文件上传数据
FileZilla图形化传输FileZilla

常用空间检查命令

bash
# 查看磁盘与挂载
df -h

# 查看当前目录下各子目录占用
du -sh */ | sort -hr

# 清理常见缓存
pip cache purge
conda clean -a -y
rm -rf ~/.cache/huggingface/hub/

备份建议

  1. 重要数据至少保留两份(本地/对象存储/文件存储)。
  2. 训练中间结果定期回传文件存储,避免实例异常导致数据丢失。
  3. 训练环境配置完成后保存镜像,减少重复配置成本。
  4. 代码使用 Git 管理,数据与代码分离存放。

相关文档

智算无疆 川流不息