迁移实例
本文介绍如何将实例迁移到其他主机或地区。
迁移场景
| 场景 | 说明 | 数据处理 |
|---|---|---|
| 同地区迁移 | 在同一地区的不同主机间迁移 | 数据盘可保留 |
| 跨地区迁移 | 迁移到其他地区 | 需手动迁移数据 |
| 升级主机 | 迁移到更高配置主机 | 系统盘自动迁移 |
同地区迁移
适用情况
- 当前主机资源不足
- 需要更换 GPU 型号
- 主机维护需要迁移
迁移步骤
关机实例
- 在控制台关闭实例
- 等待状态变为「已关机」
选择目标主机
- 点击「开机」
- 系统会自动在同地区寻找可用主机
- 如需指定主机,可联系客服
等待迁移完成
- 系统盘数据会自动迁移
- 迁移时间取决于数据量
数据盘处理
注意
同地区迁移时,数据盘数据需要手动处理。
方法一:复制到新数据盘
参考 复制到数据盘 文档。
方法二:使用云存储中转
- 迁移前将数据上传到云存储
- 迁移后从云存储下载
跨地区迁移
跨地区迁移需要手动处理所有数据。
迁移步骤
备份数据
bash# 压缩数据盘内容 cd /root/rivermind-data tar czf backup.tar.gz ./*保存镜像
- 在控制台保存当前实例为镜像
- 镜像包含系统盘内容
在目标地区创建实例
- 选择目标地区
- 使用保存的镜像创建实例
恢复数据
bash# 上传并解压数据 cd /root/rivermind-data tar xzf backup.tar.gz
数据传输方式
| 方式 | 适用场景 | 速度 |
|---|---|---|
| SCP 直传 | 数据量小 | 一般 |
| 云存储中转 | 数据量大 | 较快 |
| rsync 同步 | 增量更新 | 高效 |
迁移注意事项
迁移前检查
- [ ] 确认重要数据已备份
- [ ] 记录当前环境配置
- [ ] 保存自定义镜像
- [ ] 导出依赖列表
bash
# 导出 pip 依赖
pip freeze > requirements.txt
# 导出 conda 环境
conda env export > environment.yml迁移后验证
- [ ] 检查系统盘数据完整性
- [ ] 验证环境配置正常
- [ ] 测试 GPU 是否可用
- [ ] 恢复数据盘数据
bash
# 验证 GPU
nvidia-smi
# 验证 Python 环境
python -c "import torch; print(torch.cuda.is_available())"常见问题
迁移后 SSH 连接信息变化
迁移后主机地址和端口可能变化,请在控制台获取新的连接信息。
迁移后数据丢失
- 系统盘数据通常会保留
- 数据盘数据需要手动迁移
- 建议迁移前做好备份
迁移时间过长
- 数据量大时迁移需要更多时间
- 可以先清理不必要的文件
- 联系客服了解迁移进度
目标地区无可用资源
- 尝试选择其他时段
- 选择其他 GPU 型号
- 联系客服预约资源
