Skip to content

迁移实例

本文介绍如何将实例迁移到其他主机或地区。

迁移场景

场景说明数据处理
同地区迁移在同一地区的不同主机间迁移数据盘可保留
跨地区迁移迁移到其他地区需手动迁移数据
升级主机迁移到更高配置主机系统盘自动迁移

同地区迁移

适用情况

  • 当前主机资源不足
  • 需要更换 GPU 型号
  • 主机维护需要迁移

迁移步骤

  1. 关机实例

    • 在控制台关闭实例
    • 等待状态变为「已关机」
  2. 选择目标主机

    • 点击「开机」
    • 系统会自动在同地区寻找可用主机
    • 如需指定主机,可联系客服
  3. 等待迁移完成

    • 系统盘数据会自动迁移
    • 迁移时间取决于数据量

数据盘处理

注意

同地区迁移时,数据盘数据需要手动处理。

方法一:复制到新数据盘

参考 复制到数据盘 文档。

方法二:使用云存储中转

  1. 迁移前将数据上传到云存储
  2. 迁移后从云存储下载

跨地区迁移

跨地区迁移需要手动处理所有数据。

迁移步骤

  1. 备份数据

    bash
    # 压缩数据盘内容
    cd /root/rivermind-data
    tar czf backup.tar.gz ./*
  2. 保存镜像

    • 在控制台保存当前实例为镜像
    • 镜像包含系统盘内容
  3. 在目标地区创建实例

    • 选择目标地区
    • 使用保存的镜像创建实例
  4. 恢复数据

    bash
    # 上传并解压数据
    cd /root/rivermind-data
    tar xzf backup.tar.gz

数据传输方式

方式适用场景速度
SCP 直传数据量小一般
云存储中转数据量大较快
rsync 同步增量更新高效

迁移注意事项

迁移前检查

  • [ ] 确认重要数据已备份
  • [ ] 记录当前环境配置
  • [ ] 保存自定义镜像
  • [ ] 导出依赖列表
bash
# 导出 pip 依赖
pip freeze > requirements.txt

# 导出 conda 环境
conda env export > environment.yml

迁移后验证

  • [ ] 检查系统盘数据完整性
  • [ ] 验证环境配置正常
  • [ ] 测试 GPU 是否可用
  • [ ] 恢复数据盘数据
bash
# 验证 GPU
nvidia-smi

# 验证 Python 环境
python -c "import torch; print(torch.cuda.is_available())"

常见问题

迁移后 SSH 连接信息变化

迁移后主机地址和端口可能变化,请在控制台获取新的连接信息。

迁移后数据丢失

  • 系统盘数据通常会保留
  • 数据盘数据需要手动迁移
  • 建议迁移前做好备份

迁移时间过长

  • 数据量大时迁移需要更多时间
  • 可以先清理不必要的文件
  • 联系客服了解迁移进度

目标地区无可用资源

  • 尝试选择其他时段
  • 选择其他 GPU 型号
  • 联系客服预约资源

智算无疆 川流不息