Linux 基础命令
本文介绍在智川云平台训练模型时常用的 Linux 命令,适用于 Ubuntu 系统。
文件操作
列出文件
bash
# 列出当前目录内容
ls
# 显示详细信息(权限、所有者、时间等)
ls -l
# 显示隐藏文件
ls -la目录操作
bash
# 创建目录
mkdir my_project
# 创建多级目录
mkdir -p data/train/images
# 切换目录
cd /root/rivermind-data
# 返回上级目录
cd ..
# 查看当前路径
pwd移动和重命名
bash
# 重命名文件/文件夹
mv old_name new_name
# 移动文件到目录
mv file.py /root/rivermind-data/复制
bash
# 复制文件
cp file.py backup.py
# 递归复制文件夹
cp -r project/ project_backup/删除
bash
# 删除文件
rm file.py
# 递归删除文件夹
rm -rf directory/
# 删除目录下所有内容
rm -rf directory/*警告
rm -rf 命令会永久删除文件且无法恢复,请谨慎使用。
压缩与解压
ZIP 格式
bash
# 压缩
zip -r archive.zip folder/
# 解压
unzip archive.zip
# 解压到指定目录
unzip archive.zip -d /target/path/TAR 格式
bash
# 压缩为 .tar.gz
tar czf archive.tar.gz folder/
# 解压 .tar.gz
tar xzf archive.tar.gz
# 压缩为 .tar.bz2(压缩率更高)
tar cjf archive.tar.bz2 folder/
# 解压 .tar.bz2
tar xjf archive.tar.bz2环境变量
bash
# 临时设置环境变量
export PATH=/path/to/bin:$PATH
# 设置动态链接库路径
export LD_LIBRARY_PATH=/path/to/lib:$LD_LIBRARY_PATH
# 永久生效(写入配置文件)
echo 'export PATH=/path/to/bin:$PATH' >> ~/.bashrc
# 使配置立即生效
source ~/.bashrcGPU 监控
查看 GPU 状态
bash
nvidia-smi输出说明:
- Memory-Usage:显存占用情况
- GPU-Util:GPU 使用率
- Processes:正在使用 GPU 的进程
实时监控
bash
# 每秒刷新一次
watch -n 1 nvidia-smi
# 或使用 nvidia-smi 自带的循环
nvidia-smi -l 1进程管理
查看进程
bash
# 查看所有进程
ps -ef
# 查找特定进程
ps -ef | grep python
# 实时查看 CPU 和内存占用
top
# 更友好的进程查看工具
htop终止进程
bash
# 终止指定 PID 的进程
kill -9 PID
# 终止所有 python 进程
pkill -9 python日志重定向
bash
# 将输出重定向到文件
python train.py > train.log 2>&1
# 后台运行并重定向
python train.py > train.log 2>&1 &
# 实时查看日志
tail -f train.log
# 查看日志最后 100 行
tail -n 100 train.log常见场景
显存未释放
bash
# 查找占用 GPU 的进程
nvidia-smi
# 或者
ps -ef | grep python
# 终止进程
kill -9 PID查看磁盘使用
bash
# 查看磁盘空间
df -h
# 查看当前目录大小
du -sh .
# 查看子目录大小
du -sh */查看文件内容
bash
# 查看完整文件
cat file.txt
# 查看文件前 10 行
head -n 10 file.txt
# 查看文件后 10 行
tail -n 10 file.txt
# 实时查看文件更新
tail -f file.txt