Skip to content

Linux 基础命令

本文介绍在智川云平台训练模型时常用的 Linux 命令,适用于 Ubuntu 系统。

文件操作

列出文件

bash
# 列出当前目录内容
ls

# 显示详细信息(权限、所有者、时间等)
ls -l

# 显示隐藏文件
ls -la

目录操作

bash
# 创建目录
mkdir my_project

# 创建多级目录
mkdir -p data/train/images

# 切换目录
cd /root/rivermind-data

# 返回上级目录
cd ..

# 查看当前路径
pwd

移动和重命名

bash
# 重命名文件/文件夹
mv old_name new_name

# 移动文件到目录
mv file.py /root/rivermind-data/

复制

bash
# 复制文件
cp file.py backup.py

# 递归复制文件夹
cp -r project/ project_backup/

删除

bash
# 删除文件
rm file.py

# 递归删除文件夹
rm -rf directory/

# 删除目录下所有内容
rm -rf directory/*

警告

rm -rf 命令会永久删除文件且无法恢复,请谨慎使用。

压缩与解压

ZIP 格式

bash
# 压缩
zip -r archive.zip folder/

# 解压
unzip archive.zip

# 解压到指定目录
unzip archive.zip -d /target/path/

TAR 格式

bash
# 压缩为 .tar.gz
tar czf archive.tar.gz folder/

# 解压 .tar.gz
tar xzf archive.tar.gz

# 压缩为 .tar.bz2(压缩率更高)
tar cjf archive.tar.bz2 folder/

# 解压 .tar.bz2
tar xjf archive.tar.bz2

环境变量

bash
# 临时设置环境变量
export PATH=/path/to/bin:$PATH

# 设置动态链接库路径
export LD_LIBRARY_PATH=/path/to/lib:$LD_LIBRARY_PATH

# 永久生效(写入配置文件)
echo 'export PATH=/path/to/bin:$PATH' >> ~/.bashrc

# 使配置立即生效
source ~/.bashrc

GPU 监控

查看 GPU 状态

bash
nvidia-smi

输出说明:

  • Memory-Usage:显存占用情况
  • GPU-Util:GPU 使用率
  • Processes:正在使用 GPU 的进程

实时监控

bash
# 每秒刷新一次
watch -n 1 nvidia-smi

# 或使用 nvidia-smi 自带的循环
nvidia-smi -l 1

进程管理

查看进程

bash
# 查看所有进程
ps -ef

# 查找特定进程
ps -ef | grep python

# 实时查看 CPU 和内存占用
top

# 更友好的进程查看工具
htop

终止进程

bash
# 终止指定 PID 的进程
kill -9 PID

# 终止所有 python 进程
pkill -9 python

日志重定向

bash
# 将输出重定向到文件
python train.py > train.log 2>&1

# 后台运行并重定向
python train.py > train.log 2>&1 &

# 实时查看日志
tail -f train.log

# 查看日志最后 100 行
tail -n 100 train.log

常见场景

显存未释放

bash
# 查找占用 GPU 的进程
nvidia-smi

# 或者
ps -ef | grep python

# 终止进程
kill -9 PID

查看磁盘使用

bash
# 查看磁盘空间
df -h

# 查看当前目录大小
du -sh .

# 查看子目录大小
du -sh */

查看文件内容

bash
# 查看完整文件
cat file.txt

# 查看文件前 10 行
head -n 10 file.txt

# 查看文件后 10 行
tail -n 10 file.txt

# 实时查看文件更新
tail -f file.txt

智算无疆 川流不息