Docker 基础命令介绍和常见报错解决

介绍一些 docker 可能用到的基础命令,并解决三个常见报错:

  • 权限被拒绝(Permission Denied)
  • 无法连接到 Docker 仓库(Timeout Exceeded)
  • 磁盘空间不足(No Space Left on Device)

命令以适用于深度学习的 dl 镜像为例进行演示。

Docker 安装见《用两行命令快速搭建深度学习环境(Docker/torch2.5.1+cu118/命令行美化+插件),包含完整的 Docker 安装步骤》

文章目录

  • 镜像管理
    • 查看本地镜像
    • 拉取镜像
    • 删除镜像
  • 创建容器
    • 挂载
    • 在容器中启动 Jupyter Lab
  • 停止容器
    • 在容器终端内
    • 从主机停止容器
  • 重新连接到已存在的容器
    • 查看所有容器
    • 启动已停止的容器
    • 重新连接到运行中的容器
  • 命名容器
    • 使用 `--name` 参数
    • 使用容器名称的命令示例
  • 复制文件
    • 从主机复制文件到容器
    • 从容器复制文件到主机
  • 删除容器
    • 删除指定的容器
    • 删除所有未使用的容器
  • 解决常见报错
    • 报错 1:权限被拒绝(Permission Denied)
      • 方法 1:使用 `sudo`
      • 方法 2:将用户添加到 `docker` 用户组
    • 报错 2:无法连接到 Docker 仓库(Timeout Exceeded)
      • 方法一:配置镜像
      • 方法二:设置 HTTP/HTTPS 代理
    • 报错 3: 磁盘空间不足(No Space Left on Device)
      • 更改 Docker 的数据目录
  • 参考链接

镜像管理

写在前面

如果不想每次运行都使用 sudo 开头,使用以下命令:

sudo groupadd docker
sudo usermod -aG docker $USER
newgrp docker

查看本地镜像

docker images

列出本地所有的 Docker 镜像,包括仓库名、标签、镜像 ID、创建时间和大小。

image-20241112223609346

拉取镜像

docker pull <image_name>:<tag>

例如:

docker pull hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel

docker pull 可以更新镜像,此时下载数据量较小,不严谨地类比为 git pull 进行理解。

删除镜像

docker rmi <image_id_or_name>

注意: 删除镜像前,确保没有容器正在使用它。

创建容器

以当前使用的命令为例:

docker run --gpus all -it hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel

先来解释一下 --gpus all-it 的作用:

  • --gpus all:允许容器使用主机的所有 GPU 资源。
  • -it:这是两个参数的组合,-i 表示“交互式”(interactive),-t 表示为容器分配一个伪终端(pseudo-TTY)。-it 组合使用可以获得完整的交互式终端体验。

使用 docker run --help 可以查看更多参数的用法。

如果在执行 Docker 命令时遇到权限问题,可以在命令前加上 sudo

挂载

如果需要在容器内访问主机的文件,可以使用 -v 参数。

  1. 卷挂载

    docker run --gpus all -it -v my_volume:container_path hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel
    
    • my_volume:Docker 卷的名称。
    • container_path:容器中的路径。

    这样,保存在该路径的数据在容器删除后仍会保存在 my_volume 中。

  2. 绑定主机目录到容器中

    docker run --gpus all -it -v /home/your_username/data:/workspace/data hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel
    
    • /home/your_username/data:主机上的目录路径。
    • /workspace/data:容器内的挂载点。

在容器中启动 Jupyter Lab

如果需要在容器内启动 Jupyter Lab,并通过主机的浏览器进行访问,可以使用 -p 参数映射端口。Jupyter Lab 默认使用 8888 端口,使用以下命令:

docker run --gpus all -it -p 8888:8888 hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel
  • -p 8888:8888 将容器内的 8888 端口映射到主机的 8888 端口。

然后在容器内运行:

jupyter lab --ip=0.0.0.0 --port=8888 --no-browser --allow-root

现在可以在主机浏览器中访问 http://localhost:8888

停止容器

在容器终端内

  • 使用 Ctrl+D 或输入 exit:退出并停止容器(适用于通过 docker run 启动的情况)。
  • 使用 Ctrl+P 然后 Ctrl+Q:仅退出容器的终端(detach),让容器继续在后台运行。

以上的“停止”行为适用于通过 docker run 启动的容器。如果容器是通过 docker start 启动的,Ctrl+Dexit 只会退出终端,而不会停止容器。通过 docker ps 可以察觉到这一点。

从主机停止容器

如果你想从主机停止正在运行的容器,可以使用:

docker stop <container_id_or_name>

替换 <container_id_or_name> 为容器的 ID 或名称。

重新连接到已存在的容器

在使用一段时间后,你可能会发现每次使用 docker run 去“运行”容器时,之前所做的改变都“没有”保存。

这是因为每次运行 docker run 创建了新的容器。

要找回在容器中的更改,需要重新连接到之前创建的容器。

查看所有容器

docker ps -a
  • docker ps:默认只显示正在运行的容器。
  • -a:显示所有容器,包括已停止的。

启动已停止的容器

如果目标容器已停止,可以使用以下命令将其重新启动:

docker start <container_id_or_name>

替换 <container_id_or_name> 为容器的 ID 或名称。

重新连接到运行中的容器

使用 docker exec

docker exec -it <container_id_or_name> /bin/bash
  • /bin/bash:在容器内启动一个 Bash Shell。
  • docker run 命令末尾也可添加 /bin/bash

在之前的命令中,我们使用了 /bin/zsh,这是因为该容器中已安装了 zsh。而在大多数容器中,默认的行为通常是 /bin/bash/bin/sh

命名容器

有没有什么方法可以指定名称呢?每次通过 docker ps -a 复制 id 太不优雅了。

使用 --name 参数

在创建容器时,可以使用 --name 参数为容器指定一个名称。例如:

docker run --gpus all -it --name ai hoperj/quickstart:dl-torch2.5.1-cuda11.8-cudnn9-devel

容器被命名为 ai,以后可通过该名称管理容器,不需要记住容器的 ID。

运行 docker ps -a

image-20241112215358397

使用容器名称的命令示例

  • 启动容器:

    docker start ai
    
  • 停止容器:

    docker stop ai
    
  • 重新连接到容器:

    docker exec -it ai /bin/bash
    

复制文件

从主机复制文件到容器

docker cp /path/on/host <container_id_or_name>:/path/in/container

从容器复制文件到主机

docker cp <container_id_or_name>:/path/in/container /path/on/host

删除容器

删除指定的容器

如果想删除一个容器,可以使用 docker rm 命令:

docker rm <container_id_or_name>

例如,删除名为 ai 的容器:

docker rm ai

注意: 需要先停止容器才能删除。

删除所有未使用的容器

我们可以使用以下命令来删除所有处于“已退出”状态的容器:

docker container prune

这将删除所有已停止的容器(请谨慎使用,因为删除后无法恢复,适用于刚安装 Docker “不小心”创建了一堆容器)。

解决常见报错

介绍在新环境中使用 Docker 时,可能会遇到的报错。

推荐阅读,特别是报错 2

报错 1:权限被拒绝(Permission Denied)

当运行命令:

docker ps

可能会遇到以下报错:

permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get “http://%2Fvar%2Frun%2Fdocker.sock/v1.45/containers/json”: dial unix /var/run/docker.sock: connect: permission denied

解决方法

方法 1:使用 sudo

在 Docker 命令前加上 sudo

sudo docker ps

方法 2:将用户添加到 docker 用户组

  1. 创建 docker 用户组

    sudo groupadd docker
    
  2. 将当前用户添加到 docker

    sudo usermod -aG docker $USER
    
  3. 重新加载用户组设置

    newgrp docker
    
  4. 验证

    运行 Docker 命令,如果不提示权限错误(permission denied),说明配置成功。

    docker ps	
    

报错 2:无法连接到 Docker 仓库(Timeout Exceeded)

Error response from daemon: Get “https://registry-1.docker.io/v2/”: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)

原因: 由于国内网络限制,无法直接连接到 Docker Hub。

解决方法

方法一:配置镜像

镜像参考:目前国内可用Docker镜像源汇总(截至2024年11月)

临时使用

直接在原 <image_name>:<tag> 前增加网址,比如:

docker pull dockerpull.org/<image_name>:<tag>

快速测试可用性:

docker pull dockerpull.org/hello-world

永久使用

运行以下命令配置文件,如果有一天突然拉(pull)不动了,说明链接挂了需要更新。

# 创建目录
sudo mkdir -p /etc/docker# 写入配置文件
sudo tee /etc/docker/daemon.json > /dev/null <<-'EOF'
{"registry-mirrors": ["https://docker.unsee.tech","https://dockerpull.org","https://docker.1panel.live","https://dockerhub.icu"]
}
EOF# 重启 Docker 服务
sudo systemctl daemon-reload
sudo systemctl restart docker

方法二:设置 HTTP/HTTPS 代理

这一项提供给🪜科学上网的同学进行配置。对于本项目来说,所有文件都会提供网盘链接和对应的国内镜像命令。

  1. 创建并编辑 Docker 的系统服务配置文件

    sudo mkdir -p /etc/systemd/system/docker.service.d
    sudo vim /etc/systemd/system/docker.service.d/http-proxy.conf
    
  2. 添加代理配置

    http-proxy.conf 文件中添加以下内容(将 http://localhost:7890/ 替换为你自己的代理地址):

    [Service]
    Environment="HTTP_PROXY=http://localhost:7890/"
    Environment="HTTPS_PROXY=http://localhost:7890/"
    

    使用 ESC + :wq 回车保存配置。

    如果不熟悉 vim 的操作,也可以使用直接运行(将 http://localhost:7890/ 替换为你自己的代理地址):

    sudo tee /etc/systemd/system/docker.service.d/http-proxy.conf > /dev/null <<EOF
    [Service]
    Environment="HTTP_PROXY=http://localhost:7890/"
    Environment="HTTPS_PROXY=http://localhost:7890/"
    EOF
    
  3. 重新加载配置并重启 Docker 服务

    sudo systemctl daemon-reload
    sudo systemctl restart docker
    

报错 3: 磁盘空间不足(No Space Left on Device)

write /var/lib/docker/tmp/…: no space left on device

原因: Docker 默认使用 /var/lib/docker 作为数据存储目录,如果该分区空间不足,就会出现此错误。

解决方法:

更改 Docker 的数据目录

  1. 查看当前的磁盘空间

    检查 /var/lib/docker 所在分区的剩余空间:

    sudo df -h /var/lib/docker
    

    image-20241113155339843

    2.3G 显然不够。

  2. 选择具有足够空间的目录

    假设将 Docker 的数据目录移动到 ~/Downloads 下,先看看剩余空间:

    image-20241112100834923

    显示还有 53G,绰绰有余,接着创建文件夹:

    mkdir -p ~/Downloads/Docker && cd ~/Downloads/Docker && pwd
    

    image-20241112105217964

    复制输出。

  3. 修改 Docker 的配置文件

    编辑 /etc/docker/daemon.json 文件(如果不存在会自动创建):

    sudo vim /etc/docker/daemon.json
    

    添加或修改以下内容(将 Path/to/Docker 替换为你的新数据目录的绝对路径,也就是刚刚复制的输出):

    { "data-root": "Path/to/Docker"
    }
    

    ESC + :wq保存并退出。

    image-20241113195541233

  4. 重启 Docker 服务并验证

    sudo systemctl restart docker
    docker info -f '{{ .DockerRootDir}}'
    

    输出image-20241112101614536

参考链接

How to Fix Docker’s No Space Left on Device Error

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/15584.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误

【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误 目录 文章目录 【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误目录摘要研究背景问题与挑战如何解决创新点算法模型1. 错误检测模型2. 伪数据生成模块3. n-gram语言模型过滤4. 多任…

前端(2)——快速入门CSS

参考&#xff1a; 罗大富 CSS 参考手册 | 菜鸟教程 CSS 参考手册 1. CSS CSS全名是层叠样式表&#xff0c;中文名层叠样式表。用于定义网页样式和布局的样式表语言。 通过 CSS&#xff0c;你可以指定页面中各个元素的颜色、字体、大小、间距、边框、背景等样式&#xff0c;…

电阻测试流程

1.外观检查 &#xff08;1&#xff09;样品上丝印与规格书中相符&#xff0c;0402以上封装电阻要有标称电阻值&#xff0c;丝印清晰。 &#xff08;2&#xff09;检验外观&#xff0c;主要包含以下几点&#xff1a; a) 电阻器本体饱满&#xff0c;有光泽&#xff0c;不允许有气…

万博智云产品完成与ZStack Cloud云平台兼容性互认证

摘要 近日&#xff0c;上海云轴科技股份有限公司(简称“云轴科技ZStack”)与万博智云信息科技&#xff08;上海&#xff09;有限公司&#xff08;简称“万博智云OnePro Cloud”&#xff09;完成产品兼容性互认证。经过测试&#xff0c;万博智云OnePro Cloud两款旗舰产品HyperB…

深度学习框架Pytorch介绍和示例

目录 一. 简介 1.1动态计算图 1.2自动化功能 二. 主要特性 2.1 动态计算图 2.2 自动求导 2.3 强大的社区支持 2.4 多平台支持 三. 核心组件 3.1 Tensor 3.2 Autograd 3.3 nn.Module 3.4 Optim 四. 数据处理 五. 神经网络定义与训练 5.1定义神经网络&#xff1a; 5.2训练过…

鼠标点击(二)与接口函数集合的的实现

&#xff08;1&#xff09; &#xff08;2&#xff09; &#xff08;3&#xff09;

基于Spring Boot+Vue的多媒体素材管理系统的设计与实现

一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构&#xff1a;B/S架构 运行环境&#xff1a;win10/win11、jdk17 前端&#xff1a; 技术&#xff1a;框架Vue.js&#xff1b;UI库&#xff1a;ElementUI&#xff1b; 开发工具&…

《FreeRTOS列表和列表项篇》

FreeRTOS列表和列表项 1. 什么是列表和列表项&#xff1f;1.1 列表list1.2 列表项list item 2. 列表和列表项的初始化2.1 列表的初始化2.2 列表项的初始化 3. 列表项的插入4. 列表项末尾插入5. 列表项的删除6. 列表的遍历 列表和列表项是FreeRTOS的一个数据结构&#xff0c;是F…

使用 MTT GPU 搭建个人 RAG 推理服务

什么是 LLM RAG?​ LLM RAG&#xff08;Retrieval-Augmented Generation with Large Language Models&#xff09;是一种结合大语言模型&#xff08;LLM&#xff09;和信息检索&#xff08;IR&#xff09;技术的生成方法&#xff0c;专门用于增强语言模型的上下文感知和准确性…

Vue3 -- 环境变量的配置【项目集成3】

环境&#xff1a; 在项目开发过程中&#xff0c;至少会经历开发环境、测试环境和生产环境(即正式环境)三个阶段。 开发环境 .env.development测试环境 .env.test生产环境 .env.production 不同阶段请求的状态(如接口地址等)不一样&#xff0c;开发项目的时候要经常配置代理跨…

AI 大模型应用:AI开发的捷径工作流模式

一、引言 大部分人使用 AI&#xff0c;大概都跟我一样&#xff0c;停留在初级阶段。 平时&#xff0c;就是向 AI 提问&#xff08;又称聊天&#xff09;&#xff0c;偶尔也用一些现成的服务&#xff1a;生成图片、生成代码、翻译文章等等。 但是&#xff0c;时间久了&#x…

研究生被安排许多文献阅读,如何快速的阅读众多英文文献?

在科研的道路上&#xff0c;筛选文献就像是大海捞针&#xff0c;找对了方法&#xff0c;就能快速锁定那些有价值的信息。尤其是在实验方向尚未确定时&#xff0c;如何从海量文献中筛选出“金子”&#xff0c;就显得尤为重要。 关键的第一步&#xff1a;精准筛选 当你面对一堆…

信创迎来冲刺三年,国产项目管理软件跑出数智化“加速度”

信创发展是国家当前重要的战略布局&#xff0c;对国家发展具有长远的战略意义。国资委信创79号文件规定&#xff0c;2027年前按顺序完成“28N”的党政与八大重点行业100%信创替代&#xff0c;通过信创产业发展&#xff0c;国家能够提高自主创新能力&#xff0c;加速推进国产化转…

LSTM(长短期记忆网络)详解

1️⃣ LSTM介绍 标准的RNN存在梯度消失和梯度爆炸问题&#xff0c;无法捕捉长期依赖关系。那么如何理解这个长期依赖关系呢&#xff1f; 例如&#xff0c;有一个语言模型基于先前的词来预测下一个词&#xff0c;我们有一句话 “the clouds are in the sky”&#xff0c;基于&…

基于Java仓库管理系统

一、作品包含 源码数据库全套环境和工具资源部署教程 二、项目技术 前端技术&#xff1a;Html、Css、Js、LayUI 数据库&#xff1a;MySQL 后端技术&#xff1a;Java、Spring Boot、MyBatis 三、运行环境 开发工具&#xff1a;IDEA 数据库&#xff1a;MySQL8.0 数据库管…

数量关系2_余数平方等差、整除和完工

目录 一、余数、平方数与等差数列1.等差数列2.平方数3.余数问题二、整除问题和合作完工问题1.利用倍数特性解决不定方程2.利用整除特性解决纯整除问题3.合作完工一、余数、平方数与等差数列 1.等差数列 ※等比数列不常考,或者考的时候比较复杂,可放弃。 补充1:常用的等差数…

cache中命中率和缺失率

这张图解释了缓存的三个关键指标&#xff1a;命中率、缺失率和缺失损失&#xff0c;并分析了它们在缓存访问中的重要性。 具体说明 命中&#xff08;Hit&#xff09;&#xff1a; 命中表示要访问的信息在缓存中已经存在&#xff0c;不需要从更慢的主存中读取。命中率&#xff…

Jmeter查看结果树之查看响应的13种详解方法

软件测试资料领取&#xff1a;[内部资源] 想拿年薪40W的软件测试人员&#xff0c;这份资料必须领取~ 软件测试面试刷题工具&#xff1a;软件测试面试刷题【800道面试题答案免费刷】 Jmeter查看结果树查看响应有哪几种方法&#xff0c;可通过左侧面板底部的下拉框选择: 01 Te…

<Project-23 Navigator Portal> Python flask web 网站导航应用 可编辑界面:添加图片、URL、描述、位置移动

目的&#xff1a; 浏览器的地址簿太厚&#xff0c;如下图&#xff1a; 开始&#xff0c;想给每个 Web 应用加 icon 来提高辨识度&#xff0c;发现很麻烦&#xff1a;create image, resize, 还要挑来挑去&#xff0c;重复性地添加代码。再看着这些密密麻麻的含有重复与有规则的…

文心一言 VS 讯飞星火 VS chatgpt (391)-- 算法导论25.1 5题

五、说明如何将单源最短路径问题表示为矩阵和向量的乘积&#xff0c;并解释该乘积的计算过程如何对应 Bellman-Ford 算法&#xff1f;(请参阅24.1节。)。如果要写代码&#xff0c;请用go语言。 文心一言&#xff1a; 在解决单源最短路径问题时&#xff0c;我们可以将问题表示…