本文共 6706 字,大约阅读时间需要 22 分钟。
Docker是一个能把开发的应用程序自动部署到容器的开源引擎。简单说就是一个应用程序的执行容器,类似于虚拟的概念,但是与虚级化技术有所不同。 Docker 是一个开源项目,诞生于2013年初,最初是 dotCloud 公司内部的一个业余项目。它基于 Google 公司推出的 Go 语言实现。 项目后来加入了 Linux 基金会,遵从了 Apache 2.0 协议,项目代码在 GitHub 上进行维护。 Docker 项目的目标是实现轻量级的操作系统虚拟化解决方案。 Docker 的基础是 Linux 容器(LXC)等技术。 在 LXC 的基础上 Docker 进行了进一步的封装,让用户不需要去关心容器的管理,使得操作更为简便。用户操作 Docker 的容器就像操作一个快速轻量级的虚拟机一样简单。
Docker具有速度快、隔离框架、cpu/内存消耗低、快速开关机、跨云计算基础架构等特性,所以docker具有以下几个方面的优势 缩短开发周期,实现快速的交付和部署 高效的资源利用 轻松的迁移和扩展 简单的更新管理
1、 虚拟化技术需要依赖物理CPU和内存,是硬件级别;而docker构建在操作系统上,利用操作系统的containerization技术,所以docker甚至可以在虚拟上运行。 2、 虚拟化系统一般都是指操作系统镜像,比较复杂,称为“系统”;而docker开源而且轻量,成为容器,单个容器适合部署少量应用,比如不是一个redis,memcached。 3、 传统的虚拟化技术使用快照来保存状态;而docker在保存状态上不仅更为轻便和地成本,而且引入类似源代码的管理机制,将容器的快照历史版本--记录,切换成本降低。 4、 传统的虚拟化技术在构建系统的时候较为复杂,需要大量的人力;而docker可以通过Dockerfile来构建整个容器,重启和构建速度很快。更重要的是Dockfile可以手动编写,这样应用程序开发人员可以通过发布Dockerfile来知道系统环境和依赖,这样对于持续交付十分有利。 5、 Dockfile可以基于已经构建好的容器镜像,创建新容器。Dockfile可以通过社区分享和下载,有利于该技术的推广;
特性 | 容器 | 虚拟机 |
---|---|---|
启动 | 秒级 | 分钟级 |
硬盘使用 | 一般为 MB | 一般为 GB |
性能 | 接近原生 | 弱于 |
系统支持量 | 单机支持上千个容器 | 一般几十个 |
1、 文件系统隔离:每个进程容器运行在完全独立的根文件系统里;2、 资源隔离:可以使用cgroup为每个进程容器分配不同的系统资源,例如CPU和内存;3、 网络隔离:每个进程容器运行在自己的网络命名空间里,拥有自己的虚拟接口和ip地址;4、 写时复制:采用写时复制方式创建根文件系统,这让部署变得极其快捷,并且节省内存和硬盘空间。5、 日志记录:Docker将会收集和记录每个进程容器的标准流(stdout/stderr/stdin),用于实时检索或批量检索。6、 变更管理:容器文件系统的变更可以提交到新的映像中,并可重复使用以创建更多的容器。无需使用模板或手动配置。7、 交互式shell:Docker可以分配一个虚拟终端并管理到任何容器的标准输入上,例如运行一个一次×××互shell。
Docker底层的核心技术包括linux的名称空间(Namespaces)、控制组cgroups(Control group)、AUFS高级Union文件系统(Adanced Union file systems)和容器格式(Container format) 传动的虚拟主机通过在宿主主机上运行Hypervisor来模拟一整套完整的硬件环境提供给虚拟机的操作系统。虚拟系统看到的环境是可限制的,也是彼此隔离的。这种直接的做大实现了对资源最完整的封装,但很多时候往往意味着系统资源的浪费。例如,以宿主机和虚拟机系统都为linux系统为例,虚拟机中运行的应用其实可以利用宿主机系统中的运行环境。 在操作系统中,包括内核、文件系统、网络、PID、UID、IPC、内存、硬盘、CPU等等,所有的资源都是应用进程直接共享的。要想实现虚拟化,除了要实现对内存、CPU、网络IO、磁盘IO、存储空间等限制外,还要实现文件西戎、网络、PID、UID、IPC等等的相互隔离。前者相对容易实现一些,后者则需要宿主机系统的深入支持。 而让进程中个进程彼此隔离,互相之间公用一个内核,且彼此看不到对方,都只以为只有自己存在,这种机制就是容器(container)。利用名称空间来做权限隔离控制,利用cgroups来做资源分配;
Docker采用了C/S架构,包括客户端和服务端。Dockerer daemon 作为服务端接受来自客户的请求,并处理这些请求(创建、运行、分发容器)。客户端和服务端可以运行在一个容器上,也可以通过socket或者RESTful API来进行通信; Docker daemon 一般在宿主机主机后台运行,等待接收来自客户端的消息。Docker客户端则为用户提供一系列可执行命令,用户用这些命令实现Docker daemon交互;
名称空间是linux内核一个强大的功能特性,每个容器都有自己独立的名称空间,运行在其中的应用都想在独立的操作系统中运行一样。名称空间保证容器之间彼此互相不影响;使用户创建的进程与系统分离得3更加彻底,从而不需要使用更多的底层虚拟化技术; PID Namespace(linux 2.6.24):PID名称空间 进程PID隔离; Network Namespace(linux 2.6.29):网络名称空间 网络设备、网络栈、端口等网络资源隔离 User Namespace (linux 3.8):用户名称空间 用户和用户组资源隔离 IPC Namespace(linux2.6.19): 进程间通信名称空间 进程间通信 信号量、消息队列和共享内存的隔离; UTS Namespace(linux 2.6.19):主机名和域名的隔离 mount Namespace(linux 2.4.19):挂载点(文件系统)隔离;
Cgroups是实现IaaS虚拟化(kvm、lxc等),PaaS容器沙箱(Docker等)的资源管理控制部分的底层基础cgroup :linux contor group 控制组 liunx2.6.24 收录至内核内核级别: 限制、控制与一个进程组群的资源。 限制每一个用户空间进行最大使用cpu的几个核心, 内存级也可以限制;需要限制的资源:CPU、内存、IO
resource limitation :资源限制; prioritization :优先级控制; Accounting:审计和统计, 主要为计费; control:挂起进程,恢复进程;lssubsys -m /sys/fs/cgroup 单根树状结构
blkio:设定块设备的IO限制; cpu:使用调度程序为cgroup任务提供cpu的访问,设定cpu限制; cpuacct:报告cgroup中所使用的cpu资源; cpuset:为cgroup中任务分配cpu和内存资源; memory:设置每个cgroup的内存限制以及产生内存资源报告; devices:控制cgroup中任务对设备的访问; freezer:用于挂起或恢复cgroup中的任务; net_cls:(classld),使用等级级别标识来标记网络数据包,以实现基于tc(traffic control)完成对不同cgroup中的产生流量控制 perf_event: 增加了对每group的监测跟踪的能力,即可以监测属于某个特定的group的所有线程以及运行在特定CPU上的线程,此功能对于监测整个group非常有用 hugetlb: 对hugeTLB系统进行限制; 转换后缓冲
task(任务):进程或线程 cgroup:一个独立的资源控制单位,可以包含一个或多个子系统; subsystem:子系统, cgroups中的subsystem就是一个资源调度控制器(Resource Controller)。比如CPU子系统可以控制CPU时间分配,内存子系统可以限制cgroup内存使用量。 hierarchy:层级树 hierarchy由一系列cgroup以一个树状结构排列而成,每个hierarchy通过绑定对应的subsystem进行资源调度。hierarchy中的cgroup节点可以包含零或多个子节点,子节点继承父节点的属性。整个系统可以有多个hierarchy。
联合文件系统(Union FS),一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下; 联合文件系统是docker镜像的基础。镜像可以通过分层来进程继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像; 另外,不同的docker容器可以共享一些基础的文件系统层,同时再加上自己独有的改动层,大大提高了存储的效率; AUFS (Adanced UFS);支持位每一个成员目录(类似Git的分支)设定只读(readonly)、读写(readwrite)和写出(whiteout-able)权限,。同时AUFS里有一个类似分层的概念,对只读权限的分支可以逻辑上进行增量的修改(不影响支部部分的)。 Docker目前支持的联合文件系统种类包括AUFS、btrfs、vfs和deviceMapper;API:clone(),setns().unshare(); 系统调用接口 clone():实现线程的系统调用,用来创建新线程。 setns(): 使进程脱离某个Namespace关联到一个新的Namespace unshare() 将某个进程加入到某个Namespace中;
镜像:docker image 仓库 repository 公共仓库:docker hub/registry 私有仓库:docker registry容器 docker container:连接 docker link(net)数据卷docker volune
镜像:docker image:镜像文件,只读的;用来创建container;一个镜像可以运行多个container;镜像文件可以通过dockerfile文件创建,也可以从docker hub/registry 下载;docker images:查看镜像列表docker search:在docker hub中搜索镜像镜像命令: images、search、pull 、push 、login、 logout、commit、build、rmi创建镜像:commit,build cimmit:根据已有的镜像新的变化创建新的镜像 build:根据dockerfile创建;删除本地镜像:rmi示例: docker images docker search centos docker pull centos 上传镜像到docker hub docker login 登录至docker hub docker tag busybox:new yasinl/busybox:new docker push yasinl/busybox 上传成功根据已有镜像创建新的镜像[root@node ~]# docker psCONTAINER ID IMAGE COMMAND CREATED TATUS PORTS NAMES035229e8d264 busybox:new "/bin/sh" 3 seconds ago Up 2 seconds busybox [root@node ~]# docker commit busybox busybox1:new1sha256:058635d9491c913ae1572aa07f9211b7ae2cd91670514219c55e62a669190c2f
独立运行的一个或一组应用,以及它们运行的环境; 命令: run、kill、stop、start、restart、logs、xmport、import; logs命令:获取一个容器的日志,获取其输出的信息;acttah命令:附加至一个运行中的容器; run 命令 docker run [OPTIONS] IMAGE [COMMAND] [ARG...] --name: Assign a name to the container 给容器分配一个名称 -i, --interactive=false Keep STDIN open even if not attached 开启交互式模式 -t, --tty=false Allocate a pseudo-TTY #是否打开并关联到一个为终端 --net=default Set the Network for the container 设置网络的容器默认关联到docker0网桥 示例: 运行一个容器: [root@node ~]# docker run -it --name busybox busybox:new /bin/sh docker kill busbox #杀次一个运行中的容器 docker stop busybox #停止一个运行中的容器 docker rm busybox #删除一个已停止容器;启动方法: 两种方法:通过镜像创建一个新的容器; 启动一个处于停止状态的容器;启动步骤: 检查本地是否存在指定的镜像,不存在则从registry下载; 利用镜像启动容器; 分配一个文件系统,并且在只读的镜像层之外挂载一个可读可写层; 从宿主机配置的网桥接口中桥接一个虚拟接口给此容器; 从地址池分配一个地址给容器; 执行用户指定的应用程序; 程序执行完成后,容器即终止;
仓库 repository :具有某种功能的镜像的所有相关版本构成的集合; 公共仓库:docker hub/registry 私有仓库:docker registry registry:保存docker镜像及镜像的所有相关版本构成的集合;
数据卷是供一个或多个容器使用的文件或目录,有多种特性: 可以共享于多个容器之间; 对数据卷的修改会立即生效; 对数据卷的更新与镜像无关; 数据卷会一直存在;
转载于:https://blog.51cto.com/lxlxlx/2356230