Dockerfile 定制鏡像
概述
Dockerfile 是一個文本文件,其內(nèi)包含了一條條的 指令(Instruction),每一條指令構(gòu)建一層,因此每一條指令的內(nèi)容,就是描述該層應(yīng)當(dāng)如何構(gòu)建。
以之前的 Nginx 鏡像為例,這次我們使用 Dockerfile 來定制。在一個空白目錄中,建立一個文本文件,并命名為 Dockerfile
mkdir mynginx
cd mynginx
touch Dockerfile
其內(nèi)容為:
FROM nginx
RUN echo '<h1>Hello, Docker!</h1>' > /usr/share/nginx/html/index.html
這個 Dockerfile 很簡單,一共就兩行。涉及到了兩條指令,FROM 和 RUN。
FROM 指定基礎(chǔ)鏡像
所謂定制鏡像,那一定是以一個鏡像為基礎(chǔ),在其上進(jìn)行定制。就像我們之前運(yùn)行了一個 Nginx 鏡像的容器,再進(jìn)行修改一樣,基礎(chǔ)鏡像是必須指定的。而 FROM 就是指定 基礎(chǔ)鏡像,因此一個 Dockerfile 中 FROM 是必備的指令,并且必須是第一條指令。
除了選擇現(xiàn)有鏡像為基礎(chǔ)鏡像外,Docker 還存在一個特殊的鏡像,名為 scratch。這個鏡像是虛擬的概念,并不實(shí)際存在,它表示一個空白的鏡像。
FROM scratch
如果你以 scratch 為基礎(chǔ)鏡像的話,意味著你不以任何鏡像為基礎(chǔ),接下來所寫的指令將作為鏡像第一層開始存在。
不以任何系統(tǒng)為基礎(chǔ),直接將可執(zhí)行文件復(fù)制進(jìn)鏡像的做法并不罕見,比如 swarm、coreos/etcd。對于 Linux 下靜態(tài)編譯的程序來說,并不需要有操作系統(tǒng)提供運(yùn)行時(shí)支持,所需的一切庫都已經(jīng)在可執(zhí)行文件里了,因此直接 FROM scratch 會讓鏡像體積更加小巧。使用 Go 語言 開發(fā)的應(yīng)用很多會使用這種方式來制作鏡像,這也是為什么有人認(rèn)為 Go 是特別適合容器微服務(wù)架構(gòu)語言的原因之一。
RUN 執(zhí)行命令
RUN 指令是用來執(zhí)行命令行命令的。由于命令行的強(qiáng)大能力,RUN 指令在定制鏡像時(shí)是最常用的指令之一。其格式有兩種:
-
shell 格式:
RUN <命令>,就像直接在命令行中輸入的命令一樣。剛才寫的 Dockerfile 中的RUN指令就是這種格式。
RUN echo '<h1>Hello, Docker!</h1>' > /usr/share/nginx/html/index.html
-
exec 格式:
RUN ["可執(zhí)行文件", "參數(shù)1", "參數(shù)2"],這更像是函數(shù)調(diào)用中的格式。
既然 RUN 就像 Shell 腳本一樣可以執(zhí)行命令,那么我們是否就可以像 Shell 腳本一樣把每個命令對應(yīng)一個 RUN 呢?比如這樣:
FROM debian:jessie
RUN apt-get update
RUN apt-get install -y gcc libc6-dev make
RUN wget -O redis.tar.gz "http://download.redis.io/releases/redis-3.2.5.tar.gz"
RUN mkdir -p /usr/src/redis
RUN tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1
RUN make -C /usr/src/redis
RUN make -C /usr/src/redis install
之前說過,Dockerfile 中每一個指令都會建立一層,RUN 也不例外。每一個 RUN 的行為,就和剛才我們手工建立鏡像的過程一樣:新建立一層,在其上執(zhí)行這些命令,執(zhí)行結(jié)束后,commit 這一層的修改,構(gòu)成新的鏡像。
而上面的這種寫法,創(chuàng)建了 7 層鏡像。這是完全沒有意義的,而且很多運(yùn)行時(shí)不需要的東西,都被裝進(jìn)了鏡像里,比如編譯環(huán)境、更新的軟件包等等。結(jié)果就是產(chǎn)生非常臃腫、非常多層的鏡像,不僅僅增加了構(gòu)建部署的時(shí)間,也很容易出錯。這是很多初學(xué) Docker 的人常犯的一個錯誤。
注意: Union FS 是有最大層數(shù)限制的,比如 AUFS,曾經(jīng)是最大不得超過 42 層,現(xiàn)在是不得超過 127 層。
上面的 Dockerfile 正確的寫法應(yīng)該是這樣:
FROM debian:jessie
RUN buildDeps='gcc libc6-dev make' \
&& apt-get update \
&& apt-get install -y $buildDeps \
&& wget -O redis.tar.gz "http://download.redis.io/releases/redis-3.2.5.tar.gz" \
&& mkdir -p /usr/src/redis \
&& tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1 \
&& make -C /usr/src/redis \
&& make -C /usr/src/redis install \
&& rm -rf /var/lib/apt/lists/* \
&& rm redis.tar.gz \
&& rm -r /usr/src/redis \
&& apt-get purge -y --auto-remove $buildDeps
首先,之前所有的命令只有一個目的,就是編譯、安裝 Redis 可執(zhí)行文件。因此沒有必要建立很多層,這只是一層的事情。因此,這里沒有使用很多個 RUN 對一一對應(yīng)不同的命令,而是僅僅使用一個 RUN 指令,并使用 && 將各個所需命令串聯(lián)起來。將之前的 7 層,簡化為了 1 層。在撰寫 Dockerfile 的時(shí)候,要經(jīng)常提醒自己,這并不是在寫 Shell 腳本,而是在定義每一層該如何構(gòu)建。
并且,這里為了格式化還進(jìn)行了換行。Dockerfile 支持 Shell 類的行尾添加 \ 的命令換行方式,以及行首 # 進(jìn)行注釋的格式。良好的格式,比如換行、縮進(jìn)、注釋等,會讓維護(hù)、排障更為容易,這是一個比較好的習(xí)慣。
此外,還可以看到這一組命令的最后添加了清理工作的命令,刪除了為了編譯構(gòu)建所需要的軟件,清理了所有下載、展開的文件,并且還清理了 apt 緩存文件。這是很重要的一步,我們之前說過,鏡像是多層存儲,每一層的東西并不會在下一層被刪除,會一直跟隨著鏡像。因此鏡像構(gòu)建時(shí),一定要確保每一層只添加真正需要添加的東西,任何無關(guān)的東西都應(yīng)該清理掉。
很多人初學(xué) Docker 制作出了很臃腫的鏡像的原因之一,就是忘記了每一層構(gòu)建的最后一定要清理掉無關(guān)文件。
構(gòu)建鏡像
好了,讓我們再回到之前定制的 Nginx 鏡像的 Dockerfile 來?,F(xiàn)在我們明白了這個 Dockerfile 的內(nèi)容,那么讓我們來構(gòu)建這個鏡像吧。在 Dockerfile 文件所在目錄執(zhí)行:
docker build -t nginx:v3 .
# 輸出如下
Sending build context to Docker daemon 2.048 kB
Step 1 : FROM nginx
---> e43d811ce2f4
Step 2 : RUN echo '<h1>Hello, Docker!</h1>' > /usr/share/nginx/html/index.html
---> Running in 9cdc27646c7b
---> 44aa4490ce2c
Removing intermediate container 9cdc27646c7b
Successfully built 44aa4490ce2c
從命令的輸出結(jié)果中,我們可以清晰的看到鏡像的構(gòu)建過程。在 Step 2 中,如同我們之前所說的那樣,RUN 指令啟動了一個容器 9cdc27646c7b,執(zhí)行了所要求的命令,并最后提交了這一層 44aa4490ce2c,隨后刪除了所用到的這個容器 9cdc27646c7b。
這里我們使用了 docker build 命令進(jìn)行鏡像構(gòu)建。其格式為:
docker build [選項(xiàng)] <上下文路徑/URL/->
在這里我們指定了最終鏡像的名稱 -t nginx:v3,構(gòu)建成功后,我們可以像之前運(yùn)行 nginx:v2 那樣來運(yùn)行這個鏡像,其結(jié)果會和 nginx:v2 一樣。
鏡像構(gòu)建上下文
如果注意,會看到 docker build 命令最后有一個 .。. 表示當(dāng)前目錄,而 Dockerfile 就在當(dāng)前目錄,因此不少初學(xué)者以為這個路徑是在指定 Dockerfile 所在路徑,這么理解其實(shí)是不準(zhǔn)確的。如果對應(yīng)上面的命令格式,你可能會發(fā)現(xiàn),這是在指定 上下文路徑。那么什么是上下文呢?
首先我們要理解 docker build 的工作原理。Docker 在運(yùn)行時(shí)分為 Docker 引擎(也就是服務(wù)端守護(hù)進(jìn)程)和客戶端工具。Docker 的引擎提供了一組 REST API,被稱為 Docker Remote API,而如 docker 命令這樣的客戶端工具,則是通過這組 API 與 Docker 引擎交互,從而完成各種功能。因此,雖然表面上我們好像是在本機(jī)執(zhí)行各種 docker 功能,但實(shí)際上,一切都是使用的遠(yuǎn)程調(diào)用形式在服務(wù)端(Docker 引擎)完成。也因?yàn)檫@種 C/S 設(shè)計(jì),讓我們操作遠(yuǎn)程服務(wù)器的 Docker 引擎變得輕而易舉。
當(dāng)我們進(jìn)行鏡像構(gòu)建的時(shí)候,并非所有定制都會通過 RUN 指令完成,經(jīng)常會需要將一些本地文件復(fù)制進(jìn)鏡像,比如通過 COPY 指令、ADD 指令等。而 docker build 命令構(gòu)建鏡像,其實(shí)并非在本地構(gòu)建,而是在服務(wù)端,也就是 Docker 引擎中構(gòu)建的。那么在這種客戶端/服務(wù)端的架構(gòu)中,如何才能讓服務(wù)端獲得本地文件呢?
這就引入了上下文的概念。當(dāng)構(gòu)建的時(shí)候,用戶會指定構(gòu)建鏡像上下文的路徑,docker build 命令得知這個路徑后,會將路徑下的所有內(nèi)容打包,然后上傳給 Docker 引擎。這樣 Docker 引擎收到這個上下文包后,展開就會獲得構(gòu)建鏡像所需的一切文件。
如果在 Dockerfile 中這么寫:
COPY ./package.json /app/
這并不是要復(fù)制執(zhí)行 docker build 命令所在的目錄下的 package.json,也不是復(fù)制 Dockerfile 所在目錄下的 package.json,而是復(fù)制 上下文(context) 目錄下的 package.json。
因此,COPY 這類指令中的源文件的路徑都是相對路徑。這也是初學(xué)者經(jīng)常會問的為什么 COPY ../package.json /app 或者 COPY /opt/xxxx /app 無法工作的原因,因?yàn)檫@些路徑已經(jīng)超出了上下文的范圍,Docker 引擎無法獲得這些位置的文件。如果真的需要那些文件,應(yīng)該將它們復(fù)制到上下文目錄中去。
現(xiàn)在就可以理解剛才的命令 docker build -t nginx:v3 . 中的這個 .,實(shí)際上是在指定上下文的目錄,docker build 命令會將該目錄下的內(nèi)容打包交給 Docker 引擎以幫助構(gòu)建鏡像。
如果觀察 docker build 輸出,我們其實(shí)已經(jīng)看到了這個發(fā)送上下文的過程:
docker build -t nginx:v3 .
# 輸出如下
Sending build context to Docker daemon 2.048 kB
理解構(gòu)建上下文對于鏡像構(gòu)建是很重要的,避免犯一些不應(yīng)該的錯誤。比如有些初學(xué)者在發(fā)現(xiàn) COPY /opt/xxxx /app 不工作后,于是干脆將 Dockerfile 放到了硬盤根目錄去構(gòu)建,結(jié)果發(fā)現(xiàn) docker build 執(zhí)行后,在發(fā)送一個幾十 GB 的東西,極為緩慢而且很容易構(gòu)建失敗。那是因?yàn)檫@種做法是在讓 docker build 打包整個硬盤,這顯然是使用錯誤。
一般來說,應(yīng)該會將 Dockerfile 置于一個空目錄下,或者項(xiàng)目根目錄下。如果該目錄下沒有所需文件,那么應(yīng)該把所需文件復(fù)制一份過來。如果目錄下有些東西確實(shí)不希望構(gòu)建時(shí)傳給 Docker 引擎,那么可以用 .gitignore 一樣的語法寫一個 .dockerignore,該文件是用于剔除不需要作為上下文傳遞給 Docker 引擎的。
那么為什么會有人誤以為 . 是指定 Dockerfile 所在目錄呢?這是因?yàn)樵谀J(rèn)情況下,如果不額外指定 Dockerfile 的話,會將上下文目錄下的名為 Dockerfile 的文件作為 Dockerfile。
這只是默認(rèn)行為,實(shí)際上 Dockerfile 的文件名并不要求必須為 Dockerfile,而且并不要求必須位于上下文目錄中,比如可以用 -f ../Dockerfile.php 參數(shù)指定某個文件作為 Dockerfile。
當(dāng)然,一般大家習(xí)慣性的會使用默認(rèn)的文件名 Dockerfile,以及會將其置于鏡像構(gòu)建上下文目錄中。