前言
《使用PSSH批量管理Linux》一文中,已經(jīng)學(xué)習(xí)了使用pssh批量管理linux的技巧。而很多時候,我們需要定時執(zhí)行一些任務(wù),或者需要定時執(zhí)行一些批量任務(wù)。因此,本文就來研究一下linux設(shè)置定時任務(wù)的方法。
主要參考Linux Crontab 定時任務(wù)、Linux定時任務(wù)Crontab命令詳解 和 Linux 定時任務(wù)詳解 。
理論篇
crond簡介
cron(crond)是linux下用來周期性的執(zhí)行某種任務(wù)或等待處理某些事件的一個守護進程。linux系統(tǒng)上面原本就有非常多的計劃性工作,因此這個系統(tǒng)服務(wù)是默認啟動的。crond進程每分鐘會定期檢查是否有要執(zhí)行的任務(wù),如果有要執(zhí)行的任務(wù),則自動執(zhí)行該任務(wù)。另外,由于使用者自己也可以設(shè)置計劃任務(wù),所以,linux系統(tǒng)也提供了使用者控制計劃任務(wù)的命令:crontab命令。
crontab命令是cron table的簡寫,它是cron的配置文件,也可以叫它作業(yè)列表,我們可以在以下文件夾內(nèi)找到相關(guān)配置文件。
-
/var/spool/cron/crontabs/目錄下存放的是每個用戶包括root的crontab任務(wù),每個任務(wù)以創(chuàng)建者的名字命名。 -
/etc/crontab這個文件負責(zé)調(diào)度各種管理和維護任務(wù)。 -
/etc/cron.d/這個目錄用來存放任何要執(zhí)行的crontab文件或腳本。 - 我們還可以把腳本放在
/etc/cron.hourly、/etc/cron.daily、/etc/cron.weekly、/etc/cron.monthly目錄中,讓它每小時/天/星期/月執(zhí)行一次。
linux下的任務(wù)調(diào)度分為兩類,系統(tǒng)任務(wù)調(diào)度和用戶任務(wù)調(diào)度。
系統(tǒng)任務(wù)調(diào)度:系統(tǒng)周期性所要執(zhí)行的工作,比如寫緩存數(shù)據(jù)到硬盤、日志清理等。/etc/crontab文件就是系統(tǒng)任務(wù)調(diào)度的配置文件。
用戶任務(wù)調(diào)度:用戶定期要執(zhí)行的工作,比如用戶數(shù)據(jù)備份、定時郵件提醒等。用戶可以使用 crontab 工具來定制自己的計劃任務(wù)。所有用戶定義的crontab文件都被保存在 /var/spool/cron/crontabs/目錄中,其文件名與用戶名一致。
crontab文件
假設(shè)我們使用的是Ubuntu14.04.5 Server版,查看/etc/crontab,內(nèi)容為:
# /etc/crontab: system-wide crontab
# Unlike any other crontab you don't have to run the `crontab'
# command to install the new version when you edit this file
# and files in /etc/cron.d. These files also have username fields,
# that none of the other crontabs do.
SHELL=/bin/sh
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
# m h dom mon dow user command
17 * * * * root cd / && run-parts --report /etc/cron.hourly
25 6 * * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily )
47 6 * * 7 root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.weekly )
52 6 1 * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.monthly )
第一行SHELL變量指定了系統(tǒng)要使用哪個shell;第二行PATH變量指定了系統(tǒng)執(zhí)行 命令的路徑。
接下來的命令格式為:
m h dom mon dow user command
英文全拼為:
minute hour day month week user commond
- minute:表示分鐘,可以是從0到59之間的任何整數(shù)。
- hour:表示小時,可以是從0到23之間的任何整數(shù)。
- day:表示日期,可以是從1到31之間的任何整數(shù)。
- month:表示月份,可以是從1到12之間的任何整數(shù)。
- week:表示星期幾,可以是從0到7之間的任何整數(shù),這里的0或7代表星期日。
- user:表示用戶。
- command:要執(zhí)行的命令,可以是系統(tǒng)命令,也可以是自己編寫的腳本文件。
注意,/var/spool/cron目錄中的用戶調(diào)度任務(wù),沒有user一項,因為文件名已經(jīng)代表了user。
在以上各個字段中,還可以使用以下特殊字符:
- 星號(*):代表所有可能的值,例如month字段如果是星號,則表示在滿足其它字段的制約條件后每月都執(zhí)行該命令操作。
- 逗號(,):可以用逗號隔開的值指定一個列表范圍,例如,“1,2,5,7,8,9”
- 中杠(-):可以用整數(shù)之間的中杠表示一個整數(shù)范圍,例如“2-6”表示“2,3,4,5,6”
- 正斜線(/):可以用正斜線指定時間的間隔頻率,例如“0-23/2”表示每兩小時執(zhí)行一次。
- 同時正斜線可以和星號一起使用,例如*/10,如果用在minute字段,表示每十分鐘執(zhí)行一次。
crontab命令
crontab命令格式為:
crontab [-u username] [file] [ -e | -l | -r ]
-
-u username,指定設(shè)置某個用戶的crontab,省略則表示操作當(dāng)前用戶的crontab。 -
file,將file做為crontab的任務(wù)列表文件并載入crontab。如果沒有指定這個文件,crontab命令將接受標準輸入(鍵盤)上鍵入的命令,并將它們載入crontab。 -
-e,編輯某個用戶的crontab文件內(nèi)容。如果不指定用戶,則表示編輯當(dāng)前用戶的crontab文件。 -
-l,顯示某個用戶的crontab文件內(nèi)容,如果不指定用戶,則表示顯示當(dāng)前用戶的crontab文件內(nèi)容。 -
-r,刪除某個用戶的crontab文件,如果不指定用戶,則默認刪除當(dāng)前用戶的crontab文件。
實踐篇
設(shè)置系統(tǒng)時間
設(shè)置定時任務(wù)和時間緊密相關(guān),如果服務(wù)器的時區(qū)時間設(shè)置和本地不同,就不能保證計劃任務(wù)的正確執(zhí)行。所以使用crontab的第一步,是調(diào)節(jié)好服務(wù)器的時間。
下面參考Ubuntu 16.04將系統(tǒng)時間寫入到硬件時間BIOS,對服務(wù)器時間進行調(diào)節(jié)。
時間是有時區(qū)的,無論硬件時間還是操作系統(tǒng)時間。hwclock的時區(qū)在/etc/default/rcS文件中設(shè)置,里面有一個參數(shù)UTC,默認值為yes,表示使用UTC時區(qū),如果設(shè)置為no,那表示使用osclock的時區(qū)。建議hwclock與osclock設(shè)置相同的時區(qū),也就是no。
1、查看服務(wù)器硬件時間
sudo hwclock -r,看到的時間格式為:Wed 23 May 2018 11:02:17 AM HKT -0.031663 seconds
2、查看服務(wù)器系統(tǒng)時間
date,看到的時間格式為:Wed May 23 11:02:41 HKT 2018
3、設(shè)置hwclock和osclock時區(qū)相同
sudo vim /etc/default/rcS,找到:
UTC=yes
修改為:
UTC=no
4、將系統(tǒng)時間寫入硬件時間
sudo hwclock -w
5、修改系統(tǒng)時區(qū)
osclock的時區(qū)配置文件為/etc/timezone,不建議直接修改配置文件。
如果你想修改為CST時間,那么執(zhí)行sudo tzselect命令時,選擇Asia->China->Beijing Time即可,這時會提示使用Asia/Shanghai時區(qū)。(ubuntu和centos通用)
6、設(shè)置即刻生效
執(zhí)行date,發(fā)現(xiàn)時區(qū)沒有變化,依然是HKT。
sudo cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
sudo ntpdate time.windows.com
如果執(zhí)行ntpdate報錯:ntpdate[18409]: no server suitable for synchronization found ,那么就換一個時間同步工具。
sudo apt-get install rdate
sudo rdate -s time-b.nist.gov
再次執(zhí)行date,發(fā)現(xiàn)時區(qū)已經(jīng)變成了CST。
7、硬件時間同步
sudo hwclock -r,發(fā)現(xiàn)硬件時間落后。
sudo hwclock -w,再次把系統(tǒng)時間寫入硬件時間,同步完成。
實例
實例1:每分鐘、每小時、每天、每周、每月、每年執(zhí)行
* * * * * myCommand
0 * * * * myCommand
0 0 * * * myCommand
0 0 * * 0 myCommand
0 0 1 * * myCommand
0 0 1 1 * myCommand
實例2:每小時的第3和第15分鐘執(zhí)行
3,15 * * * * myCommand
實例3:在上午8點到11點的第3和第15分鐘執(zhí)行
3,15 8-11 * * * myCommand
實例4:每隔兩天的上午8點到11點的第3和第15分鐘執(zhí)行
3,15 8-11 */2 * * myCommand
實例5:每周一上午8點到11點的第3和第15分鐘執(zhí)行
3,15 8-11 * * 1 myCommand
實例6:每晚的21:30重啟smb
30 21 * * * /etc/init.d/smb restart
實例7:每月1、10、22日的4 : 45重啟smb
45 4 1,10,22 * * /etc/init.d/smb restart
實例8:每周六、周日的1 : 10重啟smb
10 1 * * 6,0 /etc/init.d/smb restart
實例9:每天18 : 00至23 : 00之間每隔30分鐘重啟smb
0,30 18-23 * * * /etc/init.d/smb restart
實例10:每星期六的晚上11 : 00 pm重啟smb
0 23 * * 6 /etc/init.d/smb restart
實例11:每一小時重啟smb
0 * * * * /etc/init.d/smb restart
實例12:晚上11點到早上7點之間,每隔一小時重啟smb
0 23-7/1 * * * /etc/init.d/smb restart
實例13:每月的4號與每周一到周三的11點重啟smb
0 11 4 * mon-wed /etc/init.d/smb restart
實例14:一月一號的4點重啟smb
0 4 1 jan * /etc/init.d/smb restart
實例15:每小時執(zhí)行/etc/cron.hourly目錄內(nèi)的腳本
01 * * * * root run-parts /etc/cron.hourly
run-parts這個參數(shù)了,如果去掉這個參數(shù)的話,后面就可以寫要運行的某個腳本名,而不是目錄名了。
查看ganglia的狀態(tài)
目標:每分鐘查看一下ganglia的狀態(tài),并保存到/tmp/log/ganglia目錄。
1、創(chuàng)建/tmp/log/ganglia目錄
sudo mkdir -p /tmp/log/ganglia
sudo chmod a+w /tmp/log/ganglia
2、編輯crontab
crontab -e,選擇編輯器為vim
3、在crontab文件中添加一行
* * * * * pssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +%Y%m%d-%H%M%S`.log
4、查看crontab任務(wù)
crontab -l,看到任務(wù)已經(jīng)添加成功。
5、等待了五分鐘,發(fā)現(xiàn)/tmp/log/ganglia目錄下啥也沒有。
sudo service cron status,狀態(tài)正常。
sudo /etc/init.d/cron restart,重啟cron試試。
又等待了五分鐘,發(fā)現(xiàn)/tmp/log/ganglia目錄下依然空空。
莫非是因為pssh沒有使用絕對路徑?whereis pssh,找到pssh路徑為/usr/lib/pssh,修改crontab為:
* * * * * /usr/lib/pssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +%Y%m%d-%H%M%S`.log
然而,并沒有用。
還是查看下crontab日志吧!
開啟crontab日志
以下主要參考Ubuntu下用crontab 部署定時任務(wù)。
1、編輯50-default.conf
sudo vim /etc/rsyslog.d/50-default.conf
2、把cron前的井號去掉,也就是修改為:
cron.* /var/log/cron.log
3、重啟rsyslog服務(wù)
sudo service rsyslog restart
4、重啟crontab服務(wù)
sudo service cron restart
5、查看crontab日志
less /var/log/cron.log
果然發(fā)現(xiàn)了問題:
(test) CMD (/usr/lib/pssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +)
也就是說,命令確實按時執(zhí)行了,只不過沒有執(zhí)行完,被百分號截斷了,導(dǎo)致log文件沒有正常生成!
修改crontab為:
* * * * * /usr/lib/pssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +\%Y\%m\%d-\%H\%M\%S`.log
終于,log文件成功生成,nice!但是,文件內(nèi)容是空的!因為,/usr/lib/pssh是一個目錄,不是pssh命令!真正的pssh命令是parallel-ssh,找到它的位置為/usr/bin/parallel-ssh,修改crontab:
* * * * * /usr/bin/parallel-ssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +\%Y\%m\%d-\%H\%M\%S`.log
至此,問題圓滿解決。
實際使用的時候,一天獲取一次ganglia的狀態(tài)就夠了,所以crontab改成:
0 0 * * * /usr/bin/parallel-ssh -h /home/test/hosts.txt -t 30 -i 'ps aux | grep gmond' > /tmp/log/ganglia/ganglia-`date +\%Y\%m\%d`.log
定時執(zhí)行腳本
以上,每天執(zhí)行一次定時任務(wù),抓取ganglia的運行狀態(tài)保存到日志文件中。緊接著,我們的目標是使用腳本檢查當(dāng)天的日志文件,如果發(fā)現(xiàn)ganglia運行異常,則產(chǎn)生一個錯誤日志。
1、假設(shè)日志文件ganglia-20180524.log的內(nèi)容為:
[1] 00:00:01 [SUCCESS] test@192.168.56.102
ganglia 24810 0.0 0.0 57536 3396 ? Ssl May23 0:20 /usr/sbin/gmond --pid-file /var/run/gmond.pid
test 27619 0.0 0.0 11376 2800 ? Ss 09:05 0:00 bash -c ps aux | grep gmond
test 27621 0.0 0.0 10720 2276 ? S 09:05 0:00 grep gmond
[2] 00:00:01 [SUCCESS] test@192.168.56.103
ganglia 25710 0.0 0.0 57536 3396 ? Ssl May23 0:20 /usr/sbin/gmond --pid-file /var/run/gmond.pid
test 27622 0.0 0.0 11376 2800 ? Ss 09:05 0:00 bash -c ps aux | grep gmond
test 27645 0.0 0.0 10720 2276 ? S 09:05 0:00 grep gmond
2、參考grep命令最經(jīng)常使用的功能總結(jié),編寫腳本checkganglia.sh
#!/bin/bash
DATE=`date +%Y%m%d`
filename="ganglia-${DATE}.log"
hosts=`grep test@ /tmp/log/ganglia/${filename} | wc -l`
pids=`grep gmond.pid /tmp/log/ganglia/${filename} | wc -l`
if [ ${hosts} == ${pids} ]
then
echo "All services are runing!"
else
echo "Error occurred!" > /tmp/log/ganglia/error-${DATE}.log
fi
3、執(zhí)行
chmod a+x checkganglia.sh
./checkganglia.sh
如果所有客戶機的ganglia運行正常,就會輸出All services are runing!。如果有的客戶機ganglia進程不存在,則會在/tmp/log/ganglia/目錄下生成當(dāng)天的錯誤日志。
4、設(shè)置定時運行
因為日志的檢查工作要在日志生成之后,所以時間上延后十分鐘。
10 0 * * * /bin/bash /home/test/checkganglia.sh
腳本進階
上面的腳本,還有很多要改進的地方。比如有的客戶機宕機了,上面的腳本檢查不出來。比如有的客戶機ganglia服務(wù)沒有啟動,那么具體是哪幾臺?針對這兩個問題,下面進行改進。假設(shè)已經(jīng)知道客戶機的數(shù)量為10。
參考csplit命令,checkganglia.sh腳本修改為:
#!/bin/bash
DATE=`date +%Y%m%d`
filename="ganglia-${DATE}.log"
prefix="ganglia-${DATE}"
hosts=`grep test@ /tmp/log/ganglia/${filename} | wc -l`
pids=`grep gmond.pid /tmp/log/ganglia/${filename} | wc -l`
if [ ${hosts} != 10 ]
then
echo "Some hosts are offline!" >> /tmp/log/ganglia/error-${DATE}.log
fi
if [ ${hosts} != ${pids} ]
then
echo "Some ganglia services have stopped!" >> /tmp/log/ganglia/error-${DATE}.log
cd /tmp/log/ganglia/
csplit /tmp/log/ganglia/${filename} /test@/ -n2 -s {*} -f ${prefix} -b ".log.%02d"
rm ${prefix}.log.00
for file in /tmp/log/ganglia/${prefix}.log.*
do
if [ -f "${file}" ]
then
#echo "${file} is file"
if [ `grep gmond.pid ${file} | wc -l` == 0 ]
then
echo `grep test@ ${file}` >> /tmp/log/ganglia/error-${DATE}.log
fi
fi
done
fi
以上腳本,實現(xiàn)了當(dāng)客戶機數(shù)量不為10的時候,進行報錯;當(dāng)客戶機ganglia服務(wù)沒有啟動時,進行報錯,并且篩選出所有沒有啟動ganglia的客戶機。
后記
本文中,我們先學(xué)習(xí)了crontab的基礎(chǔ)知識和基本用法。然后通過監(jiān)控ganglia這一個應(yīng)用場景來具體學(xué)習(xí)crontab的詳細使用方法,包括查看cron日志的方法,crontab中命令轉(zhuǎn)義的方法,定時執(zhí)行腳本的方法,以及審閱日志腳本的編寫和進階。
至此,還不夠完美,因為我們需要每天登錄管理機查看有沒有錯誤日志。下一篇Linux設(shè)置郵件提醒中,我們將會研究linux設(shè)置郵件提醒的方法。審閱完日志后,如果腳本能夠給我們發(fā)送一封郵件,告知我們審閱的結(jié)果,那么我們就不必再每天查看錯誤日志。