Systemd入门教程:实战篇
Table of Contents
如果你没有看命令篇,建议先看命令篇:Systemd入门教程:命令篇。
systemctl对服务的操作
设置开机启动
对于那些支持Systemd的软件,安装的时候,会自动在/usr/lib/systemd/system
目录添加一个配置文件(一般为.service
后缀)。
配置文件的后缀名,就是该Unit的种类,比如sshd.socket
。如果省略,Systemd默认后缀名为.service
,所以nginx
会被理解成nginx.service
。
如果你想让该软件开机启动,就执行下面的命令(以nginx.service为例):
sudo systemctl enable nginx
上面的命令相当于在/etc/systemd/system/
目录添加一个符号链接nginx.service
,指向/usr/lib/systemd/system/nginx.service
。
这是因为开机时,Systemd只执行/etc/systemd/system/
目录里面的配置文件。这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。
但要注意,符号链接可能不是直接在/etc/systemd/system/
目录下,而是在该目录下的multi-user.target.wants/
目录中。
启动服务
设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件,那么要执行以下命令:
sudo systemctl start nginx
为了查看nginx服务是否真的启动了,可以查看一下它的状态:
sudo systemctl status nginx
输出结果:
● nginx.service - nginx - high performance web server
Loaded: loaded (/usr/lib/systemd/system/nginx.service; enabled; vendor preset: disabled)
Active: active (running) since 二 2019-03-26 03:06:39 CST; 1 weeks 1 days ago
Docs: http://nginx.org/en/docs/
Main PID: 4084 (nginx)
Tasks: 3
Memory: 34.0M
CGroup: /system.slice/nginx.service
├─ 4084 nginx: master process /usr/local/openresty/nginx/sbin/nginx -c /usr/lo...
├─25383 nginx: worker process
└─25384 nginx: cache manager process
Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.
- Loaded行:配置文件的位置,表示是否设为开机启动,enabled表示已经设置为开机自启动。
- Active行:表示是否处于激活状态(即是否正在运行)
- Docs行:该软件的文档,有可能是一个网址,有可能是man(意思是让你用man命令查看)
- Main PID行:主进程PID
- Tasks行:表示一共有几个子进程
- Memory行:表示该服务占用的内存大小
- CGroup块:应用的所有子进程
- 日志块:应用的日志
停止服务
终止正在运行的服务,需要执行systemctl stop命令:
sudo systemctl stop nginx
有时候,该命令可能没有响应,服务停不下来。这时候就不得不”杀进程”了,向正在运行的进程发出kill信号:
sudo systemctl kill nginx
当然,我们自己用ps -ef | grep nginx
找到pid,然后自己用kill -9 pid
也是可以的
重启服务
sudo systemctl restart nginx
读懂配置文件
一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。
前面说过,配置文件主要放在/usr/lib/systemd/system
目录,也可能在/etc/systemd/system
目录。找到配置文件以后,使用文本编辑器打开即可。
systemctl cat
命令可以用来查看配置文件,下面以sshd.service
文件为例,它的作用是启动一个SSH服务器,供其他用户以SSH方式登录。
xiebruce@centos-linux1 > ~ > systemctl cat sshd.service
# /usr/lib/systemd/system/sshd.service
[Unit]
Description=OpenSSH server daemon
Documentation=man:sshd(8) man:sshd_config(5)
After=network.target sshd-keygen.service
Wants=sshd-keygen.service
[Service]
Type=notify
EnvironmentFile=/etc/sysconfig/sshd
ExecStart=/usr/sbin/sshd -D $OPTIONS
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
RestartSec=42s
[Install]
WantedBy=multi-user.target
可以看到,配置文件分成几个区块,每个区块包含若干条键值对。下面依次解释每个区块的内容。
[Unit]区块:启动顺序与依赖关系
- Description:当前服务的简单描述
- Documentation:文档位置,有可能是一个网址,有可能是
man
,意思是让你用man命令去查。 - After:表示如果network.target或sshd-keygen.service需要启动,那么sshd.service应该在它们之后启动。
相应地,还有一个Before字段,定义sshd.service应该在哪些服务之前启动。
注意:After和Before字段只涉及启动顺序,不涉及依赖关系。
举例来说,某Web应用需要mysql数据库储存数据。在配置文件中,它只定义要在 mysql之后启动,而没有定义依赖mysql。上线后,由于某种原因,mysql需要重新启动,在停止服务期间,该Web应用就会无法建立数据库连接。
设置依赖关系,需要使用Wants字段和Requires字段。
– Wants:表示sshd.service与sshd-keygen.service之间存在”弱依赖”关系,即如果”sshd-keygen.service”启动失败或停止运行,不影响sshd.service继续执行。
Requires字段则表示”强依赖”关系(由于sshd没有强依赖,所以在这里并没有写Requies字段),即如果该服务启动失败或异常退出,那么sshd.service也必须退出。
注意,Wants字段与Requires字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。
[Service] 区块:启动行为
Service区块定义如何启动当前服务。
启动命令
许多软件都有自己的环境参数文件,该文件可以用EnvironmentFile
字段读取。
EnvironmentFile字段:指定当前服务的环境参数文件。该文件内部的key=value键值对,可以用$key
的形式,在当前配置文件中获取。
上面的例子中,sshd的环境参数文件是/etc/sysconfig/sshd
。
ExecStart
:定义启动进程时执行的命令,配置文件里面最重要的字段是ExecStart。
上面的例子中,启动sshd,执行的命令是/usr/sbin/sshd -D $OPTIONS
,其中的变量$OPTIONS
就来自EnvironmentFile
字段指定的环境参数文件。
与之作用相似的,还有如下这些字段。
- ExecReload字段:重启服务时执行的命令
- ExecStop字段:停止服务时执行的命令
- ExecStartPre字段:启动服务之前执行的命令
- ExecStartPost字段:启动服务之后执行的命令
- ExecStopPost字段:停止服务之后执行的命令
请看下面的例子。
[Service]
ExecStart=/bin/echo execstart1
ExecStart=
ExecStart=/bin/echo execstart2
ExecStartPost=/bin/echo post1
ExecStartPost=/bin/echo post2
上面这个配置文件,第二行ExecStart设为空值,等于取消了第一行的设置,运行结果如下。
execstart2
post1
post2
所有的启动设置之前,都可以加上一个连词号(-),表示”抑制错误”,即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/sysconfig/sshd
(注意等号后面的那个连词号),就表示即使/etc/sysconfig/sshd
文件不存在,也不会抛出错误。
启动类型
Type字段定义启动类型。它可以设置的值如下:
- simple(默认值):ExecStart字段启动的进程为主进程
- forking:ExecStart字段将以
fork()
方式启动,此时父进程将会退出,子进程将成为主进程 - oneshot:类似于simple,但只执行一次,Systemd会等它执行完,才启动其他服务
- dbus:类似于simple,但会等待D-Bus信号后启动
- notify:类似于simple,启动结束后会发出通知信号,然后Systemd再启动其他服务
- idle:类似于simple,但是要等到其他任务都执行完,才会启动该服务。一种使用场合是为让该服务的输出,不与其他服务的输出相混合
下面是一个oneshot的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写。
[Unit]
Description=Switch-off Touchpad
[Service]
Type=oneshot
ExecStart=/usr/bin/touchpad-off
[Install]
WantedBy=multi-user.target
上面的配置文件,启动类型设为oneshot,就表明这个服务只要运行一次就够了,不需要长期运行,但是你有没有发现,停止了之后,无法用systemctl开启呀,所以我们可以再改成以下这样:
[Unit]
Description=Switch-off Touchpad
[Service]
Type=oneshot
ExecStart=/usr/bin/touchpad-off start
ExecStop=/usr/bin/touchpad-off stop
RemainAfterExit=yes
[Install]
WantedBy=multi-user.target
可以看到,上面配置文件中添加了ExecStop和RemainAfterExit。
当执行start后,就关闭了触控板(有人可能会觉得奇怪,start不是开启触摸板么?怎么会关闭呢?但你要看清楚,被执行的命令是touchpad-off
,start表示执行touchpad-off
这个命令,当然就是关闭触控板)
RemainAfterExit
字段的值可以为true或false,也可以用yes和no。
这个字段可能比较多人不懂,它设为yes的意思是“程序虽然退出了,但仍然让systemctl status
命令查询到的状态为active
”,为什么要这样呢?因为只有这样才可以执行stop操作,假如你本身就是stop状态,你是没法执行systemctl stop
操作的(实际上你去执行它是不会报错的,但按原则来说,只有状态为active的服务才能stop)。
有人会觉得,既然执行之后就自己退出了,对程序来说实际上已经stop
了,为什么还要stop呢?很明显,本例的stop并不是指“/usr/bin/touchpad-off”这个服务的stop,而是指“/usr/bin/touchpad-off start”的“反操作”而已。
RemainAfterExit这个配置主要是提供给一些并非常驻内存的程序使用。
重启行为
Service区块有一些字段,定义了重启行为。
KillMode字段:定义Systemd如何停止sshd服务。
上面这个例子中,将KillMode设为process,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对sshd很重要,否则你停止服务的时候,会连自己打开的SSH session一起杀掉(这样你就再也无法远程连接去启动它了,所以不能这么做,sshd这点比较特殊)。
KillMode字段可以设置的值如下:
- control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
- process:只杀主进程
- mixed:主进程将收到SIGTERM信号,子进程收到SIGKILL信号
- none:没有进程会被杀掉,只是执行服务的stop命令。
接下来是Restart字段。
Restart字段:定义了sshd退出后,Systemd的重启方式。
上面的例子中,Restart设为on-failure,表示任何意外的失败,就将重启sshd。如果sshd正常停止(比如执行systemctl stop命令),它就不会重启。
Restart字段可以设置的值如下。
- no(默认值):退出后不会重启
- on-success:只有正常退出时(退出状态码为0),才会重启
- on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
- on-abnormal:只有被信号终止和超时,才会重启
- on-abort:只有在收到没有捕捉到的信号终止时,才会重启
- on-watchdog:超时退出,才会重启
- always:不管是什么退出原因,总是重启
对于守护进程,推荐设为on-failure
。对于那些允许发生错误退出的服务,可以设为on-abnormal
。
RestartSec字段:表示Systemd重启服务之前,需要等待的秒数。上面的例子设为等待42秒。
[Install]区块
Install区块,定义如何安装这个配置文件,即怎样做到开机启动。
WantedBy字段:表示该服务所在的Target。
Target的含义是服务组,表示一组服务。WantedBy=multi-user.target指的是,sshd所在的Target是multi-user.target。
这个设置非常重要,因为执行systemctl enable sshd.service
命令时,sshd.service的一个符号链接,就会放在/etc/systemd/system目录下面的multi-user.target.wants子目录之中。
Systemd有默认的启动Target,使用以下命令查看:
xiebruce@centos-linux1 > ~ > systemctl get-default
multi-user.target
一般来说,常用的Target有两个:一个是multi-user.target,表示多用户命令行状态;另一个是graphical.target,表示图形用户状态,它依赖于multi-user.target。官方文档有一张非常清晰的Target依赖关系图。
Target的配置文件
xiebruce@centos-linux1 > ~ > systemctl cat multi-user.target
# /lib/systemd/system/multi-user.target
# This file is part of systemd.
#
# systemd is free software; you can redistribute it and/or modify it
# under the terms of the GNU Lesser General Public License as published by
# the Free Software Foundation; either version 2.1 of the License, or
# (at your option) any later version.
[Unit]
Description=Multi-User System
Documentation=man:systemd.special(7)
Requires=basic.target
Conflicts=rescue.service rescue.target
After=basic.target rescue.service rescue.target
AllowIsolate=yes
注意,Target 配置文件里面没有启动命令。
上面输出结果中,主要字段含义如下。
- Requires字段:要求basic.target一起运行。
- Conflicts字段:冲突字段。如果rescue.service或rescue.target正在运行,multi-user.target就不能运行,反之亦然。
- After:表示multi-user.target在basic.target 、 rescue.service、 rescue.target之后启动,如果它们有启动的话。
- AllowIsolate:允许使用systemctl isolate命令切换到multi-user.target。
修改配置文件后重启
修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。
# 重新加载配置文件
sudo systemctl daemon-reload
# 重启相关服务
sudo systemctl restart foobar
ExecReload 不是重启服务,而是重载配置文件。参考 man systemd.service: Commands to execute to trigger a configuration reload in the service. This argument takes multiple command lines, following the same scheme as described for ExecStart= above. 我发现阮一峰的博客也写错了。
嗯,是的,reload本身也是重载的意思,我这个文章就是直接转载他的,我有标明转载地址的。不过我后来发现,虽然写着reload,但其实跟重启应该没啥区别,比如sshd:ExecReload=/bin/kill -HUP $MAINPID,这就是杀掉进程嘛,感觉写重启好像也没啥问题。
学习了🙏