Blog · Loji44AboutTAGSRSS🔍SEARCH

声明:本篇文章不是原创,转载自:https://www.ibm.com/developerworks/cn/linux/l-cn-nohup
原文章已经写得很好了,这里转载过来,然后自己实践并记录一下。感谢原文章的作者。

我们经常会碰到这样的问题,用telnet/ssh登录到远程的Linux服务器上,执行一些耗时的任务。但是在任务运行结束之前,本地机器和远程Linux机器的网络中断了,或者自己不小心关闭了终端,都会导致Linux上运行的任务被关闭。

如何让命令提交后不受本地关闭终端窗口/网络断开连接的干扰呢?下面举了一些例子, 您可以针对不同的场景选择不同的方式来处理这个问题。

1. nohup/setsid/& 命令

场景描述:
如果只是临时有一个命令需要长时间运行,什么方法能最简便的保证它在后台稳定运行呢?
解决方案:
当用户注销(logout)或者网络断开时,终端会收到HUP(hangup)信号从而关闭其所有子进程。因此,思路有两个:

  • 让进程忽略HUP信号;
  • 让进程运行在新的会话里从而成为不属于此终端的子进程。

hangup名称的来由:
在Unix的早期版本中,每个终端都会通过modem和系统通讯。当用户logout时,modem就会挂断(hang up)电话。 同理,当modem断开连接时,就会给终端发送hangup信号来通知其关闭所有子进程。

1.1 nohup

nohup无疑是我们首先想到的办法。nohup的用途就是让提交的命令忽略hangup信号。先来看一下nohup的帮助信息:

$ man nohup
NOHUP(1)                         User Commands                        NOHUP(1)

NAME
       nohup - run a command immune to hangups, with output to a non-tty

SYNOPSIS
       nohup COMMAND [ARG]...
       nohup OPTION

DESCRIPTION
       Run COMMAND, ignoring hangup signals.

       --help display this help and exit

       --version
              output version information and exit

nohup的使用很简单,只要在执行的命令前加上nohup即可。标准输出和标准错误默认会被重定向到nohup.out文件中。一般我们可在结尾加上&来将命令同时放入后台运行,也可用>filename 2>&1来更改默认的重定向文件名。

nohup + & 的使用示例:

ping www.ibm.com是我们要运行的任务指令。

$ nohup ping www.ibm.com &
[1] 39907

nohup: 忽略输入并把输出追加到"nohup.out"

如果要修改标准输出和标准错误重定向的文件,可以使用>filename 2>&1

$ nohup ping www.ibm.com > output.log 2>&1 &

上面我们把标准输出和标准错误输出重定向的文件改成了output.log,并在最后使用&来将任务放到后台执行。

在Shell中,stdin是标准输入;stdout是标准输出;stderr是标准错误输出,分别用数字0,1,2表示。
上面的2>&1就表示将stderr输出也重定向到stdout所重定向到的同名文件中,即&1表示output.log文件。
所以当执行的命令发生标准错误,那么这个错误也会输出到你指定的输出文件中,即output.log文件中。

1.2 setsid

nohup能通过忽略HUP信号来使我们的进程避免中途被中断。但如果我们换个角度思考,如果我们的进程不属于接受HUP信号的终端的子进程,那么自然也就不会受到该终端的HUP信号的影响了。setsid就能帮助我们做到这一点。让我们先来看一下 setsid 的帮助信息:

$ man setsid
SETSID(1)                  Linux Programmer’s Manual                 SETSID(1)

NAME
       setsid - run a program in a new session

SYNOPSIS
       setsid program [arg...]

DESCRIPTION
       setsid runs a program in a new session.

setsid的使用也同样很简单,只要在执行的命令前加上setsid即可。

setsid使用示例:

$ setsid ping www.ibm.com

$ ps -ef | grep "UID\|www.ibm.com"
UID        PID    PPID   C  STIME TTY      TIME      CMD
LuzHo211   43482     1   0  16:13 ?        00:00:00  ping www.ibm.com
LuzHo211   43484  41875  0  16:13 pts/10   00:00:00  grep UID\|www.ibm.com

可以看到我们任务的进程ID为43482,而它的父进程ID为1(即 init 进程ID),并不是当前终端的进程ID。说明使用setsid之后,任务进程变成了init进程的子进程,而不是当前终端进程的子进程。这样一来,就算我们当前终端被关闭或者当前终端的网络跟服务器发生中断,我们的任务进程也不会被关闭。

相比nohup中任务进程的父进程ID:

$ nohup ping www.ibm.com &
[1] 44109

$ ps -ef | grep "UID\|www.ibm.com\|pts"
UID        PID   PPID   C STIME TTY      TIME     CMD
LuzHo211   41875 41874  0 15:38 pts/10   00:00:00 -bash
LuzHo211   44109 41875  0 16:22 pts/10   00:00:00 ping www.ibm.com
LuzHo211   44157 41875  0 16:23 pts/10   00:00:00 ps -ef
LuzHo211   44158 41875  0 16:23 pts/10   00:00:00 grep UID\|www.ibm.com\|pts

可以看出我们的任务进程ID为44109,而其父进程ID为41875;41875就是我们当前终端的PID。

1.3 &

这里还有一个关于subshell的小技巧。我们知道,将一个或多个命名包含在“()”中就能让这些命令在子shell中运行中,从而扩展出很多有趣的功能,我们现在要讨论的就是其中之一。

当我们将”&”也放入“()”内之后,我们就会发现所提交的作业并不在作业列表中。也就是说,是无法通过jobs来查看的。让我们来看看为什么这样就能躲过HUP信号的影响吧。

subshell示例:

$ (ping www.ibm.com &)

$ ps -ef | grep "UID\|www.ibm.com"
UID        PID  PPID  C STIME TTY          TIME CMD
root     24535     1  0 10:23 pts/2    00:00:00 ping www.ibm.com
root     24650 24560  0 10:26 pts/3    00:00:00 grep --color=auto UID\|www.ibm.com

从上例中可以看出,新提交的进程的父进程ID(PPID)为1(即init进程的PID),并不是当前终端的进程ID。因此并不属于当前终端的子进程,从而也就不会受到当前终端的HUP信号的影响了。

2. disown 命令

场景描述:
在提交命令之前,在命令前加上nohup或者setsid就可以避免HUP信号的影响。但是若我们未加任何处理就已经提交了命令,该如何补救才能让它避免HUP信号的影响呢?
解决方案:
这时想加nohup或setsid已经为时已晚,只能通过作业调度和disown来解决这个问题。先看一下disown的帮助信息:

disown [-ar] [-h] [jobspec ...]
    Without options, each jobspec is  removed  from  the  table  of
    active  jobs.   If  the -h option is given, each jobspec is not
    removed from the table, but is marked so  that  SIGHUP  is  not
    sent  to the job if the shell receives a SIGHUP.  If no jobspec
    is present, and neither the -a nor the -r option  is  supplied,
    the  current  job  is  used.  If no jobspec is supplied, the -a
    option means to remove or mark all jobs; the -r option  without
    a  jobspec  argument  restricts operation to running jobs.  The
    return value is 0 unless a jobspec does  not  specify  a  valid
    job.

可以看出,我们可以用如下方式来达成我们的目的:

  • 用 disown -h jobspec 来使某个作业忽略HUP信号;
  • 用 disown -ah 来使所有的作业都忽略HUP信号;
  • 用 disown -rh 来使正在运行的作业忽略HUP信号。

需要注意的是,当使用过disown之后,会将把目标作业从作业列表中移除,我们将不能再使用jobs来查看它,但是依然能够用ps -ef查找到它。

但是还有一个问题,这种方法的操作对象是作业,如果我们在运行命令时在结尾加了&来使它成为一个作业并在后台运行,那么就万事大吉了,我们可以通过jobs命令来得到所有作业的列表。但是如果并没有把当前命令作为作业来运行,如何才能得到它的作业号呢?答案就是用ctrl + z(按住ctrl键的同时按住z键)了!

灵活运用 ctrl + z
我们可以用ctrl + z来将当前进程挂起到后台暂停运行,执行一些别的操作;然后再用 fg 来将挂起的进程重新放回前台(也可用 bg 来将挂起的进程放在后台)继续运行。这样我们就可以在一个终端内灵活切换运行多个任务。

ctrl + z的用途就是将当前进程挂起(Suspend),然后我们就可以用jobs命令来查询它的作业号,再用bg jobspec来将它放入后台并继续运行。需要注意的是,如果挂起会影响当前进程的运行结果,请慎用此方法

disown 示例1:提交命令时已经用&将命令放入后台运行,则可以直接使用disown

$ ping www.ibm.com > ping.log &
[1] 25259

$ jobs
[1]+  Running                 ping www.ibm.com > ping.log &

$ disown -h %1

$ ps -ef | grep ping
root     25259 25167  0 11:02 pts/4    00:00:00 ping www.ibm.com
root     25261 25167  0 11:03 pts/4    00:00:00 grep --color=auto ping

我在Ubuntu上试过,当提交命令的时候就使用&将命令放入后台运行,如果当前终端关闭了,我们提交的命令并不会被终止,并且命令会自动被挂到init进程下面,保持继续运行。

disown 示例2:提交命令时未使用&将命令放入后台运行,可使用ctrl+z 和 bg 将其放入后台,再使用disown

// 提交命令(不带&)并ctrl + z将命令挂起
$ ping www.ibm.com > ping.log
^Z
[1]+  Stopped                 ping www.ibm.com > ping.log

// jobs查看作业列表,看到命令已经被挂起
$ jobs
[1]+  Stopped                 ping www.ibm.com > ping.log

// 使用bg将挂起的任务放到后台运行
$ bg %1
[1]+ ping www.ibm.com > ping.log &

// 使用jobs查看,发现任务已经在后台运行
$ jobs
[1]+  Running                 ping www.ibm.com > ping.log &

// 使用disown -h 来让任务免受HUP信号的干扰
$ disown -h %1

$ ps -ef | grep ping
root     25382 25296  0 11:13 pts/6    00:00:00 ping www.ibm.com
root     25387 25296  0 11:16 pts/6    00:00:00 grep --color=auto ping

3. screen命令

场景描述:
我们已经知道了如何让进程免受HUP信号的影响,但是如果有大量这种命令需要在稳定的后台里运行,如何避免对每条命令都做这样的操作呢?
解决方案:
此时最方便的方法就是screen了。简单的说,screen提供了ANSI/VT100的终端模拟器,使它能够在一个真实终端下运行多个全屏的伪终端。screen的参数很多,具有很强大的功能,我们在此仅介绍其常用功能以及简要分析一下为什么使用screen能够避免HUP信号的影响。先看一下screen的帮助信息:

SCREEN(1)                                                           SCREEN(1)
 
NAME
       screen - screen manager with VT100/ANSI terminal emulation
 
SYNOPSIS
       screen [ -options ] [ cmd [ args ] ]
       screen -r [[pid.]tty[.host]]
       screen -r sessionowner/[[pid.]tty[.host]]
 
DESCRIPTION
       Screen  is  a  full-screen  window manager that multiplexes a physical
       terminal between several  processes  (typically  interactive  shells).
       Each  virtual  terminal provides the functions of a DEC VT100 terminal
       and, in addition, several control functions from the  ISO  6429  (ECMA
       48,  ANSI  X3.64)  and ISO 2022 standards (e.g. insert/delete line and
       support for multiple character sets).  There is a  scrollback  history
       buffer  for  each virtual terminal and a copy-and-paste mechanism that
       allows moving text regions between windows.

screen的使用也很方便,有以下几个常用选项:

  • 用 screen -dmS session name 来建立一个处于断开模式下的会话(并指定其会话名);
  • 用 screen -list 来列出所有会话;
  • 用 screen -r session name 来重新连接指定会话;
  • 用快捷键 ctrl+a d 来暂时断开当前会话。

screen 示例:

$ screen -dmS Urumchi

$ screen -list
There is a screen on:
	26332.Urumchi	(02/26/2020 12:08:50 PM)	(Detached)
1 Socket in /var/run/screen/S-root.

$ screen -r Urumchi

当我们用-r参数连接到screen会话后,我们就可以在这个伪终端里面为所欲为,再也不用担心HUP信号会对我们的进程造成影响,也不用给每个命令前都加上nohup或者setsid了。这是为什么呢?让我来看一下下面两个例子吧。

1. 未使用 screen 时新进程的进程树:

$ ping www.baidu.com > ping.log &
[1] 26366

$ pstree -H 26366
systemd─┬─AliYunDun───23*[{AliYunDun}]
        ├─AliYunDunUpdate───3*[{AliYunDunUpdate}]    
        └─sshd─┬─7*[sshd───bash]
               └─sshd───bash─┬─ping
                             └─pstree

可以看出,未使用screen时我们所处的bash是sshd的子进程,当ssh断开连接时,HUP信号自然会影响到它下面的所有子进程(包括我们新建立的ping进程)。

2. 使用了 screen 后新进程的进程树:

$ screen -dmS my_new_session

$ screen -r my_new_session

$ ping www.baidu.com > ping.log &
[1] 26421

$ pstree -H 26421
systemd─┬─AliYunDun───23*[{AliYunDun}]
        ├─AliYunDunUpdate───3*[{AliYunDunUpdate}]
        ├─screen───bash─┬─ping
        │               └─pstree
        └─sshd─┬─8*[sshd───bash]
               └─sshd───bash───screen

可以看到,使用了screen之后,我们所处的bash则变成了screen进程的子进程,而screen又是systemd的子进程。那么当ssh断开连接时,HUP信号自然不会影响到screen下面的子进程了。

4. 总结

现在几种方法已经介绍完毕,我们可以根据不同的场景来选择不同的方案。nohup/setsid无疑是临时需要时最方便的方法,disown能帮助我们来事后补救当前已经在运行了的作业,而screen则是在大批量操作时不二的选择了。