Linux操作系统|【Linux】进程信号


进程信号

  • 引言
  • 信号
    • 信号产生:
    • 信号识别:
    • 信号的处理:
  • 产生信号
    • Core Dump:
  • 阻塞信号
    • sigset_t:
    • 信号集操作函数
    • sigprocmask
    • sigpending
  • 信号捕捉图解
    • sigaction

引言 Linux下的信号
查看信号:kill -l
Linux操作系统|【Linux】进程信号
文章图片

1~31是普通信号
34~64是实时信号
信号是进程之间事件异步通知的一种方式,属于软中断
信号
信号产生: 1.kill命令产生
2.键盘产生
3.程序异常
信号识别: 1.进程收到信号,其实不是立即处理,而是在合适的时候。 为什么不是立即处理? 因为信号的产生,是在进程的运行的任何时间点都可以产生的,有可能进程正在做更重要的事情。
信号的处理: 1.默认方式(部分是终止进程,部分有特定的功能)
2.忽略信号
3. 自定义方式(捕捉信号):提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数
产生信号
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。
Core Dump:
当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部 保存到磁 盘上,文件名通常是core,这叫做Core Dump。
进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem
Debug(事后调试)。
一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024
信号的本质:因为信号不是立即处理的,所以信号一定要先被保存起来。 在进程的PCB,进程控制块task_struct中进行保存
发送信号的本质,就相当于写对应进程的task_struct信号位图!! 因为OS是进程的管理者,对进程数据做修改,OS是有这个能力和义务的!
信号是OS发送的,通过修改对应进程的信号位图(0---->1),完成信号的发送。
信号不论经过何种方式产生,都要经过OS,然后给进程。
core dumped:核心转储 OS将进程运行时的核心数据dump到磁盘上,方便用户进行调试使用。
一般而言,线上环境,核心转储是被关闭的。 为什么要核心转储? 事后调试。
当你的进程出现错误(除0,野指针,越界)的时候,也会由OS识别到,然后给目标进程发送信号,来达到终止进程的目的。
阻塞信号
  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号。
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。
pending位图:比特位的位置代表信号的编号,比特位的内容(0 or 1)代表是否收到信号。 OS发送信号本质是修改task_struct
pending位图的内容!
handler数组:用信号的编号,作为数组的索引,找到该信号对应的信号处理方式,然后指向对应的方法(递达)。
block位图:比特位的位置代表信号的编号,比特位的内容(0 or 1)代表是否阻塞该信号。
Linux操作系统|【Linux】进程信号
文章图片

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
  • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里 。
sigset_t:
从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。
在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。
阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
如果没有收到对应的信号,照样可以阻塞特定信号。阻塞更准确的理解,理解成为一种“状态”。
检测信号是否会被递达,是否被阻塞,都是OS的任务。
进程,从内核态返回用户态时,尝试进行信号检测与捕捉执行。
CPU中会存在一个权限相关的寄存器数据标识所处的状态。
每个用户进程都有自己的用户级页表!但是OS只有一份,所以我们只需要维护一份内核级页表。
信号集操作函数
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
#include int sigemptyset(sigset_t *set); int sigfillset(sigset_t *set); int sigaddset (sigset_t *set, int signo); int sigdelset(sigset_t *set, int signo); int sigismember(const sigset_t *set, int signo);

  • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含 任何有效信号。
  • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示 该信号集的有效信号包括系统支持的所有信号。
  • 注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。
sigprocmask
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)
#include int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 返回值:若成功则为0,若出错则为-1

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。
Linux操作系统|【Linux】进程信号
文章图片

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。
sigpending
#include sigpending //读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。 下面用刚学的几个函数做个实验。程序如下:

Linux操作系统|【Linux】进程信号
文章图片

程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会 使SIGINT信号处于未决状态,按Ctrl-\仍然可以终止程序,因为SIGQUIT信号没有阻塞。
信号捕捉图解 Linux操作系统|【Linux】进程信号
文章图片

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下:用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行 main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
系统调用是函数,是OS提供的,需要被执行,以内核态运行。
执行信号捕捉方法的状态是什么状态?理论上,内核态是绝对可以的,但实际上并非如此。OS不相信任何人写的任何代码。 所以必须是用户态。
用户态和内核态的权限级别不同,决定了能看到的资源是不一样的。
sigaction
#include int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

  • sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非 空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体.
  • 将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函 数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用.
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。 如果
在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字.
函数被多个执行流同时进入的情况,叫做重入。
大部分函数都是不可重入的。
如果一个函数符合以下条件之一则是不可重入的:
  • 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
  • 调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。
volatile关键字: 保持内存可见性,易变关键字。
作用:保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作.
【Linux操作系统|【Linux】进程信号】我们如何决定是否需要wait子进程?
1.子进程的内存泄漏可以wait也可以不wait
2.如果需要获取子进程的退出码,必须wait---->status

    推荐阅读