Linux内核之进程原理分析
创始人
2025-05-28 19:34:43

目录

一 Linux内核源码分析架构图

二 进程原理分析

三 Linux 进程四要素

四 进程描述符 task_struct 数据结构主要成员内核源码分析

五 创建新进程分析

Linux 3 个系统调用创建新的进程:

 Linux 内核函数_do_fork()执行流程如下图所示:

具体核心处理函数为 copy_process()内核源码如下: 

六 剖析进程状态迁移

七 写时复制技术


C/C++Linux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂

Linux内核源码分析架构图

进程原理分析

进程基础知识
        Linux内核把进程称为任务(task),进程的虚拟地址空间分为用户虚拟地址空间和内核虚拟地址空间,所有进程共享内核虚拟地址空间,每个进程有独立的用户空间虚拟地址空间。
        进程有两种特殊形式:没有用户虚拟地址空间的进程称为内核线程,共享用户虚拟地址空间的进程称为用户线程。通用在不会引起混淆的情况下把用户线程简称为线程。共享同一个用户虚拟地址空间的所有用户线程组成一个线程组。
        C标准库进程术语和Linux内核进程术语对应关系如下:

C 标准库进程术语

Linux 内核进程术语

包含多个线程的进程

线程组

只有一个线程的进程

进程或任务

线程

共享用户虚拟地址空间的进程

 Linux 进程四要素

a.有一段程序供其执行。

b.有进程专用的系统堆栈空间。

c.在内核有 task_struct 数据结构。

d.有独立的存储空间, 拥有专有的用户空间。

进程描述符 task_struct 数据结构主要成员内核源码分析

  1. task_struct:进程描述符。
  2. __state:指向进程状态。
  3. *stack:指向内核栈。
  4. pid:指向全局的进程号。
  5. tgid:指向全局的线程组的标识符。
  6. *real_parent:指向真实的父进程
  7. *parent:指向当前的父进程。比如一个进程被另外的进程使用系统调用进行跟踪(ptrace),那么此时的父进程就是跟踪进程。进程调度策略的优先级:prio、static_prio、normal_prio、rt_priority。
  8. nr_cpus_allowed:允许进程在哪些处理器上执行。
  9. *mm:指向内存描述符,内核线程此项位NULL。
  10. *active_mm:指向内存描述符,内核线程运行时从进程借用。
  11. *fs:文件系统信息。

 创建新进程分析

在 Linux 内核中, 新进程是从一个已经存在的进程复制出来的, 内核使用静态数据结构造出 0 号内核线程, 0 号内核线程分叉生成 1 号内核线程和 2 号内核线程( kthreadd 线程) 。 1 号内核线程完成初始化以后装载用户程序, 变成 1 号进程, 其他进程都是 1

号进程或者它的子孙进程分叉生成的; 其他内核线程是 kthreadd 线程分叉生成的。

Linux 3 个系统调用创建新的进程:

a.fork(分叉): 子进程是父进程的一个副本, 采用写时复制技术。

b. vfork: 用于创建子进程, 之后子进程立即调用 execve 以装载新程序的情况, 为了避免复制物理页, 父进程会睡眠等待子进程装载新程序。 现在 fork 采用了写时复制技术, vfork 失去了速度优势, 已经被废弃。

c. clone( 克隆) : 可以精确地控制子进程和父进程共享哪些资源。 这个系统调用的主要用处是可供 pthread 库用来创建线程。clone 是功能最齐全的函数, 参数多使用复杂, fork 是 clone 的简化函数。

#ifdef __ARCH_WANT_SYS_FORK
SYSCALL_DEFINE0(fork)
{
#ifdef CONFIG_MMUstruct kernel_clone_args args = {.exit_signal = SIGCHLD,};return _do_fork(&args);
#else/* can not support in nommu mode */return -EINVAL;
#endif
}
#endif#ifdef __ARCH_WANT_SYS_VFORK
SYSCALL_DEFINE0(vfork)
{struct kernel_clone_args args = {.flags		= CLONE_VFORK | CLONE_VM,.exit_signal	= SIGCHLD,};return _do_fork(&args);
}
#endif#ifdef __ARCH_WANT_SYS_CLONE
#ifdef CONFIG_CLONE_BACKWARDS
SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,int __user *, parent_tidptr,unsigned long, tls,int __user *, child_tidptr)
#elif defined(CONFIG_CLONE_BACKWARDS2)
SYSCALL_DEFINE5(clone, unsigned long, newsp, unsigned long, clone_flags,int __user *, parent_tidptr,int __user *, child_tidptr,unsigned long, tls)
#elif defined(CONFIG_CLONE_BACKWARDS3)
SYSCALL_DEFINE6(clone, unsigned long, clone_flags, unsigned long, newsp,int, stack_size,int __user *, parent_tidptr,int __user *, child_tidptr,unsigned long, tls)
#else
SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,int __user *, parent_tidptr,int __user *, child_tidptr,unsigned long, tls)
#endif
{struct kernel_clone_args args = {.flags		= (lower_32_bits(clone_flags) & ~CSIGNAL),.pidfd		= parent_tidptr,.child_tid	= child_tidptr,.parent_tid	= parent_tidptr,.exit_signal	= (lower_32_bits(clone_flags) & CSIGNAL),.stack		= newsp,.tls		= tls,};if (!legacy_clone_args_valid(&args))return -EINVAL;return _do_fork(&args);
}
#endif

        Linux 内核定义系统调用的独特方式, 目前以系统调用 fork 为例: 创建新进程的 3 个系统调用在文件"kernel/fork.c"中, 它们把工作委托给函数_do_fork。 具体源码分析如下:

long _do_fork(struct kernel_clone_args *args)
{u64 clone_flags = args->flags;struct completion vfork;struct pid *pid;struct task_struct *p;int trace = 0;long nr;// ......}

 Linux 内核函数_do_fork()执行流程如下图所示:

具体核心处理函数为 copy_process()内核源码如下: 

/** This creates a new process as a copy of the old one,* but does not actually start it yet.** It copies the registers, and all the appropriate* parts of the process environment (as per the clone* flags). The actual kick-off is left to the caller.*/
static __latent_entropy struct task_struct *copy_process(struct pid *pid,int trace,int node,struct kernel_clone_args *args)
{int pidfd = -1, retval;struct task_struct *p;struct multiprocess_signals delayed;struct file *pidfile = NULL;u64 clone_flags = args->flags;struct nsproxy *nsp = current->nsproxy;// ......
}

函数 copy_process(): 创建新进程的主要工作由此函数完成,具体处理流程如下图所示:

同一个线程组的所有线程必须属于相同的用户命名空间和进程号命名空间。

 

 剖析进程状态迁移

进程主要有 7 种状态: 就绪状态、 运行状态、 轻度睡眠、 中度睡眠、 深度睡眠、 僵尸状态、 死亡状态, 它们之间状态变迁如下:

就绪:state是TASK_RUNING(没有严格区别就绪和运行),正在运行队列中等待调度器调度。

运行:state是TASK_RUNING,证明调度器选中,正在CPU上执行。

僵尸:state是TASK_DEAD,进程退出并且父进程关注子进程退出事件。

死亡:state是exit_state。

 写时复制技术


写时复制核心思想: 只有在不得不复制数据内容时才去复制数据内容。

申请新进程的步骤:

  1. 申请一块空的PCB(进程控制块)。
  2. 为新进程分配数据资源(这里使用写时复制技术)。
  3. 初始化PCB。
  4. 把刚才申请的新进程插入到就绪队列中。state是task_running,被调度器调度,进入运行状态。

 备注: 只有可修改的页面才需要标记为写时复制, 不能修改的页面可以由父进程和子进程共享。

相关内容

热门资讯

稳健增长!江南布衣2025财年...   中新经纬9月12日电 近日,江南布衣公布截至2025年6月30日止年度业绩。2025财年江南布衣...
OpenAI重组谈判获关键进展... 财联社9月12日讯(编辑 史正丞)昨夜今晨,面对符合预期的经济数据和透出就业市场“寒气”的初请数据,...
上半年亏损投行少了一半,头部券... 记者丨崔文静 实习生张长荣编辑丨巫燕玲随着2025年券商半年报收官,投行业务呈现整体回暖、内部分化的...
巨额订单风险重重?甲骨文股价大... 本文来自微信公众号:财联社 (ID:cailianpress),作者:卞纯在周三收盘创下历史新高后,...
越秀地产:获得2亿港元贷款融资... 新京报贝壳财经讯 9月11日,越秀地产公告,于2025年9月11日,公司(作为借款人)与一家银行(贷...
恒大物业:9月12日上午9时起... 新京报贝壳财经讯 9月11日,恒大物业公告,公司于2025年9月10日收到中国恒大集团及CEGHol...
华荣股份等目标价涨幅超50%,... 南财投研通数据显示,9月11日,券商给予上市公司目标价共48次,按最新收盘价计算,目标价涨幅排名居前...
恒大物业:9月12日上午9时起... 新京报贝壳财经讯 9月11日,恒大物业公告,公司于2025年9月10日收到中国恒大集团及CEGHol...
华荣股份等目标价涨幅超50%,... 南财投研通数据显示,9月11日,券商给予上市公司目标价共48次,按最新收盘价计算,目标价涨幅排名居前...
中国核电,暗藏玄机! 中国核电... 当ChatGPT单日耗电量突破50万度,一场围绕AI“电力黑洞”的能源争夺战已然打响。试问,哪种能源...
V观财报|歌礼制药:控股股东作... 【V观财报|歌礼制药:控股股东作出自愿禁售承诺】歌礼制药在港交所公告,为表达对本公司长远价值及未来前...
800亿芯片龙头芯原股份股票复... 9月11日晚间,芯原股份公告称,公司拟通过发行股份及支付现金方式向芯来共创、胡振波、芯来合创等31名...
阿里巴巴,股价创近4年新高 本文来自微信公众号:财联社 (ID:cailianpress),作者:史正丞昨夜今晨,伴随着大致符合...
全国10个要素市场化配置综合改... 昨日A股9月11日,市场全天持续走强,三大指数强势反弹,创业板指和深成指双双再创年内新高。沪深两市成...
牛市早报|iPhone 17系... 【市场数据】截至9月11日收盘,上证综指涨1.65%,报3875.31点;科创50指数涨5.32%,...
大盘即将挑战3888前高:29... 9月11日,A股经历多日震荡后上演“王者归来”。其中,上证综指涨1.65%,报收于3875.31点,...
牛市早报|iPhone 17系... 【市场数据】截至9月11日收盘,上证综指涨1.65%,报3875.31点;科创50指数涨5.32%,...
百岁留美归国教授:为祖国奋斗一... 本文来自微信公众号:返朴 (ID:fanpu2019),作者:王作跃、熊卫民等1950年代,约有两千...
富力地产,再次“削债” 富力地... 斑马消费 杨柘富力地产懂得用时间换空间,让自己获取喘息的机会。日前,公司启动对境内债券二次重组,计划...
涪陵榨菜销量下滑,下饭神器也不... 一直以来,涪陵榨菜都是最有名的下饭神器,即使行情不好的时候,这种下饭菜都是相当不错,然而就在最近涪陵...
为啥有些老板忙死还赚不到钱? 商道如天道,如人道,如修行之道。中哲不提供商业模式、销售技巧和管理工具,而是修心的法门。我最近遇到的...
如果很容易感到疲倦,可以试试这... 可能有人经常会有这种感觉:无论做什么事,都很容易感到疲劳,精力不济,做一会就没有动力了;对很多事情都...
深夜,中国资产爆发,阿里巴巴涨... 记者丨吴斌编辑丨李莹亮 和佳 金珊周四(9月11日),美国三大股指全线收涨,道指涨1.36%,标普5...
微软与OpenAI达成非约束性... 财联社9月12日电,微软盘后涨2%。消息面上,微软和OpenAI周四宣布,已就双方关系的新条款签署了...
三季度碳酸锂环比上涨12% 锂... 受到宁德时代枧下窝锂矿复产消息、碳酸锂期货下跌影响,碳酸锂现货价格再次跌至7万元/吨附近。Wind数...
靠宇树科技“股价翻番”?首开股... 本文来源:时代财经 作者:张照“真正让AI落地干活,现在还在大规模爆发性增长的前夜。对我个人而言,这...
高德入局不是本地消费竞争的唯一... 互联网平台的大消费入口之争又有新进展。10号上午,阿里司庆日当天,高德推出“高德扫街榜”,从导航到店...
亏损超29亿!晶科能源,“困境... 光伏行业的反内卷,让行业有了回暖的迹象。但行业的春天,还未真正到来。此前,新能源巨头晶科能源披露了2...
盘前必读丨国内首个“AI付”来... 【财经日历】科创50指数三季度调样于收市后生效;2025中国文化旅游产业博览会;高质量完成“十四五”...
经纬早班车|派拉蒙天舞拟收购华...   【隔夜重磅】  美股三大指数齐创新高  美东时间周四,美股三大指数齐创新高。截至收盘,道指涨1....