一个fork的面试题
前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:
题目:请问下面的程序一共输出多少个“-”?
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } wait(NULL); wait(NULL); return 0; }
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。
要讲清这个题,我们首先需要知道fork()系统调用的特性,
- fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
- 还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
printf("-\n");
或是
printf("-"); fflush(stdout);
就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; }
于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)
ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)
面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)
(全文完)
(转载本站文章请注明作者和出处 酷 壳 – CoolShell ,请勿用于任何商业用途)
《一个fork的面试题》的相关评论
@pein
确实是这样,不加最后两个wait(NULL),父进程过早退出,创建出的子进程也就很随机了。
不错 。学习 了 又总结了一个经验 。#fflush stdout 缓冲区。
我的测试ubuntu 12.04 还是8个。是不是应该是10个?
讲的非常好,对于我这种菜鸟收货很大
fock拷贝父进程的一切把?@Crazybaby
我也被问到过这个题目,也写了一篇分析,不过没有这么多图示:
http://www.shentar.me/%E5%85%B3%E4%BA%8Efork/
也是实际运行了代码之后才能理清楚。
请问你哪来的机器?@FATman
为什么i=0的时候,子进程没有复制父进程在缓存里面的东西呢?
我记得“一次调用,两次返回”的说法并不准确,fork只能返回一次,也就是父进程的返回。至于 子进程,其实是在创建进程完毕后,将EAX寄存器设置成了0,看上去好像是“返回”了0,但是这不是return的操作。
mark一下,还的细细琢磨啊~~
求教。我有一段代码关于vfork的来自于aupe,但是在我的ubuntu下执行结果很奇怪。理论var值会打印89,但是gcc 4.8.1在开了O2优化后打印出88(不开优化能得到正确结果),glob变量一切正常,都是输出7,符合预期。
讲解得很生动,学习了!
楼主解释的不对吧,尤其是最后一幅图画得不对。最后一共4个进程,每个进程结束时输出两个 – ,什么叫“导致多次输出“呢?
棒!!!
受教了。
ubuntu10.04+gcc环境测试代码。
输出:
–终端提示符$——
不仅仅8个,而且是先2个后6个,为什么?
@tricky
能不能告诉我./a.out >tmp 运行时事输出8个?
为什么执行结果是:
before fork()
child process: pid is 17244, my parent pid is 15839
child process: foo1 is 2, foo2 is 3
parent process: pid is 15839
parent process: foo1 is -1079005816, foo2 is -1218256081
before fork()
child process: pid is 17245, my parent pid is 15839
child process: foo1 is 2, foo2 is 3
parent process: pid is 15839
parent process: foo1 is -1079005816, foo2 is -1218256081
before fork()
…..
…..
子进程虽然不显示调用exit,但是它会退出的(我理解相当于exit),这里有什么区别么?
好像父进程又从一开始重复执行,这是为什么?
谁能解释下,程序如何执行的?
谢谢!
你这图用啥画的?
我尝试输出每一个进程的pid,发现结果:4220A 4220A 4220A 4222A 4221A 4221A 4221A 4223A
按照理论分析应该是每个进程有两次输出
所以很是疑惑,求助
第一次懂了fork 多谢
Awesome!!!
Good!
太牛了