一个fork的面试题
前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:
题目:请问下面的程序一共输出多少个“-”?
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } wait(NULL); wait(NULL); return 0; }
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。
要讲清这个题,我们首先需要知道fork()系统调用的特性,
- fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
- 还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
printf("-\n");
或是
printf("-"); fflush(stdout);
就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; }
于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)
ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)
面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)
(全文完)
(转载本站文章请注明作者和出处 酷 壳 – CoolShell ,请勿用于任何商业用途)
《一个fork的面试题》的相关评论
解释的非常好!
全缓冲 行缓冲 无缓冲 APUE有详细介绍。 估计和日志奋斗过的都能记得这东西。。。
虽说APUE这东西又经典又出名,但是似乎认真看下来的人还真不多。
有收获
晕, 打开多个网页, 评论发地方了, 可以这么理解, fork把行缓冲给继承下来了.
这种面试问题…在机器上跑下不就知道…
有一个疑问。对于第三个。在第一次fork时,为什么橙色的子进程也继承了父进程的缓冲区,为什么在橙色的子进程再次被fork时,只有阴影的褐色会多一次打印。而橙色的孙进程却没有您打一次了?同樣继承呀?
^_^, printf(“/n”)?
学习了,很久没有学习C了,重闻一下
试了一下,真是8个-
不过还是想不通,即使子进程继承了父进程的stdio缓冲区,当父进程或子进程往缓冲区里面写的时候,会引发copy on write,此后父子进程各持一个缓冲区副本,照理说不应该发生多打两个- 的问题才对呀。比如下面例子:
运行以上代码,打印输出为qbaq(kernel调度子进程先运行),可见父子进程写缓冲区,不会影响到彼此。但为何文中的例子,子进程的stdio缓冲区内容会受父进程printf的影响呢?难道stdio的缓冲区是用mmap()函数,开启MAP_SHARED标志位申请的?费解
不好意思,if(id=fork()>0)那一句应改为if( (id=fork()) >0),但程序的输出结果还是一样@rookie
@rookie
知道了,i==1时fork出来的进程会继承缓冲区里头的一个-
有个问题不懂,pid(8519)也同样继承了8518的缓冲区,为什么只有pid(8520)多打印一次,pid(8519)不多输出一次呢?
今天笔试正好考了这个题目,我囧啊。。。。我之前看了,不过没确定记清楚,所以保底选了两个。以后不能这样了,一定要研究明白。
腾讯笔试!考了这两题!@winguse
但是为什么在没有输出\n的情况下,运行多次结果不一样呢?有的时候是4,6或8.
@moritz
因为那当会缓冲区里面没有任何东西,所以继承了也没有用啊。这个可以解决你的疑问吗?
呵呵,大家可以考虑一下如下代码的输出,以增加对这个的理解,多谢晧哥。
不止要知道输出多少个,并且要解释为什么,缓冲区是如何继承的。
谢谢讲解。。明白了。
“或是缓中区满” => “或是缓冲区满”
还可以往stderr输出,也不缓冲,fprintf(stderr, “-“);
原来setbuf(stdout, NULL)可以用在这种场景下:)
-, pid=4569; -, pid=4569; -, pid=4569; -, pid=4571; -, pid=4570; -, pid=4570; -, pid=4570; -, pid=4572;
输出结果父进程多输出了,为什么?
@memon
确实,较早之前看此文不能很好理解,前些日子看APUE,今晚再看,就容易理解多了。经典的书就是经典,回去好好读。
校园招聘不会出这样的题吧。。。。。好难
皓哥,您好,为什么我在ubuntu12.10下运行了一下,只打出了四个,真的是四个
按理说linux也是类UNIX操作系统,linux的fork应该是继承自UNIX,如果改成
再按照您说的就没有问题了,我觉得原来的题目可能没有考虑到进程的退出,如果面试题目按照原题的话,打出来应该是4个,不是6个,也不是8个
@passion
父进程那时候缓冲区里还没有内容呢。
很不错 最后那个图赞一个
考察fork,标准IO是有缓冲的。