进程的创建

在 UNIX 系统中，用户创建一个新进程的唯一方法就是调用系统调用 fork。调用 fork 的进程称为父进程，而新创建的进程叫做子进程。系统调用的语法格式：


	pid = fork();

在从系统调用 fork 中返回时，两个进程除了返回值 pid 不同外，具有完全一样的用户级上下文。在子进程中，pid 的值为零。在系统启动时由核心内部地创建的进程0是唯一不通过系统调用 fork 而创建的进程。

核心为系统调用 fork 完成下列操作：

为新进程在进程表中分配一个空项。
为子进程赋一个唯一的进程标识号 (PID)。
做一个父进程上下文的逻辑副本。由于进程的某些部分，如正文区，可能被几个进程所共享，所以核心有时只要增加某个区的引用数即可，而不是真的将该区拷贝到一个新的内存物理区。
增加与该进程相关联的文件表和索引节点表的引用数。
对父进程返回子进程的进程号，对子进程返回零。

理解系统调用 fork 的实现是十分重要的，因为子进程就象从天而降一样地开始它的执行序列。

下面是系统调用 fork 的算法。核心首先确信有足够的资源来成功完成 fork。如果资源不满足要求，则系统调用 fork 失败。如果资源满足要求，核心在进程表中找一个空项，并开始构造子进程的上下文。


算法：fork
输入：无
输出：对父进程是子进程的 PID
	  对子进程是0
{
	检查可用的核心资源
	取一个空闲的进程表项和唯一的 PID 号
	检查用户没有过多的运行进程
	将子进程的状态设置为“创建”状态
	将父进程的进程表中的数据拷贝到子进程表中
	当前目录的索引节点和改变的根目录(如果可以)的引用数加1
	文件表中的打开文件的引用数加1
	在内存中作父进程上下文的拷贝
	在子进程的系统级上下文中压入虚设系统级上下文层
		/* 虚设上下文层中含有使子进程能
		 * 识别自己的数据，并使子进程被调度时
		 * 从这里开始运行
		 */
	if (正在执行的进程是父进程) {
		将子进程的状态设置为“就绪”状态
		return (子进程的 PID)			// 从系统到用户
	}
	else {
		初始化计时区
		return 0;
	}
}

我们来看看下面的例子。该程序说明的是经过系统调用 fork 之后，对文件的共享存取。用户调用该程序时应有两个参数，一个是已经有的文件名，另外一个是要创建的新文件名。该进程打开已有的文件，创建一个新文件，然后，假定没有遇见过错误，它调用 fork 来创建一个子进程。子进程可以通过使用相同的文件描述符而继承地存取父进程的文件(即父进程已经打开和创建的文件)。

当然，父进程和子进程要分别独立地调用 rdwrt 函数，并执行一个循环，即从源文件中读一个字节，然后写一个字节到目标文件中区。当系统调用 read 遇见文件尾时，函数 rdwrt 立即返回。


#include <fcntl.h>

int	fdrd, fdwt;
char	c;

main(int argc, char *argv[])
{
	if (argc != 3) {
		exit(1);
	}
	if ((fdrd = open(argv[1], O_RDONLY)) == -1) {
		exit(1);
	}
	if ((fdwt = creat(argv[2], 0666)) == -1) {
		exit(1);
	}

	fork();
	// 两个进程执行同样的代码
	rdwrt();
	exit(0);
}

rdwrt()
{
	for (;;) {
		if (read(fdrd, &c, 1) != 1) {
			return ;
		}
		write(fdwt, &c, 1);
	}
}

在这个例子中，两个进程的文件描述符都指向相同的文件表项。这两个进程永远不会读或写到相同的文件偏移量，因为核心在每次 read 和 write 调用之后，都要增加文件的偏移量。尽管两个进程似乎是将源文件拷贝了两次，但因为他们分担了工作任务，因此，目标文件的内容依赖于核心调度两个进程的次序。如果核心这样调度两个进程：使他们交替地执行他们的系统调用，或甚至使他们交替地执行每对 read 和 write 调用，则目标文件的内容和源文件的内容完全一致。但考虑这样的情况：两个进程正要读源文件中的两个连续的字符 "ab"。假定父进程读了字符 "a"，这时，核心在父进程写之前，做了上下文切换来执行子进程。如果子进程读到字符 "b"，并在父进程被调度前，将它写到目标文件，那么目标文件将不再含有字符串 "ab"，而是含有 "ba"了。核心并不保证进程执行的相对速率。

再来看看另外一个例子：


#include <string.h>

char	string[] = "Hello, world";

main()
{
	int	count, i;
	int	to_par[2], to_chil[2];		// 到父、子进程的管道
	char	buf[256];

	pipe(to_par);
	pipe(to_chil);

	if (fork() == 0) {
		// 子进程在此执行
		close(0);		// 关闭老的标准输入
		dup(to_child[0]);	// 将管道的读复制到标准输入
		close(1);		// 关闭老的标准输出
		dup(to_par[1]);		// 将管道的写复制到标准输出
		close(to_par[1]);	// 关闭不必要的管道描述符
		close(to_chil[0]);
		close(to_par[0]);
		close(to_chil[1]);
		for (;;) {
			if ((count = read(0, buf, sizeof(buf)) == 0)
				exit();
			write(1, buf, count);
		}

	}

	// 父进程在此执行
	close(1);		// 重新设置标准输入、输出
	dup(to_chil[1]);
	close(0);
	dup(to_par[0]);
	close(to_chil[1]);
	close(to_par[0]);
	close(to_chil[0]);
	close(to_par[1]);
	for (i = 0; i < 15; i++) {
		write(1, string, strlen(string));
		read(0, buf, sizeof(buf));
	}
}

子进程从父进程继承了文件描述符0和1(标准输入和标准输出)。两次执行系统调用 pipe 分别在数组 to_par 和 to_chil 中分配了两个文件描述符。然后该进程执行系统调用 fork，并复制进程上下文：象前一个例子一样，每个进程存取自己的私有数据。父进程关闭他的标准输出文件(文件描述符1)，并复制(dup)从管道线 to_chil 返回的写文件描述符。因为在父进程文件描述符表中的第一个空槽是刚刚由关闭腾出来的，所以核心将管道线写文件描述符复制到了文件描述符表中的第一项中，这样，标准输出文件描述符变成了管道线 to_chil 的写文件描述符。父进程以类似的操作将标准输入文件描述符替换为管道线 to_par 的读文件描述符。与此类似，子进程关闭他的标准输入文件(文件描述符0)，然后复制 (dup) 管道线 to_chil 的读文件描述符。由于文件描述符表的第一个空项是原先的标准输入项，所以子进程的标准输入变成了管道线 to_chil 的读文件描述符。子进程做一组类似的操作使他的标准输出变成管道线 to_par 的写文件描述符。然后两个进程关闭从 pipe 返回的文件描述符。上述操作的结果是：当父进程向标准输出写东西的时候，他实际上是写向 to_chil--向子进程发送数据，而子进程则从他的标准输入读管道线。当子进程向他的标准输出写的时候，他实际上是写入 to_par--向父进程发送数据，而父进程则从他的标准输入接收来自管道线的数据。两个进程通过两条管道线交换消息。

无论两个进程执行的顺序如何，这个程序执行的结果是不变的。他们可能去执行睡眠和唤醒来等待对方。父进程在15次循环后退出。然后子进程因管道线没有写进程而读到“文件尾”标志，并退出。

如果您对本文有任何意见和建议，请给 Wilbur Lang 写信。如果您自己有什么文章要发表，也请写信。任何反馈意见都非常欢迎。