C#首席架构师Anders Hejlsberg访谈

采访 John Osborn  翻译 荣耀

本文翻译时间较早。欢迎指出任何误失。谢谢。

7月,O’Reilly编辑John Osborn参加了微软职业开发者大会。其间,他对著名的工程师、微软.Net框架C#语言首席架构师Anders Hejlsberg进行了采访。Anders Hejlsberg因设计PCs上最早的语言之一 — Turbo Pascal而广为人知。他将Turbo Pascal许可给Borland公司,后又率队创建了Delphi — 一个极为成功的可视化的client/server应用设计工具。访问时在座的还有微软C#产品经理Tony Goodhew和O'Reilly的Windows编辑Ron Petrusha。

Osborn:我已经看到一些关于C#(发音为See sharp”)的新闻故事,并注意到有很多似乎倾向于这样的观点(或从理论上说):C#不是Java的克隆就是Java的微软替代品。如果您来做宣传的话,您希望人们怎么评论这门语言?

Hejlsberg:首先,C#不是Java的克隆。在设计C#期间,我们考察了很多种语言。我们考察了C++,我们考察了Java,我们考察了Modula 2、C,我们还考察了Smalltalk。很多语言都有我们感兴趣的相同的核心思想,比如深度面向对象、简化对象等等。

C#和这些别的语言尤其是Java之间的关键不同点在于:它非常接近C++,在我们的设计中努力使然。C#从C++直接借用了大多数的操作符、关键字和声明。我们还保留了许多被Java抛弃的语言特性。为什么Java中没有枚举,道理何在?我的意思是,抛弃它们是基于何种理论基础?在C++中,枚举显然是一个很有意义的概念。在C#中,我们保留了枚举并同样使其类型安全。并且,枚举不只是整型,它们实际上是从.NET基类库里的System.Enum派生下来的强类型的值类型。如果没有进行 转型,那么枚举类型foo和枚举类型bar不可互换。我认为这是个重要的差异。我们还保留了操作符重载和类型转换。另外,C#名字空间的整体结构也非常接近C++。

但是,超越这些传统的语言论题,我们设计语言的一个关键的目标是使C#面向组件。我们向语言自身加入了编写组件时所需要的所有概念。例如属性、方法、事件、 特性(attributes)以及文档化(documentation)等,它们都是一等的语言成分。我们对特性所做的工作是全新且具有创新意义的,利用特性可为任何对象加入有类型的、可扩展的元数据。这在目前任何其它程序语言里都看不到。C#也是第一个合并XML注释标签的语言,编译器可以用其直接从源码中生成 具有良好可读性的文档。

另一个重要的概念是我所说的“一站式软件”。一旦你用C#写代码,你就一体化地写了一切。不再需要头文件、IDL文件、GUIDs和复杂的接口。因为它是自包容的单元,所以,一旦你能够以这种方式编写自描述的代码,你就可以将软件嵌入到ASP页面或植入各种不同的环境,这在以前是不可能的。

让我们再回到关键的组件概念。语言是否应该支持属性或事件,业界有很多争论。没错,我们是可以用方法表达这些概念。我们可以使用诸如get或set之类的程序块命名模式, 来模拟属性的行为。我们可以用接口和实现接口的适配器并转发到对象。这都是可以实现的,正如同可以在C语言里进行面向对象编程一样。只是它更加困难,需要更多手工劳动,为了真正表达你的思想,你最终不得不去做所有的工作。我们认为是时候了,应该有门语言使得创建组件变得容易些。最近几年来,开发人员在创建软件组件。他们并不是创建整个应用或整个类库。每个人都是在创建从宿主环境提供的基组件继承下来的组件。这些组件 覆写一些方法和属性,处理事件,并将组件安装回系统。树立这些概念是关键的第一课。

Osborn:最近您在介绍C#时,第一张幻灯片上面写着:“C/C++家族里第一个面向组件的语言”。

Hejlsberg:是的。这是我的首要目标之一。我们谈论一切如何都是对象,这也非常关键。以前象Smalltalk和Lisp语言都可以这么做,但代价高昂。我认为C#包含一些优美有趣的创新,例如装箱和拆箱的概念,以使得组件开发容易些。装箱可以使一个值类型的值转换为一个对象,拆箱可以使一个对象转换为一个简单类型的值。这在以前或许也有,但我们把它应用于语言的方式是一种优美的创新。

我们努力避免“象牙塔”式地设计C#和.Net框架。我们承受不起重写所有的软件的负担,业界也负担不起,特别是今天我们正转移到Internet时代。你要善于利用你已经拥有的。所以,我认为互操作 能力也是关键的。我们致力于为程序员提供所有符合Internet标准、可互操作的恰当解决方案,例如HTTP、HTML、XML以及业已存在的微软技术。所以你不会有如坠深渊的那一刻 — 发现新的.NET框架下没有提供你用的一些东西,或者当你意识到你想利用一些已经存在的API或组件的时候。你已经看到我们已把所有COM互操作能力内建入语言和通用运行时;你已经看到可以使用DllImport特性导入 现有的DLL;你已经看到即使那些都不能遂你所愿,我们也有非安全代码的概念。非安全代码允许你编写使用指针的内联C代码,可以做不安全的转型操作,可以抑制内存从而使其不会被意外地垃圾收集。

关于非安全代码有很多争论,人们似乎认为我们是在吸毒或是在干什么别的坏事,我认为这是个误会。代码不会仅仅因为标记了unsafe就表示它不受管制。当然,我们不会扔出不安全的指针使人们容易 遭受从Internet下载而来的非安全代码的攻击。非安全代码被深深地约束在安全系统里。我们提供这样的弹性:1.呆在托管代码箱里完成工作而不会坠入深渊;2.转入一种不同的语言使用一种不同的编程模型编写本地代码。如果你停留在这个箱子里,我们会使代码更加安全,因为系统知道它要干什么。事实上,即使你编写 非安全代码也并不意味着你离开了托管空间。所以说,非安全代码会变得更加能干。

Osborn:请多给我讲一些在托管环境里处理非安全代码的机制。

Hejlsberg:好的。描述托管运行环境比如Smalltalk、Java和.NET通用语言运行时一个重要特征是它们提供了垃圾收集机制。为了提供垃圾收集机制,至少要提供一个现代的垃圾收集器,一个“标记和清扫”垃圾收集器,比起传统非托管代码来说,你必须更多地了解正在执行的代码。为了找出要排除的死对象,你必须能遍历堆栈,找到所有活动的根,并指出哪些对象是活动的哪些是不再被访问的。然而,为了能够达到这个目标,你必须和你 所执行的代码紧密协作。代码要具有更好的描述性,它要告诉你它是怎么分布在堆栈里的,它的局部变量在什么地方,等等。

当你在C#中编写不安全代码时,你可以做不是类型安全的事,比如指针操作。当然,标记为unsafe的代码并非绝对执行在不可信任的环境中。为了使之执行,你必须授予信任,否则,代码将不会执行。从这一点来看,和其它本地代码并无区别,真正的区别是它们仍然运行在托管空间里。你编写的方法有一个描述表,它告诉你哪些对象是活动的,因此,不管什么时候你进入这些代码,你都不必跨越列集边界(marshalling boundary)。否则,当你进入非描述性的、非托管代码(比如通过Java本地接口),你就不得不在堆栈上设置一个水印或设立一个屏障。你必须重新列集所有箱子外的参数。一旦开始使用对象,你必须对你 所触及的东西小心翼翼,因为GC仍然在另一个不同的线程里运行。如果你不使用一些隐晦的方法锁定对象从而正确地抑制垃圾收集器,它就可能会移去对象。如果你忘记那么做,那你将 可能会交上霉运。

我们采用了一种不同的方式。我们说过,“让我们将这些东西集成到语言中去。让我们提供声明,例如fixed声明,它可以让你抑制对象,以和GC协作并集成之。”采用这种方法,我们提供最佳方式,带领所有已经存在的代码一起向前,而不是简单地将它们抛弃。这是一种不一样的设计方式。

Osborn:因此,你们处理的非安全代码的内存,实际上是在垃圾收集器的监视之下?

Hejlsberg:没错,是这样的。但是,就象所谓的“购者自慎,不包退换”一样,它并不安全。你可以获取指针并做错事,当然,你在本地代码里也能干同样的错事。

Osborn:我认为另一个容易混淆的地方,是理解C#在哪儿止步以及通用运行时从哪儿开始。与它从通用运行时库得到的相比,C#语言自身的创新有哪些?

Hejlsberg:好的,我想这个混淆来源于这样一个事实:当人们谈论Java时,他们并不真的知道哪个是语言哪个是运行时。当他们谈论Java时,他们到底指的是什么?Java,语言?Java,语法?还是Java,平台?人们将这些不同的方面混为一谈。我们的方式表明我们想成为一个多语言的平台。我们将创建一个平台,它允许你进行多语言编程,并且共享一套公共的API。让我们承认这一点,一些人喜欢用COBOL编程,一些人喜欢用Basic编程,一些人喜欢用C++,还有一些人将会喜欢用C# — 我希望如此。但是,我们不会试图告诉你,忘记你曾经做过的所有的事情吧,我们不会说,“现在只有一种语言,在这个竞赛中将不会有进一步的创新了”。我们说业界因为弹性而友好。Java是怎么来的?它的出现是因为 在它之前已经存在一些编程语言,而在它之后还将会出现一些编程语言。我们想打造一个平台,在此,你可以偏爱某种语言但不会否定整个价值取向;我们想打造一个平台,它可以是不断革新的。今天谁在帮助COBOL程序员?又是谁将他们带入WEB?只有在.NET平台上你才可以把富士通COBOL嵌到ASP页面中。我的意思是,它真正是革命性的 !

Osborn:假定.NET平台支持多种语言,那为什么选择C#而不是Visual Basic、C++甚至COBOL?是什么使C#如此引人注目?

Hejlsberg:首先,C#可以使我们从一张白纸开始。也就是说,我们没有任何向后兼容的负担。这显然会使事情简单些,无论从是从实现的立场还是从使用的立场都是这样。 举个例子,在C#中,我们只有一种class,并且总是被垃圾收集。而另一方面,托管C++有两套,因为它要保留非垃圾收集风格的程序设计。因此,在C#中, 你只需要理解一些简单的概念。

语言是一个有趣的东西,它是一种口味;语言又是一件严肃的事情,它是程序员选择的一种生活方式。我的意思是,我们意识到我们不能走出来说,“这儿有个平台,你只可以使用一种语言。”即使在那个平台上用一种语言可以干所有的事情,人们可能还是不喜欢它的语法,他们可能喜欢大括号或者一些别的程序块分界符。那是他们 所熟悉的。那是使他们感觉舒服并富有生产力和能力的。我们对待C#的方式仅仅是为认为语言太复杂的C++程序员和认为丢失了一些C/C++语言特性的Java程序员提供一个替代品。我们寻求一个简化C++的方式并投入到一个多语言平台中,它提供更大的互操作 能力,并且提供完备的组件概念等。

Goodhew:一件有趣的事情来自于我们对开发者跟踪调查,60%以上的职业开发人员使用两种或更多的语言去创建他们的应用。特别是当我们问他们都用哪些开发工具的时候,我们得到的答案是:没有哪一种面向对象的语言会是终结者且所有程序员都使用它。正如Anders早先所说,人们期望某种能够满足他们所做的 事情或他们的感觉的语法。这是一种个人选择,这也是整个.NET平台所关心的 — 提供给开发者一个语言实现选择。我想我们做了件漂亮的工作。你基本上可以在Visual Basic.NET和C#中做同样的事情。Visual Basic对于大多数程序员来说仍然是易于接受的。C#则具有更多的活动空间并且比VB更富威力。

Osborn:这意味着在C#中可用更少的语句实现更多的东西?

Hejlsberg:是的。意味着凭借非安全代码你可以获得更多的能力。

Osborn:也就是说,不能在VB中编写非安全代码?

Hejlsberg:是的。不可以。

Goodhew:不过基本上两种语言可以做同样的事。和Visual Studio 6相比,这是一个根本性的改变。在Visual studio 6.0中,如果想创建多线程MTS对象,并且你是一个VB程序员,你就没招。你不得不使用C++。现在,有了.NET框架,你就可以使用任何一种 自己喜欢的语言。

Hejlsberg:这就是我在一般会议谈话里说过的,.NET框架提供一致的编程模型。在语言和框架的进化过程中,我们似乎一贯都是把一种程序语言绑死在特定的API和特定的编程方式上。VB是快速应用开发工具;MFC是子类化的方式;ASP则 将东西塞到Web页面中。在每一种情况下,你对编程模型的选择总是决定了你对程序语言和可用的API的选择。每当你变换编程框架时,都会增加学习新语言和API的负担。我们真正试图统一这一切,我们提供一套API,一套支持可视化设计的工具,我们还提供“可以任选一种适合你 自己的语言”的弹性。

Osborn:我不知道这对那些使用象VBScript和Jscript脚本语言的人们有什么用?

Hejlsberg:NET框架中奇妙的事情之一是使脚本语言能被编译。看看ASP+(译注:今天称为ASP.NET),实际上现在在你的页面里运行的是真正编译过的代码,它不是迟绑定的、调度查找的(如果用户没有点击页面,你就不会看到运行时错误)。ASP+开发者可以使用Visual Basi.NET完全的威力而不是VBScript,并且第一次,如果他们愿意,他们可以选择Perl、Python或其它流行语言。

Petrusha:服务端的JavaScript现在也能被编译?

Hejlsberg:是的,没错。

Goodhew:.NET框架使得使用脚本语言就象 使用具有完全特性的语言一样,因为它们现在访问的是一个真正的编程框架,并且访问的是同一基类API。你应该看看搞JScript实现的伙计们都已经完成了什么。所以说,.NET平台提供了一个通用语言框架,这对脚本编写者具有极大的好处。

编注:JScript是微软对ECMA 262语言规范(ECMAScript 版本3)的实现,其中只有一些很小的例外(为了保持向后的兼容性), 它是对ECMA标准的完整实现。

Osborn:我们已经讨论了关于Java、C++和脚本语言。在PDC上,我听到很多人争论.NET IL(IL是微软中间语言,所有编译器都必须产生它以运行在.NET框架上)和运行于Java虚拟机中的Java字节码没什么两样。从 您的谈话中,显然您并不同意这一点。您介意进一步评论它们之间的区别吗?

Hejlsberg:我当然不同意这种说法。首先,ILs的思想是一种非常老的思想了。你可以将这个概念追溯到UCSD Pascal p-machine(一个早期的个人计算机Pascal实现)或者Smalltalk。P-code曾被Basic和Visual Basic使用。Word的一些部件内部使用p-code引擎,因为它更精简。所以,p-code根本就不是什么新玩意。

我认为我们使用的IL的方式对此感兴趣:我们给你一个选择,如果你愿意,你可以控制将IL编译或翻译为本地代码的时机。实际上,使用Managed C++,你可以直接从源程序生成本地代码。Managed C++还可以生成IL,就象C#和VB那样。当你安装代码时,我们给你一个编译选项,可以把IL编译成本地代码。因此,当你运行它们时,就不会有即时编译负担。我们还为你提供了一个动态运行和编译代码的选项:即时编译。有了IL,就给你带来了很多便利,比如它提供了这些能力:移植到不同的CPU架构,引入真正的类型安全,并在此之上构建安全系统。

我认为我们的IL设计和Java字节码关键区别在于,我们做出了超前的决定:不用解释器。我们的代码永远本地运行。因此,即使产生IL,你也从来都不会运行解释器。我们甚至还提供了不同风格的JITs。对于.NET精简框架 ,我们提供了EconnoJIT,就象我们称呼它的一样,它是一个非常简单的JIT(编注:NET精简框架是.NET框架的一个子集,是为移植到其它设备和平台而设计的)。对于桌面版,我们有完备功能的JIT。我们甚至 提供了可以和我们的C++编译器共用一个后端的JIT。不过,这都会比较耗时,因此你只应该在安装时使用它们。

一旦你做出偏向于执行本地代码而不是解释代码的决策,它就会强烈地影响IL的设计。它改变了应该包括那些指令,应该包括哪些类型信息,以及它应该如何表达。如果你仔细看看两种IL(译注:即.NET IL和Java字节码),你就会注意到它们很不一样。从某种意义上讲,我们的IL是类型中立的。指令里没有指定参数类型的信息。进一步来说,它是靠已经压栈的东西推断出来的。这种方式使IL更为精简。无论如何,一个JIT编译器需要知道那些信息,没有理由在指令里携带它们。所以,我们最终做出了不一样的设计决策,这使得容易把IL翻译成本地代码。

Osborn:解释方式和您描述的方式有何不同?

Hejlsberg:解释器的核心是一个循环:从p-code流取得一些字节,然后进入一个大大的switch语句,“哦,这是ADD指令,因此它到这儿来,但这不是…”,等等。

解释器模拟CPU。我们反其道而行之,我们只处理一遍,我们总是处理一遍,把指令翻译为机器码。现在,在EconoJIT的情况下,机器码实际上非常简单,它只创建一个调用和压栈指令的列表,并且调用运行时辅助器,然后运行时辅助器引发这个列表。当然,这个代码比解释的代码执行得快。

Osborn:让我用一句话来总结一下:你们完全编译代码。因此当你编译完时,比特(bits)已经完全准备好运行了,尽管从IL翻译成机器码的时机可能不一样。

Hejlsberg:是的。但是,如果是在一个内存受限的小设备的环境里,运行完就可将代码丢弃掉。

Osborn:让我们进入语言的语法细节。我在想,C#是否包括对正则表达式的内建支持。我没有在语言参考中看到它,或许它可能在别的什么地方吧。

Hejlsberg:首先,在基类库里有一个正则表达式类。我们并没有在语言里加入对正则表达式的任何直接支持,但实际上我们有些非常类似的特性。并不值得对它们做重大的处理 ,不过举个例子,我们给你这个能力,当你需要指定一个字符串字面量时无需每次写两个反斜杠。当你写正则表达式时,并且当你的正则表达式中引号还套着引号时,它实际上有很大的帮助。虽然就总体而言,这点帮助不足挂齿,但显然其核心 居于.NET框架之中,而这个框架可以被任何编程语言共享。

Osborn:C#和Java名字空间看起来不同。它们是否概念相同而实现上不同?

Hejlsberg:概念上是的,但在实现上差别很大。在Java里,包的名字也是物理意义上的东西,它指示了你的源代码文件的目录结构。在C#中,物理包和逻辑名称完全独立,无论你如何称呼你的名字空间,它都和你的实际代码的物理包不相关。这就 带给你更多的弹性 — 将物理上分布的单元包装在一起,并且不强迫你建很多的目录。在语言自身,有一些很明显的区别。在Java里,包也是你的物理结构,因此,Java源文件必须 位于正确的路径中,并且只能包含一个公有类型或者一个公有类。因为C#没有那种物理和逻辑上的绑定,所以你可以任意命名你的源文件。每一个源文件都可以被多个名字空间使用并可以带有多个公 有类。进一步而言,假如你喜欢,你可以把所有的源码写在一个大文件里,或者可以把它们分散到的小文件中去。从概念上讲,C#编译时发生了什么呢?你给编译器提供了所有构成你的项目的源文件,然后它只管前进并指出该干什么。

Osborn:我有一个关于泛型编程的问题:您认为它是个重要的概念吗?它应该成为面向对象语言的一部分吗?如果是的话,你们把泛型编程加 入C#的计划如何?

Goodhew:唔,在第一个版本里纳入泛型编程的愿望受到了限制。因为并不象每一个人以为的那样,微软并没有无限的资源。对于在这第一个版本里该有些什么东西,我们不得不做出一些困难的决定。

Osborn:有多少人参与开发C#?

Hejlsberg:语言设计组由4个人构成,编译器组由另外5名开发人员构成。

Petrusha:框架呢?

Hejlsberg:那就多了,整个公司都被卷进来了。

Goodhew:就整个Visual Studio和.NET平台团队而言,我们的部门大概有千人左右。包括程序管理人员、开发人员、测试人员,包括所有构建函数、框架、运行时、ASP编程模型的人员以及其它所有的人,比方说,我自己 — 管理层的。

Hejlsberg:就你刚才所说的泛型方面,我明确地认为它是个非常有用的概念。你当然可以列举出发生在学术界和业界所有的泛型研究。模板是该问题的一种解决方案。在我们内部讨论中,我们决定要在新平台里做这件事情。但我们真正喜欢做的 ,是让泛型能够被底层的运行时所理解。这和如何创建泛型原型是不同的。使用Java的“擦除”概念,系统里没有真正的泛型信息。如果通用语言运行时理解泛型的概念,多种语言就可以共享这个功能。你可以在一个地方用C#编写一个泛型类,别的人用别的什么语言也可以使用它。

使泛型成为运行时的一部分,还可以使你能够更有效率地做某些事情。泛型实例化的最理想的时间是在运行时。如果用C++,模板的实例化发生在编译期,你有两种选择:听任你的代码膨胀 ,或者试图在链接时去除掉一些膨胀代码。但是,如果你有多个应用,你可能会忘记这一点,你将只能得到膨胀的代码。

如果把泛型的知识纳入通用语言运行时,那么,运行时就可以理解:当一个应用或组件请求一个Foo list时,它首先会问:“我已经有了一个实体化的Foo list了吗?”如果是,就用那一个。实际上,如果Foo是一个引用类型,并且我们设计得当的话,我们可以让所有引用类型共享一个实 例。对于值类型,比如整型和浮点型,我们可以为每一个值类型创建一个实例,但这应该在应用请求时才做。为了把泛型加入运行时,我们已经做了大量的设计工作和必要的基础性工作。

你先前提到的关于IL的东西是有意思的,因为加入泛型的决定影响了IL的设计。如果IL指令嵌入类型信息,比方说,假如一个Add指令不再是个Add了,而是一个整数Add或是浮点数Add或是一个双精度数Add,你就把类型信息硬加入到了指令流里,在这一点来说,IL不是泛型的。我们的IL格式实际上是真正的类型中立的。并且,为了保持类型中立,我们可以迟些时候加入泛型且不会给我们带来麻烦,至少不会太麻烦。这也是我们的IL和Java字节码看起来不一样的原因之一。我们IL类型中立。Add指令可以加栈顶的任何两个东西。在泛型世界,当它被实例化时,它可以被转换成不同的代码。

Osborn:所有.NET语言都可获得泛型能力吗?

Hejlsberg:是的。微软剑桥研究院已经创建了一个支持泛型能力的通用语言运行时和C#编译器的版本,我们正在研究如何尽快使其前进。第一个版本是不可能加入泛型了,我们知道的就这么多。但是我们正在工作,以确保我们在第一个版本里做了正确的事情,从而使泛型可以适用于整个蓝图。

Osborn:C#和.NET框架以及Visual Studio的下一个版本计划发行日期是?

Goodhew:唔,我们为来这儿参加PDC的6500名人员带来了技术预览版。我们希望2000年秋季的某个时间发布beta版,然后在准备好以后,我们 就发布正式版。我们所做的一件真正令人激动的事情是看看Windows2000发行版发布进行的如何,以让关键客户参与到合作开发和合作部署的进程中来。关于.NET框架和Visual Studio.NET,我们将再次和客户协作,以决定最终产品的发行日期。我们打算让他们告诉我们什么时候产品该就绪了。因为有真正的客户参与到这个进程中来,我们应将获得更好的产品质量。这种做法不利的一面是使产品开发和发布的进程有点不确定 ,但这是一种根本性的改变。我们正在寻找一种打破质量障碍的产品发行方式,而不仅仅是挑一个武断的日期,说我们要发货了。

Osborn:因此,不是一个代码完成的日期,我们正在寻找一个“准备出发”的日期?

Goodhew:是的,没错。我认为开发者将会发现Visual Studio.NET发行版是微软历史上最高质量的发行版本之一。

Osborn:你们已经把C#提交给ECMA。标准化真的是一个严肃的目标吗?您希望在其它平台上也可使用C#吗?

Hejlsberg:的确如此!把C#作为一个可能的标准提供给业界当然是我们的目标,这也是我们把它提交给ECMA的原因之一。在引导这个有着通用基础设施的通用设计的语言的进程中,我们当然希望得到ECMA的支持。关于通用基础设施,我的意思是指这个规范所规定的一套核心类库,如果其它公司使用其它平台实现它,他们有理由期望可以在他们的程序里利用这些类。

Goodhew:我想指出的是我们正和ECMA一起制定真正的开放标准。当ECMA为C#和通用语言基础设施达成标准后,在ECMA的版权和许可政策下,真正的开放将可实现。任何客户、任何人都可以 被许可ECMA C#标准,子集之,超集之,并且无需付版税。他们可以在任何平台或设备上实现之。我们完全希望人们那么做。这和我们的竞争者根本不同,他们徘徊在标准之外,寻找某某人去为他们私有语言贴上印花。

John:我在早餐和午餐时听说:“假如微软没有把COM搞到基础设施中去,平台会具有多么真正可能的可移植性啊!”

Hejlsberg:完全可能。COM并非C#和通用语言基础设施标准化之必须。根本不是。C#有一个完备丰富的类模型,而COM则是从另外一个视角看待应用的互操作性。但是,C#和通用运行时的核心中从未说过必须要有COM、GUID、HRESULT、AddRef或Release等等。一个都没有。.NET通用语言运行时彻底摒弃了COM,但它还是给了你巨大的COM互操作能力。鉴于先前所述,我仍然认为它将非常重要,但绝非不可或缺。

Goodhew:我认为这些评论起因于我们公开的最初版本的语言规范。微软在某次会议上把它写进了规范。在那次会议上,我们认为按照微软平台来说这是非常重要的。结果,我们在规范里多次引用COM和DLL这样东西。DLL是如何在 既有平台上激活本地代码更多的一般性问题中的一个特例。对于纳入标准化组织以及和象IBM的人(我们和他们一起制订SOAP规范)协作的一个好处是,可以确保我们不做任何这样的 引用,以防止在规范的未来版本里,把我们自己绑死或锁定在象COM框架这样的东西上。

就象Anders说的那样,COM互操作能力和COM支持对我们和现有的微软客户来说是极其重要的。我认为为了在.NET上支持COM我们做了了不起的工作。但是,业界的人们已经阅读了大量的我们对COM和DLL字眼引用的东西,他们由此推论.NET平台仅仅是为Windows平台而设计的,这 是大错而特错的。

Hejlsberg:并且,我认为就象COM互操作能力对于微软和在微软平台上构建解决方案的客户很重要一样,C#和通用语言基础设施的标准化,将允许在任何其它平台上实现这门语言,以加入意义重大的平台互操作能力。

Osborn:所以您不会坚持应该有个什么“纯C#”和“纯.NET”的实现?

Hejlsberg:什么叫“纯”?真正有多少“纯”Java应用存在?我斗胆猜测一下,非常非常少 — 那就是我估计的数量。让我们承认这一点,人们希望能够利用他们已有的代码 ,不可能叫那些公司把什么东西都扔掉。

Goodhew:您和Roger Sessions交流过吗?(编注:Roger Sessions是ObjectWatch公司的总裁,并且是《COM+ and the Battle for the Middle Tier》的作者)

Osborn:没有。

Goodhew:Roger谈到了EJB(Enterprise JavaBeans)规范的相关章节,那儿讲了厂商许可扩展。毫不奇怪,厂商扩展包括诸如事务管理、安全、消息技术以及其它更多的方面,这在构建企业级系统中是相当重要的。在一篇文章[译注:http://www.objectwatch.com/issue_24.htm]里,Sessions粗略地列举了11个领域的机能,这是可容许的厂商规范实现。因此,如果你选择IBM Websphere作为你的EJB实现,你为你的EJB应用编写的代码将不可避免地把你锁在Websphere上。Java是100%纯和100%可移植的概念是不真实的。在IBM的开发者工作站点上,有一个对James Gosling的伟大的专访(译注:http://www-106.ibm.com/developerworks/features/gosling/index.html)。James Gosling直接指出了这一点。他说,是的,整个“写一次到处运行”、“100%纯的东西”真是个愚蠢的念头,更多的是属于营销上东西,他说,实际上,“我们并不认为我们能够交付所有这一切,基本上,我们办不到”。这就是这 门语言发明者的说法。并不存在什么纯粹性和可移植性。

Osborn:我们有没有遗漏一些没透露的精彩的C#特性或创新,您愿意补充一下吗?

Hejlsberg:关于整个.NET框架,隐含地,也包括C#,我想提的一点是:它是构建分布式应用的手段。并非很久以前,我们创建两阶层client/server应用,然后对象协议如CORBA、IIOP、RMI和DCOM接踵而至。这种类型的编程是EJB(以CORBA或RMI为基础而实现)的基础。我们已经会构建这种强连接式的分布式系统,但它们不具备伸缩性。它们在WEB上不 可伸缩是因为它们是有状态的 — 它们在服务端保持状态,你无法切换到另一台机器,把它插入群集并让相关东西复制自身。

当初,当我们坐下来着手设计.NET框架时,我们回头看了看Web上究竟发生些了什么。它正在变成松散连接、分布式的世界。我们努力理解它对潜在的编程模型的影响。因此,我们从根本上假定分布式应用是以松散连接、无状态风格构建的,我们做出的设计可提供巨大的伸缩性 :你只管扩展。你转入更多的框架并把它们插入。一旦做出了这个根本性的假设,一切就随之改变。它改变了怎样设计你的基本服务,怎样设计你的消息技术,甚至怎样设计你的用户界面。这是一个新的编程模型。我们已经决定使用XML和SOAP作为使这个模型工作的方式。它们被深深地集成进.NET,并且这种集成对于我们在设计.NET框架时做出的每一个决策是如此核心,以至于它不是那种你只 要进来蜻蜓点水地逛一逛就可以的东西。

Osborn:您能指出一些对程序员来说明显特别的地方吗?

Hejlsberg:一个相当好的例子是XML是如何被集成到C#中的。C#中有特性(attribute)的概念,它允许你向类型和成员加入宣告性的信息。就象你可以说某个成员是公 有的或私有的一样,你可能还想说这个是事务性的,或者这个假定是个Web service,或者这个假定可被序列化为XML。因此,我们加入特性以提供一般性机制,但我们在所有Web service和XML基础设施中都用到了它。我们还给你用特性修饰类和字段的能力。在你的类中,你可以说“当这个类变成XML时,它应该变成“this”标签名,并且属于“this”XML名字空间。”你将可以指定一个字段变成一个元素,而另外一个变成一个属性(译注:attribute,此处指XML中的属性)。你还能够控制XML
的schema,在你的声明类的地方控制它,这样,所有附加的宣告性的信息就都有了。一旦以该方式正确地使用特性修饰你的C#代码,系统就可以简单地把一个特定的类转化成XML,在线上传输,当它传回时,就可以在另一端重建该对象。这都是在一处定义完成的。它不象传统的定义文件或杂七杂八的信息和命名模式,它就在那儿。当你在IDE中创建它们时,它就给了你完整的声明。我们还可以提供更高级的工具,让它帮你做这件事。

我知道我有点离题了,但我们提供的这些基础设施的确令人兴奋。单单因为有这些特性,你就可以请求XML序列化基础设施或Web service基础设施把已给出的类转换成XML。当你这样做时,我们实际上将为这个类配上XSD schema,并将创建一个专门化的解析器,它是从一般的XML解析器(.NET基类的一部分)派生下来的,并且覆写方法,向解析器加入逻辑,因此它是专门为那个
schema服务的。我们已经实例化好一个解析器,可以本地代码的速度解析XML。如果它不正确,我们将给你一个体面的出错信息,它可以精确地告诉你是什么出了问题。我们可以在代码缓存基础设施中缓存它,它将坐等直到下一次一个具有同样schema的类来临并将发生作用,“嘭!”,我的意思是,难以置信,难以置信的处理能力!

Osborn:所以,下面的确有许多有意思的引擎...

Hejlsberg:Yeah。我认为,对于在这个领域里达成此种思想,我们是领先的一代。

Osborn:精彩之至。谢谢,耽误您时间了。

Hejlsberg:不客气。