|
东北并行结构中心(NPAC)概况
东北并行结构中心(简称恩派克)是一个专门从事高性能计算和通信的研究开发中心.该中心隶属锡腊丘兹大学,创建于1987年.自1990年以来,开发、应用并行计算机的先驱者之一:杰弗里.福克斯(Geoffrey C. FOX)博士主持恩派克的工作,此后恩派克的业务范围有了较大的发展,包括了世界级的计算科学研究和教育.最近高性能通信技术的发展工作集中在支持国家信息基础工程方面.
计算科学应用的一个重点是寻求解决真正问题的最佳途径.恩派克的信息路(InfoMall)技术传输项目把高性能计算与通信技术应用于工业界.其它主要项目还有并行语言和并行编译器的研究和发展,其中包括高性能FORTRAN:一种标准化并行的版本;分布计算;并行数据库技术;关系型数据库和国家信息基础工程的一体化;并行算法;分布计算和群集计算;网络化数字多媒体应用于提供信息,电视信号,图形,需求模拟.我们的研究项目自然地加强了新教育项目和计算科学.
资源
智力资源:恩派克的智力资源包括一批拥有各种计算和理论科学博士学位的专职技术人员、职员以及来自四个系的研究生.
恩派克高级研究人员和他们当前的主要研究项目:
M. Baker (cluster computing, benchmarking) | D. Bernholdt (Nason fellow, chemistry) |
G. Cheng (database, software integration) | P. Coddington (Web technology) |
G. Fox (Director) | W. Furmanski (Web technology) |
T. Haupt (HPF) | D. Leskiw (HPF and BMC3B) |
M. Makivic (HPF, financial modeling) | R. Markowski (HP networking) |
N. McCracken (education) | B. Mihalas (database & IS, K-12 education) |
K. Mills (education, environmental science) | M. Podgorny (HP networking and hardware) |
D. Warner (Nason Fellow; VR, telemedicine) | H. Yau (HP applications) |
经常与恩派克进行合作的教师和设施管理人员:
E. Bogucz (Dean, ECS) | S. Bossert (Dean, Education) |
S. Catterall (Physics) | A. Choudhary (ECE) |
J. Deppa (Newhouse) | C. Driscoll (Env. Eng) |
M. Eisenberg (IST) | S. Hariri (ECE) |
L. Liddy (IST) | E. Lipson (Chair, Physics) |
S. Lisson (Dir. Video Communications) | A. Middleton (physics) |
M. Nilan (IST) | S. Ranka (CIS) |
R. Small (IST) |
另外,大约还有三十个其它单位的研究项目使用恩派克的设施.恩派克价值九百万的设施包括六个中等大小的商用大型并行处理机和高性能媒体、数据库服务系统:IBM SP2,nCube2,Dec MasPar,Intel iPSC860和TMC CM5;分布计算设施有IBM, DIGITAL, SUN和Silicon图像工作站计算机群和光导纤维通信网主干;高速网络包括一个FDDI环、ISDN和ATM网.
恩派克的研究课题
恩派克以及它在锡腊丘兹和国内其它机构的合作者致力于跨学科研究、发展、教育和高性能并行计算技术的传播.在一个集中了操纵数字模拟转换和分布、协作网络工作的高性能计算和高速计算机网的新领域,恩派克已经建立了一个活跃的研究发展纲要.基本研究课题包括下列项目:
恩派克核心项目
政府和私人资助的恩派克研究项目为恩派克建立自身应用项目和对外活动所依赖的技术提供了基础.主要研究活动包括:
可移植、扩展的并行语言,如 FORTRAN 90D |
并行数据库 |
集成化软件 | 可视技术 |
万维网技术 | 数据库 — 联网信息系统一体化 |
数据流技术 | ATM和ISDN网络 |
计算机科学研究
恩派克的研究人员和所属工作人员致力于计算机科学研究以便使并行技术具有更强的实用性.研究领域包括:
并 行 软 件 | 并 行 算 法 |
物 理 计 算 | 分 布 计 算 |
高 速 计 算 机 网 | 问 题 结 构 |
神 经 元 网 络 |
计算机科学对2NASA和1NSF重大需求项目的支持
计算机科学研究
并行计算机正在取得前所未有的性能,从而使学术单位和其它团体的科学家能够解决过去无法解决的难题.在把自然科学的特殊能力和计算科学结合起来去解决计算难题方面,恩派克是先驱者.研究领域包括:
计 算 物 理 学 | 计 算 神 经 科 学 |
计 算 生 物 物 理 学 | 计 算 化 学 |
计 算流 体 力 学 | 计 算 金 融 模 拟 |
高等教育
从1990年以来,福克斯博士在锡腊丘兹大学领导开设了计算科学课程.如今在多学科领域,诸如医学、航空与航天工程、物理等学科,已经有了本科生和研究生专业.恩派克还和锡腊丘兹大学其它系一起首创了通过万维网传送的新型交互教学模式.
儿童教育
恩派克通过高性能连网技术把高质量知识来源引进教室,从而寻求机会促进儿童教育.目前的项目包括传送“生动的教学丛书”活动的优秀电视录像收藏,和传送贮藏在恩派克并可由万维网取得的更广泛的儿童教育材料.最近,恩派克正努力使孩子们能够通过计算机网进入数据库,学习环境科学和其它科学资料,并通过网络投稿.
合作
与其它学术单位的合作:恩派克是享有很高声誉的并行计算研究中心的成员之一.并行计算研究中心是一个有七家机构参加的并行处理研究联合体,参与单位包括:阿格纳(Argonne)国家实验室、加州理工学院、洛萨勒莫斯(LosAlamos)国家实验室、瑞斯(Rice)大学、锡腊丘兹大学、田纳西大学和马里兰大学.并行计算中心的研究工作提供了重要的科技成果,然后通过恩派克的信息路(InfoMall)工程与工业界共享这些成果.恩派克还与其它院校和国家实验室进行了大量的合作.
锡腊丘兹大学内部的合作:恩派克与锡腊丘兹大学的各院系在研究计划和项目方法方面保持日常合作.现在参与合作项目的有马克斯维尔公民与公共事务学院、大众传播学院、教育学院、信息研究学院、物理系,以及计算机系、航空航天系等LC史密斯工程和计算机科学学院的各系.
与工业界的合作:通过信息路(InfoMall)工程,恩派克拥有了众多工业方面的合作项目.合作范围从利用高性能计算与通信技术设计新式飞机,到运用并行计算发展新一代电子游戏.
技术传输:信息路
信息路是恩派克的技术传输项目.这个项目使恩派克的研究人员和锡腊丘兹大学的教师能在广大而复杂的工业实践中运用他们的知识,把并行计算和更广泛范围内的其它高性能计算、通信技术统一介绍给工业界.信息路还向工业界提供接近大型并行设备的机会,以及高性能计算方面的教育与培训.恩派克还有一个由政府资助的、更进一步的使命:帮助高性能计算与通信方面的小型软件企业.
信息路的工作重点
基本上,信息路象一个真正的研究发展人员,帮助它的成员和项目伙伴去发展:
并行和分布式高性能应用;
并行数据和数据采掘系统;
高速计算机网(ATM,ISDN等);
先进的网际网络(WWW)性能.
在与信息路的成员以及学校里其它杰出项目的合作中,信息路正在为银行业务、金融服务、医疗保健、保险、出版、媒体与信息服务、通信、市场与市场研究、公共事业、教育、政府和其它方面的组织,发展高性能系统和解决方案.
在锡腊丘兹大学科技中心的信息路设施为商业发展和信息技术提供了极好的试验条件.通过信息路项目,当研究者与其他成员一起创造改变现状的关键技术、商业解决方案和系统时,研究人员和工业界的用户能学到最新的技术.
主要赞助者包括:
数字设备公司(DEC) | 纽约电话公司(NYNEX) |
IBM | 罗马实验室 |
纽约州科技基金会 | 并行计算研究中心 |
恩 派 克 研 究 项 目
重大需求应用
模拟和并行算法
并行语言和编译器
并行编程工具和软件
软件集成化
纽约州计算机网ATM试验基地:纽约州信息高速公路
INFOVISION(适应需求的信息、影像、图形和模拟)
技术传输
恩派克重大需求课题的实例
双黑洞联盟—国家科学基金会(NSF)资助
这个重大需求课题联盟是由八个单位的物理学家和计算机专家组成的联合研究机构.它的目标是通过发展数字编码解决两个黑洞的3D盘旋聚结难题,这些编码对黑洞之间的聚结和发散出的引力射线进行精确、高效的描述,通过解决爱因斯坦在引力学领域的方程,直接应用于正在兴建的美国LIGO和欧洲的VIRGO引力波探测系统.
这个正在进行中的项目已经取得了一些科学成果,例如普遍相关性和高性能FORTRAN编译器的新型编码计算法,还有用于支持科学计算的并行计算机语言、消息传递技术.这个项目也为计算科学和数字相关性的研究生课程创造了模式.这个项目产出的软件库是一套整理得很好的编码,并被收入:底线软件系统(Baseline Library)、工具箱合成系统(Toolkit Components)、测试程序代码(Benchmark Codes)、参考结果(Reference Result)、终极代码(Ultimate Codes)、数据储存(Data Depository)和公共事业系统(Utilities).
高性能计算和四维数据吸收—NASA资助
影响:大型数据库的快速数据吸收需要人文状态并行硬件、软件和算法,只能用于并行设备的新数据吸收技术正在研究中.一种可供选择的并行系统,被定义为一个具有最好的性能、最可移植、最易维修和可扩展性的系统.这个系统将能满足未来数据吸收的需要.
项目描述:这个项目重点研究四维数据吸收的重大需要,以便为地球科学研究制作高质量数据集合.该项目运用多种类地球观测数据,并把这些数据综合到海洋、地表、空气,包括化学过程的模型中.数据吸收研究的最终目的是计算地球环境统一、一致、具有空间性和时间性的再现,从而为科学研究、综合提供条件.这个项目有两个主要动力:
1.并行软件、算法的领先研究成果应用及一系列现有技术的吸收.
2.只能用更强功能的计算机来实现的数据吸收方法的探索.
恩派克项目实例
罗马实验室
信息视野(INFOVISION)
信息视野(信息、影像、图形和模拟的需要)是一套具有双重用途、分布式的多媒体项目,它的原形接近于商业和政府定向的高性能计算通信应用.这些论证将会探索大多数将在不久的将来应用于国家信息基础工程的国家需求基本问题.
罗马实验室目前正在发起和资助以下涉及分布、交互、智能信息系统人文状态技术发展、论证的一系列信息视野项目:
多媒体传送协议
该项目的目的是发展一个纽约州计算机网的通信系统(NCS),以便有效地利用ATM广域网络(WAN)提供的高速频宽.纽约州网络通信系统将会成为一个高性能分布计算环境的重要子系统,利用由光导纤维共时光学网络,连接纽约州网络上的并行计算机和超级计算机,从而形成一个可视计算环境.这一高性能分布计算环境正在纽约州网络上实施.
在这一努力中,我们已经完成了如下工作:
合作和通信实验
这个项目正在发展和论证与纽约州立大学健康科学中心合作的远程医学应用.这项工作包括调查、作出共同决定所需的相应配套技术,以解决涉及的信息及用户在实际地理位置上分散的问题.该项目已经为协作领域的多媒体服务技术制作出了原形,这项远程医学实验进行了通过纽约州计算机网,使神经病学家能进行远程合作诊断的可行性论证.
在这个项目中我们已经完成了下列工作
影像需求(VOD)技术及其论证
这项工作的目的是研究发展影像需求信息服务器和网络传送系统所要求的基本技术.该项目正在定义和发展一个统一多种子系统(包括储存系统、服务系统、网络、人机界面和信息获取系统)的VOD结构.一个高性能多媒体计算、通信影像需求系统的原型正在开发中,并已经进行了一些论证.
在这个项目中,我们完成了下列工作:
恩派克项目实例
并行编译系统运行时研究联合会(PCRC)
PCRC成员:
合作系统、哈佛大学、印地安纳大学、瑞斯大学、锡腊丘兹大学、
马里兰大学、罗彻斯特大学、德克萨斯大学奥斯汀分校.
高性能语言的常用运算支持
目标
这项工作正在为公共领域的软件系统基础工程创造一个概念并编写程序.这一基础工程将为几种不同的高性能语言编译系统提供统一的运行时支持.这一研究将取得下列成果:一种可移植可扩展的多平台运行时支持系统,可交互操作的编译系统,一体化多语言支持系统,为发展高性能计算软件而改进的软件设计工具.这个软件将被用于高性能C++和FORTRAN在可扩展分布式和分布式存储结构中的运算.
方法
我们首先为高性能语言编译系统和运行时系统的界面编了一个说明,它描述了数据阵列如何被划分到分布的和共享分布存储结构中去.然后,依照上述界面说明设计和编写软件.这个软件将提供:地址翻译装置、常用计算功能、数据移动程序设定和程序设定使数据传送得以完成并最优化.这个界面说明还将用于开发新的编译系统:合作系统、印地安纳、马里兰、瑞斯、罗彻斯特和锡腊丘斯的编译系统正在被集成起来.而且,哈佛正在开发一个新的编译系统,来使用这个共同的运行时系统.高级软件工程技术正在被彻底运用着,产出的软件将被用于公共领域.下列研究和技术革新将被推出:
可移植可扩展的多平台运行时支持:当把一个共享地址空间映射到一个多处理器结构中时,高效的地址翻译支持;开发一个统一的运行时支持系统,去完成地址翻译和通信最优化—把这个建在信息传送接口之上.
集成的多种语言支持:允许不同的程序语言共享分布在一个并行系统的数据结构.开发共同的代码和数据描述符,以及操作它们的程序,从而支持数据在高性能语言中的并行化.设计一个共同的编译系统数据移动接口说明,这个说明将为编译代码(范围从很低层的利用特殊硬件特点的原语,到很高层次直接伴随共同阵列和数据结构格式)提供通信标准.
系统级测试的软件工程和共同的运行系统支持要求由多种语言构成的组成、执行和测试系统的研究方式和构造框架的发展.所以需要:开发能方便地使用、修改、说明和共同运行时系统的扩展;支持新的数据结构、新的语言特点、新的运行机制和算法以及消息传送或分布共享存储的接口.
带来可交互操作的编译系统和共同运行时系统的论证:我们将会有七个编译系统共用同一个运行时系统,并可在多种语言中使用和实验.
最新成就
1995年2月27日,设计完成了功能性说明:<<高性能C++和FORTRAN分布数据描述,v0.4>>,这是一个关于编译系统重定目标和共同运行时系统设计早期要求的定义性文件.
1995年4月21日,完成了高性能FORTRAN编译系统和共同运行时系统的界面说明—<<HPF/DDD说明>>.锡腊丘兹大学FORTRAN90D和瑞斯大学FORTRAN77D小组正在对这一文件进行考查,它将为编译系统重定目标活动提供一个共同的框架结构.
1995年6月30日,用MPI完成了现有锡腊丘兹FORTRAN90D编译系统和运行时系统的早期重定目标,这为最低层级的运行时间支持、MPI提供的功能以及它与共同运行时系统的界面论证提供了必要的基础.
除了提供传统工具以外,我们还研究了在新概念超级网络(WebWork来自锡腊丘兹大学和合作系统)的上下文角度的CRS的用途.在超级网络中CRS将被与网络前端,例如Java和以HTTP和MIME数据传输协议为基础的终端统一起来.
恩派克项目实例
儿童教育
生动的教学丛书
生动的教学丛书(原名生动的教材)是一个证实未来儿童教学先进技术的多媒体项目.恩派克和锡腊丘兹大学教育学院利用人文科学信息技术把影像、图形和文字传送到教室,从而在儿童课程中创造了交互的、需求信息系统以及它们集成体的原型.
国家信息基础工程向教室传送高带宽通信的诺言为教育改革提供了新的机会.尽管基本技术已经具备,但是在儿童教育中实施先进的信息技术还有很多障碍需要克服.生动的教学丛书项目正在建立要求人文科学状态技术的三个教育软件的应用:
与R&D以前拨给罗马实验室、ARPA、NASA和NYNEX的资金相比,恩派克能用不多的资金提供上述水平的产品.
生动的教学丛书创造了一个独特的教学环境,使教师和学生能利用多媒体信息服务器、超级计算机、并行数据库和网络试验站的杰出教育资源.生动的教学丛书可以被称为未来教育信息基础工程的原形,这个项目的基本定向是支持新教学模式的发展.
儿童计算机网
正在作为生动教学丛书的一部分被发展的儿童计算机网是学龄儿童的万维网数字化图书馆.这一项目是对万维网资源进行信息挖掘、建立“收藏的网际网络”(当地收藏在恩派克)的结果.其目的是支持集中教师选择材料和通过纽约州网络进行的高性能传送.
一些教师研究队伍对材料进行选择,从而提供价值高的材料、教师备课的高效率材料和适当的儿童材料.该计划将支持按多种资源的知识查寻能力,选择出来的儿童计算机网材料也可被制成激光磁盘提供给网际网络上网条件差的学校.
恩派克项目实例
高等教育
计算科学教育
本科生高性能计算研究实验是恩派克的一个暑假实习项目.从1991年以来,每年有十二个或更多的本科生“研究学徒”被从全国的申请学生中挑选出来.这个项目有两个主要组成部分:高性能计算和通信的集中培训和个人研究项目.
高性能FORTRAN的教学材料包括:进行计算的背景材料、FORTRAN阵列式程序设计、应用于一些科学应用的计算技术和高性能FORTRAN的指示材料.一套关于使用高性能计算、通信和网络技术进行远距离教育和变化计算的技术和方法的指导材料可以在如下地址连网取得:http://www.npac.syr.edu/users/gcf/hpdctutorial.html.
锡腊丘兹大学学术项目
计算科学学术项目把现代高性能计算机的计算技术学习与解决很多科学、工程和信息领域的实际问题结合起来.在锡腊丘兹大学,一些由各系教师、学生和研究人员合作参加的学术研究项目正在发展过程中.在教学方面,有关活动包括新的学术项目、新的课程和教学材料的发展.
CPS615 — 用于科学和工程问题的计算技术:这门课是研究生水平的计算科学(计算机对自然系统的模拟)原则介绍性课程.这门课的目的是讲授得出科学与工程问题计算解决方案所需的数学与计算机科学基本工具.基于WEB网的1995年秋季课程材料正在被改进为这学期的材料.讲演胶片、作业问题、程序实例和计算科学的网络联系,常常随着课程的进展而被更新.
CPS616 — 信息时代的计算科学:计算科学可以被广义地定义为计算机科学与计算机应用的接口原则.CPS616是一种新课型,它发挥了一般计算学课程的作用,但是目的在于与信息有关的应用,而不是科学计算.在锡腊丘兹大学,该课的学生可以来自信息研究、公共传播、行政管理、视觉与表演艺术和教育等专业.技术性专业的学生来自计算机科学、计算机工程和信息研究专业.课程材料准备好以后,将被发到网络上去.
物理105、106 — 21世纪的科学:这门物理课程的特点是正在被作为WEB页放于网上.至今为止,这些课包括“寻找外星智能”、“思维机器”和“伪科学、超自然、怀疑主义”.
CPS211 — 这门课是本科生水平的计算科学原则介绍性课程.这门课的教学目的是讲授得出科学与工程问题计算解决方案所需的数学与计算机科学的基本工具.连网课程材料包含了大部分课堂笔记.
恩派克项目实例
高级网络能力
在锡腊丘兹大学,恩派克研究人员正在研究开发把全球计算机网转变成支持世界分布计算、活跃分布信息系统和复杂通信机制的全球虚拟高级网络技术.
这一新的普遍计算环境将会:
无论用于公共网络(如网际网络)或私人网络的当代网络技术,都将会为信息和服务建成一个实际操作系统或网络视窗.利用高级网络技术和网络浏览器提供的视窗环境,商业界将能开发出简单信息交换系统,而进入一个合作、知识创造和交互式的新领域.
恩派克是这个发展过程中的领先者
恩派克具有科学计算、高速网络、并行与分布处理及其支持技术的独特条件,因此恩派克有责任开发出将万维网(包括私人网络)转变为功能强大的虚拟分布计算机的技术和应用程序.其中包括:
研究发展活动
恩派克在利用网络集成技术来构造一个完整的WEB窗口环境上,有活跃的研究发展项目.相关的工作包括:
恩派克主要项目
恩派克正在创造和定制网络浏览器接口技术,这些技术将被用于一些关键的应用,例如商业计划系统、电子商业、教育、培训与发展和医疗、社团内部使用的分布多媒体信息管理系统.主要项目包括:
恩派克项目实例
万维网数据库的存取
恩派克创立并投入使用了几种在Oracle7数据库服务器上建立万维网信息页的数据库应用.Oracle的RDBMS及其存取工具提供高复杂度信息管理环境,其优点可以被这些目前正不断改进与完善的应用充分利用.恩派克的这些数据库应用影响原型接口软件,这些软件通常认作Web-Oracle-Web或WOW,都是由Oracle认可的.恩派克的研究者在继续考察Oracle的性能,进一步开发以使其适应各种终端用户对存取信息的要求.
数据库服务器与UNIX*.html文件相比,其主要优点在于:
使用Web-Oracle-Web接口工具的实验举例:
URL位置:原型的服务器在http://kayak.npac.syr.edu:1963/
数据库服务器信息:一个简单的万维网表格可用来摘录有关万维网本身的信息.它可以被加强从而包括任何使用者和DB开发者需要了解的有关这个DB服务器的的信息,这通常由一个DBA所提供.由于所有的返回结果都直接来自查询提出时正工作着的DB服务器,DB服务器软件/结构的任何变化都会被自动反映出来.
静态表格,动态查询:一个简单的万维网表格(用来提取有关某一应用范围的信息 -- 如与传播有关的信息)是一个带有查询关键词的静态集合的静态html文件.这些返回的结果都来自一些表格,查询过程由系统利用SQL机制完成.但是由于表格万维网信息页是静态的,关键词不能反映出当前数据库中所能获取的信息.
动态表格和查询:功能性质与例2相同,但是,所有的页,包括前万维表页都由“On-the-fly”生成,也就是所有的页都是以Oracle数据库的当前内容为基础的.因此,不论什么时候,当新的一行通过一正常RDBMS插入指令进入数据库时,任何新产生的关键词将自动出现在万维网信息页上.
跟踪访问一数据库的“访问者”:对每个访问这一页的访问者,有关他的所有信息都被存储在数据库中,并且能够通过同一(动态)万维网信息页的链路显示出来.那么,用户就能够从同一页上看到这个访问者的历史 -- 增加了一个时间维! 该页上的其它子链路显示了进一步的查询.
Oracle文字服务台:通过Oracle7SQL*TextRetrieval存取一Oracle库中的完整文字文件的方式提供了许多具有先进特色的浏览大型万维网的能力,例如,stemming,fuzzymatch,soundex,邻近搜寻和概念搜寻.整整两本书的文字被存入Oracle,并且能通过万维网浏览器搜寻.
将来的能力包括:
Copyright: NPACT Lastmodified: 1997.1.20 |