1 2 3 4 5 6 7 8 9 10 11
背景资料:
·相关名词
  SMP:对称多处理器

  LTSP:Linux终端服务器项目 (Linux Terminal Server Project)

  Kernel:内核

  Ramdisk:内存虚拟盘

  Etherboot:以太启动

  Bootrom:网卡启动芯片
·大型主机(Mainframes),超级计算机(Supercomputers)和集群(Clusters)
 纵观计算机的历史,最先让人了解的就是大型主机和超级计算机,这是计算机历史的一部分,没有这些大家伙,就没有今天的
 个人电脑。这些大家伙通常是一个或几个有强大研发队伍和资金的厂商完成,最初的目的是军方或政府的需要,很多大学的
 研发也促成了这些大家伙更强大。一般情况下,大型主机和超级计算机都使用超过8个,多达上百个的CPU和自己的专用操作
 系统,计算机历史上很多的重要成员都和这些大家伙有关,IBM,DEC,Cray,SGI,HAL。大型主机已经成为历史,而超级
 计算机成了各国技术实力的争夺焦点,但是目前个人电脑的发展使集群成为竞争超级计算机的强大对手,集群的CPU数和浮点
 能力和超级计算机的差距已经越来越近。
·Cluster
 集群系统,也有成为机群和群集系统的。集群主要分为三类:容错集群(Fail-over Cluster),负载均衡集群
 (Load balancing Cluster),高性能计算集群(High Performance Computing)。容错集群是指两台主机通过两个或两个以上

 网路连接的系统,其中一个连接称为心跳线(heartbeat),利用每台主机上的服务进程监控对方主机的状态,一旦发现对方

 主机宕机或出现不能正常工作的情况,心跳线会反映给互为备份的另外一台主机,该主机则会接替出问题的主机。典型的

 使用场景是空军的雷达追踪系统。

 负载均衡集群一般用于相应网络请求的网页服务器,代理服务器。这种集群可以在接到请求时,检查接受请求较少,不繁忙

 的服务器,并把请求转到这些服务器上。从检查其他服务器状态这一点上看,负载均衡和容错集群很接近,不同之处是数量

 上更多。

 高性能计算集群是指具有响应大量计算的性能,可以作为数据中心使用的计算机的集合。比如压缩mp3,气象云图的分析等。
·集群模式
 (N)UMA非一致性内存访问(Non-)Uniform Memory Access一般是指通过执行特殊的程序代码对内存的共享访问。在Linux内核中,
 可以执行对访问时间内的不同内存区域进行交叉访问,也就是内核进程可以使用接近CPU使用时的内存。对正在使用内存区域
 的访问,才可以共享。线性的内存访问是无法共享的。PVM/MPI是指并行虚拟机(Parallel Virrual Machine)和信息传递界面

 (Message Passing Interface)。在Beowulf的世界里最常提到的就是这两个概念,该软件包已经提供了多平台的版本。通过

 开放式的标准信息传递库,并行机之间可以通讯,事实上PVM也是一组库,程序可以使用这些编译库来改造程序适应并行系

 统。但是这些都要相应的修改源程序,系统内核事实上并没有发生改变。其他模式:Turbo Linux EnFuzion(Enfuzion目前

 已被http://www.axceleon.com公司收购),Platform的LSF等网格计算(Grid Computing)不必讨论这类集群不是单纯意义的
 集群,以Enfuzion为例,EnFuzion是Turbo Linux收购的Active Tools Clustor软件改良版(该公司以前的连接已经消失
 http://www.activetools.com/manhtml20/clustor.htm),界面使用了Java,可以跨平台,使用驻留系统服务来监控集群间
 的通讯,事实上是任务分发和监控器,类似于中间件,依赖于计算数据离散性,对于数据不可分的程序,无能为力。也就是
 说每个节点都运行相同的程序,但处理的数据是不同的,该集群提供了控制这些程序的界面,跨平台性也只是依赖于计算
 的应用有跨平台版本,而其只提供跨平台的监控。主要集中在CPU空闲的监控和计算的再分配。
·数据可分和程序可分
 集群计算中最重要的就是分布,根据不同的应用,分为两种:数据可分和程序可分。

 数据可分是指数据间没有必然联系或联系在结果的基础上,比如mp3的压缩,每个单独的mp3互不关联,或者有限元计算的

 某个步骤,单一的曲面计算生成结果再参加后面的关联计算,更著名的是SETI@home通过分析射电望远镜的信号寻找外星人,

 这是典型的将中间分析结果传递给下一部分析,这就是数据可分,这最适合网格计算。

 程序可分,用过ANSYS的人都知道商业软件分为单处理器和多处理器版本,因为计算量大,所以支持SMP的计算软件和使用单一
 CPU的软件是不同的,多CPU共同运算时也要考虑到内存的访问,处理通讯和负载均衡,除非操作系统支持,不然使用DOS和
 Windows9x很难用到第二个CPU(甚至不可见),有了操作系统的支持,应用程序也要支持,即使操作系统支持并行,应用
 程序不可分的话,只能使用1/n(n=CPU数量)的处理能力,典型的例子就是2CPU的WindowsNT/2000下使用单处理器版本的
 ANSYS,处理器进程显示50%,但是2CPU共同生效。而使用多处理器版本时,2CPU都可以在98%的使用率。因此程序可分是
 集群重要的应用基础,即使程序本身不可分,而集群支持子进程的迁移,也意味着类似SMP系统支持程序可分。
·集群,分布式计算和并行计算(不是严格的定义,仅用于理解)
 集群是一些能互相通信的计算机组合,其中包括统一通讯,任务调配和资源平均利用,分布式计算可以说是将一个较大数据
 分割后交给客户端计算来完成单一的项目,并行相对分布而言计算更加紧密,是多个处理器间,共同处理一个任务的多个分支。
 本文openMosix的是集群,从物理上看属于计算分散式,可以称为分布,但是又将多台机器的处理器组合起来分担一个进程,
 又可以称为并行。
·SETI@home
 在家寻找外星人计划,这是NASA全球计划之一,位于波多黎各西北的一个火山口中垂直对天的射电望远镜Arecibo(007
 黄金眼中最后决战的地点和X-files第二部第一集中收到外星人电波的天线,直径305米,接收器高约30米,约位于130米高处
 ),用于收集来自宇宙的无线电信号,就像TCP/IP网中的sniffer,这是宇宙中的一个嗅探器,通过收集信号,来分析由智慧
 生物发出的,有一定规律的无线电。比如,第一台电视的信号和猫王歌曲在多年前通过收音机发送的无线电信号,至今还在
 宇宙中遨游,虽然可能很微弱了,但是还可以接收到。这个计划就是接受类似外星人的无线电信号,具体的步骤是让个人电脑
 的用户下载客户端程序,一个屏幕保护程序,或一个命令行程序,然后在连接互联网时下载大约330KB的数据包,然后利用
 处理器空闲时间计算。该数据包只是庞杂数据中的一小部分,但是全球目前加入的上亿台计算机就构成了最大的超级计算机,
 当计算完成后,在连接互联网时上载结果,并下载新的数据包,根据其目前的计算形式,Intel称为P2P计算,其实是网格计算
 的一种。上载的数据不是最终数据,经过和其他人加工的数据整合,会产生新的结果,这时可能要继续计算,也可能就此产生
 阶段报告,每天SETI@home的主页上都会有新的成果,当然不一定是发现外星人的报告。笔者的成绩因为借助了自己设计的
 网格计算,全球4135877位排名1773名左右,还在向前靠拢,大约是完成了24570个数据包,在中国排名居前。
SETI◎home作为屏幕保护时软件运行界面(点击上图放大)
位于波多黎各一个火山口中的Arecibo射电望远镜(点击上图放大)
记得那个著名的007镜头吗?(点击上图放大)
相关连接:
SETI@home的主页:http://setiathome.ssl.berkeley.edu/index.html
OpenMosix小组的成绩:http://setiathome.ssl.berkeley.edu/stats/team/team_151601.html
笔者的成绩:
   http://setiathome.ssl.berkeley.edu/fcgi-bin/[email protected]&cmd=user_stats_new
波多黎各Arecibo射电望远镜:http://www.naic.edu/
上一页 下一页
1 2 3 4 5 6 7 8 9 10 11
Copyright© 2000 d2grid.com All Right Resvered 版权所有:北京蓝潮志诚网络技术有限责任公司