常见问题和解决方法 |
·内核编译失败怎么办? |
编译内核是MOSIX集群的最大操作,对于没有编译过内核的人会遇到很多编译失败的问题。对于经常出现的问题和解决办法 |
如下: |
编译失败在SCSI设备时,如果没有SCSI设备,在编译配置菜单中除去SCSI选项。 |
编译失败在SiS芯片时,如果没使用SiS芯片组的主板,在编译菜单中除去SiS芯片支持选项。 |
更改编译文件后仍然编译失败时,注意将上一次编译的中间文件清理干净,使用如下命令(不要忘记备份 |
.config文件): |
cd /usr/src/linux-2.4.18-om2 |
cp .config /usr/src/config.backup/config-newkernel |
make mrproper |
|
|
·DHCP为什么不能正确读取配置文件? |
确认你的DHCP版本要3.0.1以上,可以到RedHat的网站上下载。另外检查/etc/dhcpd.conf文件配置是否有错误,可以参考本例 |
的文件。 |
·配置完启动时出现sshd加载失败时怎么办? |
该情况出现在MOSIX修改sshd的属性后出现,你可以加载MOSIX的ssd守护进程,操作如下: |
chkconfig sshd.pre-mosix on |
service sshd.pre-mosix start |
|
|
·首次启动MOSIX时提示Host name lookup failure是什么原因? |
这是由于/etc/hosts文件没有正确标出主机名对应的地址造成的,修改/etc/hosts文件正确就可以。 |
·首次启动MOSIX时提示以下错误 |
setpe: the supplied table is well-formatted, |
but my IP address (127.0.0.1) is not there! |
是什么原因? |
这是由于RedHat Linux 的host文件缺省只有127.0.0.1对应主机名,可以将/etc/hosts文件中的127.0.0.1
|
mosix localhost分开描述: |
vi /etc/hosts |
|
192.168.0.254 mosix |
127.0.0.1 localhost |
|
|
·制作LTSP启动内核映象失败 |
注意使用的LTSP初始化工具是ltsp_initrd_kit-3.0.1-i386.tgz版本,其他的版本因为修改了初始化脚本,
目前没有方法可以 |
初始化成功。 |
另外制作启动内核映象时必须有mknbi-1.2-6.noarch.rpm包,从 |
ftp://ftp.mirror.ac.uk/sites/download.sourceforge.net/pub/sourceforge/etherboot/mknbi-1.2-6.noarch.rpm |
可以下载。 |
·配置ltsp客户端DHCP启动失败 |
检查/etc/dhcpd.conf文件指向的启动内核路径正确,确认物理连接正确,确认软盘未损坏,确认LTSP内核启动文件正常编译。 |
确认安装并启动了tftp守护进程,确认/etc/exports文件共享了正确的客户端根文件系统路径。 |
·配置ltsp客户端启动X Windows失败 |
如果需要在客户端启动X Windows,需要安装LTSP的X包,并根据显示卡的不同安装不同的X服务器版本。 |
rpm -Uvh ltsp_x_core-3.0.1-1.i386.rpm |
rpm -Uvh ltsp_x_fonts-3.0.0-0.i386.rpm |
|
|
下载连接是:http://sourceforge.net/project/showfiles.php?group_id=17723 |
如果并不需要启动X Windws,需要修改/opt/ltsp/i386/etc/lts.conf文件中X_USBMOUSE_BUTTONS
= 3即可启动文本界面。 |
·LTSP客户端启动后找不到主机名或不能解析主机名 |
确认/opt/ltsp/i386/hosts文件不是符号连接,并且和/etc/hosts文件一致,确认/etc/dhcpd.conf文件中加入自动生成 |
主机名配置,确认生成的主机名与hosts文件中的一致。 |
·LTSP客户端启动后不能启动mosix |
确认/etc/mosix.map和/opt/ltsp/i386/etc/mosix.map文件一致。 |
·启动mosix后没找到mfs目录 |
手动创建/mfs目录: |
mkdir /mfs |
mkdir /opt/ltsp/i386/mfs |
|
|
·24台机器只有一台是网关或者说主服务器有硬盘,哪其它23台做“客户机”的要是和服务器配置不一样是不是也存在性能“不 |
佳”的问题,还有这样的集群希望是不是就相当于一个24CPU的“大型机”? 那些客户机能不能独立运行程序,还是要由主“ |
服务器”来控制?是否有实际对比测试结果,这样的24CPU集群和1CPU机器的实际测试结果? |
不同的处理器组成的集群会出现性能不平局的问题,但是仍然可以完成负载的迁移和均衡负载,只是会出现处理能力的 |
不平均。 |
这样的集群可以说是有24个处理器的,但是大型机的定义不能由此改变。 |
所有的客户机可以提交和运行任务,服务器使用终端方式是为了节约成本和便于升级,如果资金充裕,可以使用硬盘来单独 |
安装系统,当然只要不怕麻烦。使用终端服务器可以在服务器升级的情况下完成所有节点机的升级。所谓控制指的可能是 |
这些吧。 |
比较的结果可能不会令人满意,并不是一台机器的24倍。那么采用这个结构有什么用途呢?实现负载的迁移,就是说将繁忙 |
机器上的进程迁移到空闲机器上。用户可以提交多个作业,而不需要考虑服务器的负载,不需要考虑到哪一台机器上提交, |
这是企业级应用的必要条件。 |
目前openMosix的研究专著在2个节点间的迁移,并不是因为32位处理器的限制,而是进程当处理器并行的个数增加时,通信 |
问题将会加剧额外的损耗。但是并不是说openMosix不能支持更多的处理器,回答是你需要多少,只要没超过TCP/IP的限制 |
都可以。但是同时要考虑由此带来的通讯负载。 |
·安装时少了一步。就失之毫厘,差之千里。会不会无法完成? |
不错,文中很多版本标记的非常清楚,都有一一对应关系的。但是全部的操作过程是根据实际操作记录下来的,并且验证多次。 |
而且较小规模的试验可以使用rpm包,一步完成。 |
·选择什么样的硬件? |
根据你的预算来选择。无论是IBM,HP还是DELL,无论是国内的联想,浪潮还是曙光。关键是选择对的。当然DIY也是可以。 |
任何的品牌都有其价值,贵有贵的道理,便宜有便宜的风险。这里不对任何品牌做品论,本文使用的是北京蓝潮志诚网络 |
技术有限责任公司提供的机器,主要是合作多年,信誉品质有保证。 |
|