您的位置: 网界网 > 周报全文 > 正文

[周报全文]DIY超级计算机

2004年05月10日 00:00:00 | 作者:佚名 | 来源:$page.getBroMedia() | 查看本文手机版

摘要:DIY超级计算机

标签
    DIY超级计算机


    只需一天就可以造出一台速度极快的超级计算机。


    如今,制造超级计算机可能比想像得要容易得多,笔者就有过在一天的时间内制造一台这样的计算机的经历。 

    想要制造这样一台具备超凡处理能力巨兽的人是一群旧金山大学的学生,他们的目标是号召数百个像我这样的计算机发烧友将自己的笔记本和桌面系统连接为一个整体,使其构成一台具有巨大处理能力的巨型计算机,其处理速度足以被列入全球最快的500台超级计算机之中。在所有这些超级计算机中,最快的就是日本的地球模拟器。 

    带着Compaq 2.4GHz P4处理器的笔记本电脑,笔者与其他约300人在旧金山大学的体育馆中构建被称为Flashmob1的超级计算机。 

    用一整夜的时间,工作人员和学生将这座体育馆改造成了一个巨大的数据中心,大卷的以太网线将遍布整个体育馆的桌子连接在一起。这些网线连接着体育馆内的四台Foundry交换机。在体育馆的中央是一个高起的平台,一些讲师和学生将坐在这个平台上监视Flashmob1的心跳。 

    每位志愿者的计算机都必须在体育馆入口处接受安全监视员的检查,然后拿到一个桌子编号,用来放置其特定速度的计算机。

    一位身着制服——带Flashmob1标志黑色T恤的集线器管理员帮助我对电脑进行一些设置。我告诉他自己带了电源。他说:“很好,你会用得着的,如果你的笔记本电脑今天用的是电池,那么在基准计算过程中它可能只能坚持十分钟。” 

    他还拿来了一张光盘,其中包含了我的计算机要运行的所有软件。Lawrence Livermore 国家实验室计算机科学家兼旧金山大学讲师Pat Miller将这张光盘描述为:“光盘中的超级计算机”。

    虽然要开始运行1400台计算机,但Miller看起来仍然很放松。具备如此众多节点的系统可以产生600 gigaflop(gigaflop是每秒10亿次浮点运算的速度单位)的处理能力。在不到四个小时的时间里,这个系统将运行所有全球最快的500台计算机必须运行的基准程序。

    正是Miller的DIY超级计算机课程激发了大家创造Flashmob1计算机的愿望。Flashmob1本身就是一个疯狂的想法,它组织数千个陌生人到某个地方集合,然后做一些稀奇古怪的事,例如唱歌,在活动结束后,大家又会各自散去。正是从这种活动方式中获得的灵感,学生们才邀请了许多志愿者将自己的计算机捐出来并用一天来构建超级计算机。

    整个工作的规模非常大。Miller说:“受限制最大的是每个节点的内存大小。”虽然我的电脑有512M的内存,但仍然不够。我们的计算机数量众多,随时都可能有计算机崩溃,而且网线也有可能出现问题。在整个过程中,我们机器上的内存和处理器都将以最快的速度运行。一旦哪一台计算机在基准计算过程中发生故障,整个Flashmob1也将随之崩溃。 

    上午11时,除了集线器管理员外,所有的人员都撤离体育馆。系统测试即将开始。HP的专家建议组织者先对小范围内的计算机进行测试,然后把其中有问题的机器剔除出来。对于一个拥有1000个节点的典型超级计算机,HP称至少需要一个半月才能完成节点测试,然后再用三个月进行验收测试。Flashmob1的小组自己规定要在下午1时前完成测试,并开始进行两次基准计算中的第一次。这台超级计算机将在下午6时被拆解,两次计算中最好的一次将被呈交给“全球最快的500台计算机”(TOP 500)的审查机构(新的消息中显示该计算机已经落选TOP 500)。

    Foundry的工程师在前一天晚上对主干网进行了全面的设置和测试。该公司提供了10G以太网骨干,由四台FastIron 1500 Layer 2/3模块化交换机组成。每台交换机都配备了一个双端口10G 以太网模块和六个48端口10/100M模块,后者用于支持客户机。 

    志愿者们可以通过几扇窗户观看Flashmob小组人员的工作情况(+微信关注网络世界),我们看到有些人在平台上一直紧盯着监视器。 

    下午四点,我回到了体育馆中。大家得到了坏消息。一些机器上的劣质网卡产生了巨大的问题。

    Miller说:“计算机的网络连接都要求100 Base-T的速率,但一部分计算机没有达到这么高。”此外,当Flashmob软件试图使用一些计算机上的无线局域网卡时,问题也是层出不穷。 

    志愿者最终带来的计算机数量是700台。最后,经过一系列测试和网络故障查找后,Flashmob小组于下午4时15分开始使用256台计算机进行基准计算。经过70分钟,这台超级计算机已经完成了75%的计算,但因为一个节点发生故障,整个系统也就崩溃了。这次测试获得的性能评分为180 gigaflop。虽然没有达到预期的600 gigaflop,但这已经是一个相当可观的系统了。据旧金山大学计算机科学助理教授Greg Benson称,这样的超级计算机完全可以胜任等离子体建模的计算重任。 

    尽管出现了一些技术问题,组织者们仍然感到非常兴奋,因为他们成功地实现了两个目标中的一个:证明可以利用普通计算机来制造出超级计算机。他们计划在不久之后建造一个迷你Flashmob计算机,用来解决一些重点查询的问题。Flashmob计算机可以帮助中学生研究臭氧空洞的形成,也可以帮助居民社区预测煤气泄漏的后果。

    Miller和Benson说,他们会参与其他Flashmob计划,全世界的许多大学都已经与旧金山大学进行了联系,并表示对构建Flashmob2非常感兴趣。

    这所大学还开发出了Flashmob软件,让人们可以定点发现内存和CPU存在的问题,但是,他们没有预见到的是,最终导致超级计算机计划受阻的是客户机的网络问题。(美国《Network World》供本报专稿) 

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]