手机看中经经济日报微信中经网微信

姚继锋:高性能计算云平台的建设

2013年03月25日 19:37   来源:SRC-1951   

  (来源:赛迪网)

  随着信息技术的不断演变,高校计算机中心也在不断发展,从早期的PC时代、网络时代,一步步迈向云计算时代,在云计算时代,中心的数据能力、网络能力、服务能力都应该得到大幅提升。在这个背景下,高校计算中心的发展方向是什么?中国科学院软件研究中心姚继峰博士提出建设高性能计算云平台。

  高校应成为大型高性能计算中心的主要力量

  高性能计算能力是高校科研能力的主要标志之一,比如物理、生物、天文、新材料等众多学科发展对高性能计算能力十分依赖,很多领域科研水平的高低取决于计算机能力的强弱。高性能计算中心是将信息分析和处理的中心,是资源中心,更是一个跨领域的研究创新中心,是学校和地区竞争力和科研力的象征。

  纵观国外,美国1985年建立了圣地亚哥超算中心,1986年建立美国国家超级计算应用中心;2001年,日本东京工业大学建立GSIC。在我国,超算中心主要分布在北京、上海、广州等几个东部城市。

  国外高性能计算中心的建设单位一般就是应用单位,这些中心的建设由应用专家主导,而在我国,计算中心通常由政府和计算机专家主导。他认为,高校应当成为我国大规模高性能计算中心的建设单位和主要力量。我国高性能计算中心应该进行聚合和集约化建设,这样能够将有限的计算资源高效利用,提供大规模先进的计算资源。

  高性能计算中心的建立

  一个大型计算中心相当于基建设施、超级计算机、应用软件、高校运维管理、用户服务支持和长期运营机制的共同集合。超算中心的系统环境架构由安全稳定的内外部互联网环境、易用的运维管理平台、丰富的高性能应用、先进的超级计算机系统以及齐全的计算机中心基础设施组成。

  从运维角度看,这些中心必须可靠、稳定和易于管理;从应用角度,这些中心要具备好的兼容性、可扩展性和可用性;从投资角度,价格以及免费维护期要纳入考虑;从售后角度,要兼具技术支持和应用支持的能力。同时,好的计算中心不仅仅需要关注机房和硬件,还包括软件、运维、用户服务和运营机制。

  作为高性能计算中心,运维管理体系十分重要,需从管理、人员、技术多方面发力。管理上,要建立完善的运维管理制度,严格分级以有效处理故障、严格安全管理以做到全方位的外围保障;人员上,必须有一支专业、稳定、敬业的维护队伍;技术方面,要有深入扎实的系统技术、科学有效的主机运行指标以及对复杂系统环境的深入研究。

  除此之外,高性能计算中心还需考虑运营的问题。据了解,美国圣地亚哥超算中心设备更新的费用主要来自联邦机构,而日常运营费用和来源主要来自于NSF,其余来自联邦的研究机构和州政府的各个研究项目。对于高性能计算中心来说,运营的挑战来自于定期建设经费和常规建设经费,所以需要建立常规有效的投资机制。

  从高性能计算中心到云计算

  高性能的计算中心是天然的云计算中心,需特别关注云平台软件建设,建成高性能计算云平台。值得注意的是,高性能云平台的核心是软件,平台上的软件需要面向各类用户需求定制开发。此外,要整合高性能计算云平台和其他云服务平台,建成协同的平台。

(责任编辑:杨海洋)

精彩图片