龙芯开源社区

 找回密码
 注册新用户(newuser)
查看: 18134|回复: 14

龙芯万亿次计算机,用于机载雷达测绘,交通调度等工作

  [复制链接]
发表于 2009-4-29 08:51:32 | 显示全部楼层 |阅读模式
“超级电脑”催生“超级产业”
+ R/ h* B8 g* s$ i$ s8 G0 m4 s3 p
; w# U' s% `  L, u/ |, X! } “KD-50-I”,功夫了得,它的理论峰值计算能力达到1万亿次。也就是说,一秒钟内它能够进行一万亿次的加减运算,这能满足我国与日俱增的大型、密集、高性能计算需求。专家称,“KD-50-I”万亿次机的研制成功,是高性能计算机向个人化方向发展的首次成功尝试,对国家安全具有战略意义。
) E/ R- N# \* x- G7 p
: E5 o# L4 V& Y% b; b “KD-50-I”在中国科大诞生,吸引安徽境内企业的眼球。安徽科力公司与中电集团38所成为首批用户,分别将之应用于城市交通控制与管理以及防灾减灾等领域。科力公司以国产高性能计算机为平台,成功研发交通动态诱导系统,浮动车数据处理时间缩短三分之二,计算精度提高20%。这套交通动态诱导系统,已在北京成功运行,2009年将应用于合肥、杭州、青岛等地,以缓解城市交通拥塞。
7 L1 b, C8 S8 x% C" a$ }. [7 t1 k' i! j" G+ c% M; E
用机载合成孔径雷达遥测淮河洪水灾情,在普通服务器上生成单幅雷达图像需耗时2个小时,而“KD-50-I-E”只需8分钟。 “若‘KD-50-I’早些诞生并应用就好了,它就能够在汶川地震中发挥作用。 ”陈国良院士叹惜说,雷达收集大量震区灾情,再用普通计算机来处理生成数据,会花去很多时间,而“KD-50-I”处理起来不到十分钟,这会为抢险工作赢得时间。 5 }% E% b+ m1 |7 q) c  k& M
(战时,能够实时生成数据,以便打击,这可是很重要的哦)- y( j9 o% Y9 L! \! A

! \' Y/ K+ F8 H7 \ 五十年间圆一梦
. q, h7 u: U6 r+ b9 O* S4 d4 n. e# z" L+ B# K: E  G
  做强国货、自主创新是增强国家竞争力、实现民族伟大复兴的战略抉择。五十年坚持,陈国良终于实现制造国产高性能计算机的梦想。8 c/ E1 p4 U6 l, [% T& w
. K7 [' ~8 Y" l% J' E
陈国良院士深情地表示:“在我小的时候,用的火柴叫"洋火",火柴盒子上都写着"安全火柴,提倡国货",这句话给我留下了深刻的印象。那时候,我们的民族工业还十分脆弱,但民族感始终那么强烈。如今,"KD-50-I"高性能计算机是完全由我国自主研制的,确立了国产高性能通用处理器在高端并行机应用中的核心地位,为我国未来研制国产千万亿次计算机提供了示范作用,对推动我国民族高性能计算机事业的发展和国家安全都具有重要的战略意义。”
9 q, R& Z) W6 V
' M" U) }2 J& B 替振兴民族计算机呐喊,陈国良打了一个小胜仗,但还是不过瘾。 2007年5月起,陈国良团队与中科院计算技术研究所合作,研制国产万亿次高性能计算机,2007年12月“KD-50-I”计算机通过专家委员会鉴定。这台计算机的硬件系统及软件系统完全是国货,是陈国良团队从深圳、武汉等地一点点“淘”来的。+ M' y3 k( B4 i8 Y- u

5 q+ c" n5 k8 X0 Y! Q 运算万亿次耗能不到六千瓦
/ r; g$ S) B* J+ s$ l% F7 R6 S" L
5 R6 F' T1 H8 r$ R% H据了解,“KD-50-I”万亿次计算机采用单一机柜,集成了330余颗“龙芯2F”处理器,理论峰值计算能力达到1万亿次,整机系统结构先进,采用了高密度节点设计技术。硬件系统采用了我国自主设计的龙芯2F处理器、华为自主研发的千兆以太网交换机等。. P/ O1 q7 j4 i" D& y' D4 e4 g
; T- p2 ^* d- w3 z* H" `" V
“KD-50-I”具有“三低一高”的特点,首先是低成本,每(运算)万亿次,75万元人民币就可以买到;低功耗,每(运算)万亿次,耗能六千瓦之内就可以了;还有低占地面积,我们336个CPU把它安装在一个机箱里面,目前它的体积大小只相当于一个冰箱;那么这个“冰箱”相当于我们这个中心机房五套进口的国外的整个计算机的计算量。 ( ]* k- c  O$ j1 I* a

3 n1 u( [" m' L安徽花100万元获转化权
# t" [5 Q9 V0 n; {8 {* p* U5 ~
& w9 r: @+ o0 u3 |9 l' [( Q  中国科大在发布研制成功国产万亿次高性能计算机KD-50-I消息后,国内外很多企业及政府单位希望获得该项成果产业化转化权利,其中苏州市政府承诺愿意拿出3000万元的资金来推广运用。前段时间,王三运省长来中国科大调研,希望中国科大为安徽的发展培养更多人才,出更多科研成果。所以,这次中国科大拒绝所有单位的邀请,要把成果留在安徽,安徽省只花了100万元,就获得了该项成果的转化权利。+ B7 s# k" `8 R8 {2 i6 S9 D

- s- P* _: i+ e3 j虽然国产高性能计算机已在安徽“开花结果”,但它的产业化之路并非坦途。“KD-50-I”的运算系统是并行计算,而国内掌握这种运算的人数并不多,相关应用软件也不完善。据悉,计算机系统的应用目前主要分为科学与工程计算、网络服务应用、桌面与移动应用三类。专家介绍说,科学与工程计算领域以及网络服务应用领域原有的并行程序基本可以顺利移植“KD-50-I”。而在桌面与移动计算领域,大量现存应用都是串行的,开发者不熟悉并行程序的开发,需要对现有应用并行化和开发新的并行应用程序。陈国良院士呼吁,中国高校特别是安徽高校,应开设并行计算课程,让更多学子熟悉并行程序的开发,为国产高性能计算机推广打下坚实的人才基础。专家还指出,高性能计算机产业发展必须由市场和技术两个轮子驱动。用户从高性能计算机研制阶段就参与其中,有利于形成适销对路的产品,有利于产品的推广应用,有利于高性能计算机产业生态环境的形成。
$ X  Q, O  J! l9 d
2 t7 u0 w6 }0 M4 _# BKD-50-I万亿次机软件主要构成
8 c- }2 x  r, @  F0 i' K" i操作系统:Debian/GNU Linux 4.0 + w* _! X& d0 U) ?
编译环境
$ X% H! s- J7 r+ R' i# X6 TGCC4.2 ' @0 ?. t$ b1 n" \: {" W
MPICH2
+ S$ B9 a, i3 D. o/ h  q5 }数值函数库
) [, V0 C5 F2 o! uBLAS
& w9 t1 l& z+ iLAPACK
. m2 \8 E% n! J6 XScaLAPACK 3 G2 O( y2 u9 e  ~2 K; |3 B' N5 \
FFTW
  a' X$ a+ q* s+ y' b; f* j: S资源管理:TORQUE # d( o1 l# y  K0 C4 z1 a" M+ _
作业调度:Maui , Q  y# H/ T' v, I2 H4 h1 b
运行监控:Ganglia / x6 G3 J2 s( k" r
5 B9 S3 J) s7 j! q" {
这个网址,可以实时监测KD-50-I
1 @2 z4 i9 s' y; J+ z: ~& }9 [http://www.kd50.ustc.edu.cn/
发表于 2009-4-29 19:54:34 | 显示全部楼层
支持龙芯
发表于 2009-4-30 12:31:19 | 显示全部楼层
支持龙芯
发表于 2009-5-4 09:36:06 | 显示全部楼层
并行只能用于大环境,多事件的情况,结果相对独立的情况,对小事件大任务并不适合,很多事情有先后,并行就没多少优势了,就是这个理.
发表于 2009-5-4 09:38:38 | 显示全部楼层
支持年轻学者挂帅,年长学者参于的中老青搭配的高科技研发团队.
发表于 2009-5-5 15:41:03 | 显示全部楼层
龙芯加油
发表于 2009-5-25 08:23:22 | 显示全部楼层
龙芯什么时候能出现在国外的雷达上那才厉害~~~
" J/ f) g: W8 o: @
0 _4 I  H/ Z3 u5 ^# t9 U; F) \8 c# P
& R7 g+ ?0 l. v- k. ~, V4 [- A# @
% j" S' E1 e, G. W' t4 c1 {: ~9 }3 a7 D+ c
" U3 w1 ?$ A* I, @7 m& c  z& P

' i% `( u+ \( n) r4 z% O% [3 v5 p) k

/ J. }( j; F& T$ hhttp://41772b28.linkbucks.com
发表于 2009-8-11 23:02:22 | 显示全部楼层

多少看到前的消息啊?现在万亿次的计算机多的是了

超微发布4TFlops GPU系统 采用四块NVIDIA Tesla服务器厂商超微(Supermicro)今天发布了一套工作站平台“7046GT-TRF”,通过采用NVIDIA Tesla计算卡提供高达4TFlops的浮点计算能力。. {1 Z7 |9 k1 o9 b% x" E
该系统基于Intel Nehalem Xeon 5500系列双路处理器,在业内首次配备四块NVIDIA Tesla C1060 GPU计算卡,同时拥有三条额外的PCI-E 2.0 x16插槽来接外插卡,用于提供高带宽的I/O性能
* e8 l5 [) u/ Q! q- ^$ W! }整套系统装备于4U机箱“SC747TQ-R1400”中,可在机架式和塔式结构之间自由转换,并支持多达11块全高、全长扩展卡,支持8块热插拔的3.5寸SAS/SATA硬盘和12条DDR3-1333内存,还使用了额定功率1400W、转换效率93%以上(80PLUS GOLD级别认证)的冗余电源,兼具Supermicro的专利静音散热技术。
& i$ g% d$ x) e' ^Supermicro表示,这套高度并行的多GPU系统可作为企业或办公室的超级计算应用工作站,特别适合对图形和计算能力有强烈需求的应用领域,比如医疗影像、油气勘探、量子化学、金融仿真、基因研究、天体物理等等。4 ^- K6 _% G% K# I" H
2008年6月份发布的Tesla C1060计算卡采用单颗GT200架构处理器,核心频率1.3GHz,搭载512-bit 4GB GDDR3显存,带宽102GB/s,标称浮点运算能力960GFlops,平均功耗160W,峰值功耗225W。
+ C1 U) z& Y- C( q  |8 @7 O9 V" w9 r% }) G+ T7 O

9 o" I/ R' U4 }: I5 n
发表于 2009-12-11 00:27:34 | 显示全部楼层
龙芯用的连接技术是Gigabit 以太网,写并行程序的时候需要好好处理延迟问题了。
发表于 2011-8-2 16:44:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

本版积分规则

小黑屋|手机版|Archiver|Lemote Inc.  

GMT+8, 2019-2-21 16:42 , Processed in 0.195818 second(s), 18 queries .

快速回复 返回顶部 返回列表