龙芯开源社区

 找回密码
 注册新用户(newuser)
查看: 27155|回复: 29

中科院带龙芯3号处理器在美国硅谷进行展览

   关闭 [复制链接]
发表于 2008-9-1 08:43:43 | 显示全部楼层 |阅读模式
8月29日消息,中国研究人员近日在美国加州参展Hot Chips大会时表示,已经准备好发布首个自主研发的[url=http://wiki.ccw.com.cn/%E9%BE%99%E8%8A%AF]龙芯[/url]3号处理器,今年内将首先发布4核版本,八核版本计划于2009年亮相。- n: ]- J: `6 ^9 T( m0 H. T8 R
中国希望能在2010年用龙芯3处理器组建一个拥有petaflops级性能表现的高性能计算机。据称“1 petaflops”表示处理器在一秒钟内可以进行1千万亿次浮点计算,也相当于1000个万亿次高性能计算机群,这已成为超级计算机的入门门槛。
% g. R8 `- P3 z" E中国科学院计算技术研究所副所长徐志伟表示,四核版本的龙芯3计划在今年年底之前发布,八核版本计划于2009年亮相。他出席了本周二(8月26日)的Hot Chips大会,并在会上展出了龙芯3的核心架构。
8 g2 Y6 P3 `0 {, l0 ~" T7 U四核与八核版本的龙芯处理器都是用65nm技术制造,时钟主频均为1GHz。龙芯设计的特色在于分布式、可扩展的架构。徐志伟说到龙芯的能耗很低,四核龙芯3为10W八核的也只有20W。龙芯使用了MIPS64内核,增加了超过200条的X86二进制转换和多媒体加速指令。5 U: p' o1 K' Q# ~. P- Z8 t7 r9 a
徐志伟没有透露龙芯3处理器大规划生产的具体时间表,只是表示中国的目标是在2010年能够搭建使用龙芯3处理器的超级计算机系统,拥有PFlop级的运算能力(1 PFLOPS等于1千万亿次浮点指令)。此外他还提到,龙芯3也将用在浮点运算能力为Teraflops级别的普通台式电脑中。(1 Teraflops指计算机每秒能进行一兆次数学计算)。
5 W" a' C" M& i, W1 }3 M根据2007年五月签订的协议,龙芯处理器将由意法半导体代工生产和销售。2002年神州龙芯集成电器设计有限公司(BLC IC Design Corp)发布了首款32位龙芯1号处理器。2005年上半年,神州龙芯又发布了64位的龙芯。随后龙芯2号经过多次升级,每次升级性能都有着三倍于前代的提升。
& q& S% K% w2 n& \0 E) ^中国PC厂商中科梦龙电子科技公司从2007年起开始向学校与政府供应使用龙芯处理器的低成本电脑。但这些产品还未能引起大众市场的兴趣。徐志伟说龙芯项目的目标之一,就是首先满足中国庞大的电子消费市场的需求。) x5 c$ ?1 W8 Y
在谈到未来的发展计划与方向时,徐志伟表示明年将研发龙芯-2H,在一个片上系统上集成了CPU,图形处理器,以及北桥和南桥芯片。他说:“我们将竭力为客户提供一个简洁的方案。”* z' Z% z( F9 f" m1 F4 F
龙芯的架构是基于低能耗方案设计,降低能耗的特色功能包括手动门控时钟的和电源管理功能,例如模块级时钟门控方法,CPU频率调节,CPU温度感应等。& u. f( M3 `+ l
徐志伟还介绍了龙芯开发团队,目前在中科院计算技术研究所大概有300人从事着龙芯项目。其中200人致力于硬件方面,另外100人则专注于软件方面。
发表于 2008-9-1 10:15:04 | 显示全部楼层
官方权威发布,顶一个。真的小道消息也赞一个。# T% q7 \# q( Q/ V7 u- H
在此对恶意假小道消息和权威的恶意假消息表示最强烈的谴责和咒骂。; ?" o4 n) s+ w7 C) M

& h5 l5 U4 L( c, k8 u2 @. j[ 本帖最后由 hcsy 于 2008-9-1 10:17 编辑 ]
发表于 2008-9-1 13:35:58 | 显示全部楼层
发表于 2008-9-12 10:57:54 | 显示全部楼层
太好了,赞一个,什么时候能和产生三国鼎立啊。期待中。。。。。
发表于 2008-9-14 00:28:01 | 显示全部楼层
龙芯3也将用在浮点运算能力为Teraflops级别的普通台式电脑中
& x( t' D) ?& ^. s  s3 e4 {% n8 j- G1 t
开玩笑吧
+ L1 Y8 Q) Z$ j, H  O1 L% s2 t! f3 }, m7 @1 |2 N
KD-50-I不过也是1T,里面有250多个龙2F呢
发表于 2008-9-14 12:16:10 | 显示全部楼层
原帖由 xDh4249 于 2008-9-14 00:28 发表 4 f0 O% C( [# d- w! }# U/ h
龙芯3也将用在浮点运算能力为Teraflops级别的普通台式电脑中
9 n8 b7 W9 Y0 k- S0 h, U7 F
! X; c" i0 b  d) v" P开玩笑吧) ^. `6 h9 h  k3 K: V6 Q
) `0 Y9 \! v; S2 b
KD-50-I不过也是1T,里面有250多个龙2F呢
3 N3 B0 m0 x0 ^
- }1 F$ W' j+ a0 g! e3 Q
PCI-E槽上来一块ATI 4870 就多出1.2T了,很费解吗?
发表于 2008-9-15 02:04:12 | 显示全部楼层
原帖由 er8t6yhgkdj 于 2008-9-14 12:16 发表 ! Y/ h0 d7 J: j
PCI-E槽上来一块ATI 4870 就多出1.2T了,很费解吗?

) q+ a% O- L$ y- H- X6 M6 v) p( ~' I
GPU计算和通常所说的超级计算机差别是蛮大的。究其原因,是因为GPU计算的局限性。AMD的GPU我不太清楚,nVIDIA的CUDA要想充分发挥性能,基本上最好是没有任何条件判断,相信AMD更是如此,何况AMD那个P玩儿意还得用汇编,更难以发挥效率和生产力。Intel的那个正在开发的号称很牛的GPU倒是看起来很美。总的来说,超级计算机里边GPU还不靠谱呢。
发表于 2008-9-15 02:08:43 | 显示全部楼层
补充: 没找到该帖子的地方。
9 [/ h: j# B7 U; d' V. u
8 `( T/ r* c; I! a+ WCUDA的性能发挥依赖于特别的并行性,并且算法中条件判断越少越好。并且再多卡互联相当困难,现在的架构还离不开主CPU的协调。
发表于 2008-10-23 11:12:28 | 显示全部楼层
学习,学习
发表于 2008-11-19 12:46:52 | 显示全部楼层
原帖由 唐山大兄 于 2008-9-15 02:08 发表
) _: n8 F2 r; P. S  j补充: 没找到该帖子的地方。
4 \# B! F/ P; C3 V5 P
3 R- m% M1 A. S1 F: I/ sCUDA的性能发挥依赖于特别的并行性,并且算法中条件判断越少越好。并且再多卡互联相当困难,现在的架构还离不开主CPU的协调。

% F) K6 y+ y3 X" v8 m
# ]8 }8 _+ V6 i8 W+ v* t你应该想到一点,技术是在不断进步的
* j) G, F0 Q4 _9 I: T. x; Q$ N% q去看看最近的新闻吧,人家的超级计算机已经发布了,售价不到1W美圆,性能4T

本版积分规则

小黑屋|手机版|Archiver|Lemote Inc.  

GMT+8, 2019-5-23 05:47 , Processed in 0.205833 second(s), 21 queries .

快速回复 返回顶部 返回列表