解锁FPGA的故障免疫密码
我们身处“碳基智能”大步迈向“硅基智能”序曲中,前者更像是后者的引导程序,AI平民化时代,万物皆摩尔定律。
越快越好,几乎适用绝大多数场景。
在通往人工智能的征程中,算力无处不在,芯片作用无可替代。
十六年前,就已宣称自己是一家软件公司的英伟达,现已登顶全球第一大市值公司的王位,3600000000000元,还是美刀。
具备软件编程灵活性,又拥有硬件高性能的FPGA,是软件同类,还是属于硬件一派?
有别于专用集成电路(ASIC)需要昂贵的掩膜生产费用,FPGA作为芯片家族成员中的重要成员,无需流片就可定制设计,快速部署使用。
也被称为“平民版”的ASIC。
尤其擅长小批量应用场景。
欧洲巨头空客公司,FPGA作为其数字设计的关键组件,广泛用于空间产品(Space products)、测试单元(Test units)、原型样机(Prototyping)等。
两大厂商、三种类型、十余款芯片型号。
在欧空局的哨兵2号卫星中,共使用249个ICs,其中FPGA的数量是149片,占比近六成之多。
除了通信行业的头部大厂外,像单个客户一次采购金额在近十亿元量级、八万多片FPGAs,已经是行业较为少见的重磅事件。
一架先进F-35战斗机,大约使用3500个各类芯片,其中就包括208片FPGAs。
Source:www.militaryaerospace.com
在航天航空、防务等关键且重要的领域,对先进工艺和技术趋势的影响力和掌控力,与上世纪70年代的巅峰期相比,不可同日而语。
现在所能做的,就大多是对商用芯片买买买。
出于成本考虑,FPGA被广泛用于卫星载荷平台、通信系统、无人机、雷达系统、导弹控制、船用装备、飞行器控制系统等。
Need for Assured FPGA Functionality
Source:Systems Engineering- Critical to Defense Acquisition,2017
速度快慢,距离远近、大小和多少的衡量尺度,通常只是相对概念。
第一个古人类露西(Lucy),距今约320万年;比智人更早出现、脑容量更大的尼安德特人,大约是在数万年前,而人类创造高度文明,用时数千年。
太阳距离人类家园约15亿公里,阳光到达地球的时间大约8分20秒,与我们在手机刷个短视频的用时差不多,也就是随手分分钟的事。
地球在宇宙中的位置
来源:科普中国,sina
数字芯片为代表的硅基智能,以2022年底ChatGPT的横空出世为标志,进入到全面爆发期,进展迅猛。
即便把时间拉长到从上世纪40年代开启的电子管时代开始,极速推进到被马斯克称之为强大得可怕的现阶段,也只是几十年而已。
AI平民化时代的极简进化史(1946-2024)
来源:“无限空间:大音希声,大象无形”,复及科技
数字电路的语义和行为,在技术本质上,都是由0/1二进制实现的时域计算、或者空域计算模式,FPGA芯片更为特殊,两者兼有。
碳基生物离不开太阳,没有不行,太多不好。
硅基智能的芯片,则相反,越靠近,越要命。
太空恶劣运行环境
Source:FPGA development in Defence and Space, Airbus
借用月之暗面AI工具(Kimi)比较脑洞的话来描述,“FPGA内部的存储器就像是一个复杂的世界,密集的居民区(CRAM),高速主干道(BRAM),繁忙的市场(DRAM),用户的百宝箱(Flip-Flop)等”。
各类存储单元各自扮演重要角色,不仅是数据的“栖息地”,也是系统可靠性的基石。
相对而言,也更容易受外部运行环境影响,被动发生0->1或1->0数据改变,由位翻转(bit flip)诱发的“软错误”或“软失效”现象。
处于出厂状态的FPGA,内部只是空白的门海阵列,位流(bitstream)是芯片物理结构的体现,承载硬件电路的若干创新。
这种创新首先属于FPGA厂商。
既然是半定制的硬件可编程逻辑器件,可设计为类ASIC使用,最终体现在硬件电路层级的个性化应用设计,当然也是终端用户自己的。
相同的应用设计,载入到同一厂商不同器件后,实际的芯片物理结构也完全不同。
用户将FPGA定制为“自己芯片”的示意图