作为中国首个火星探测任务,“天问一号”火星探测是2021年备受瞩目的航天大事件之一。2021年5月15日上午,天问一号着陆器确认成功降落火星北半球的乌托邦平原。“天问一号”一次任务同时实施环绕探测和巡视探测,在国际上尚属首次。之前成功全世界登陆火星的着陆器和火星车加在一起只有10个,目前还在服役的火星探测车有“好奇号”、“洞察号”和“毅力号”,它们的探测区域基本都是在火星南部高地,而“天问一号”火星车着陆在火星北部平原,将会对人类全面理解火星的演化进程做出重要补充。
天问的成功无疑是我国科技综合实力的体现,其背后包括航天测控、太阳能电池、航天动力以及IT技术等等共同协作的系统性工程,其中有关天问的IT技术又至少包括了芯片、操作系统以及AI自动化控制等等方面,但遗憾的是目前还没看到对于这部分专业解读,在整理了相关资料以后,笔者发现航天的背后至少有操作系统、芯片与人工智能三大看点,下面为各位读者进行一下详尽解读。
一、Space OS-航天器背后的操作系统可不简单
虽然并没有公开资料显示天问和祝融到底使用的是什么操作系统,但是笔者认为Space OS的可能性要超过90%。Space OS中国航天科技集团公司五院的航空天器操作系统,在2006年首飞成功,2013年嫦娥三号探月任务使用的是第二代的Space OS 2。
尽管与普通家用的操作系统设计原理相似,但航空航天的操作系统为了适应恶劣太空环境,对安全性、可靠性等要求要苛刻许多。日常我们家用的计算机系统死机可以重启解决,坏件可以换新的,但飞行器上了天以后,根本就没有什么重启换件的机会。而且作为整个航天器的大脑,航天操作系统的连续运行时间绝不能拉胯,一般来说电池背板的使用寿命可达十几年,这也就意味着Space OS也得保证运行十几年不出现问题。
除了稳定性的要求以外,Space OS 与日常我们所接触到的操作系统的设计要求也不同,今天知乎上有一个特别火的问题是《祝融火星车上有没有可能搭载鸿蒙OS或者RT-Thread》,不过笔者认为鸿蒙上火星的可能性几乎为0,虽然没找到Space OS的架构,但从论文《空间站有效载荷综合处理单元设计研究》可以看到载人航天系统的功能架构图如下:
而对比鸿蒙的架构图
可以看到鸿蒙的首要设计理念是保证良好的用户体验,而Space OS则需要首先保证系统的高可用性,系统健康、电源、遥测管理等等方面,至于多媒体、分布式等等方面根本就不用考虑。
而且值得一提的是,在任务调度和内存管理方面,2013年搭建在嫦娥三号的SpaceOS 2可以同时做到同时管理几十个任务,与一代Space OS的5个任务相比提高不小,相信现在用于祝融的版本可能提升更大。在探测车在星球行走时,要一边不停地拍摄周围环境,一边快速保存和处理这些信息。同时还要密切注意外界传感器的反馈,假如前方遇到路障,需要操作系统在最短的时间内作出判断并反应,这在火星车电源和算力均有限的情况下做到硬实时还是非常不易的。
二、能上天的芯片肯定不止CPU那么简单
如果说航天操作系统与普通的RTOS还有一定的相同之处,那么航天芯片与普通日常SoC之间的差距就太大了,别的不说想要内存、电子器件、半导体在没有大气层保护的强辐射环境下运行,就是一件极其困难的任务。
因此与我们家用电脑将内存、CPU、网卡分成不同模块的策略不同,航天芯片更倾向于完整的片内集成。根据论文《空间站有效载荷综合处理单元设计研究》,integrated processing unit(IPU)的架构如下:
这款芯片实际是将内存、光纤RapidIO等外设以及CPU、FPGA等核心组件完全集成到一块芯片上了。
目前我们比较成熟的航空航天器专属的芯片,大多是轩宇空间的CPU-SoC 20xx系列的,其中第一代SoC 2008首次应用于2012年10月发射的实践-9B卫星星载计算机的主份核心芯片,是国内第一款在轨飞行的SoC芯片。该芯片基于SPARC V8体系结构,面向空间应用的高性能、低功耗的32位抗辐射片上系统芯片,计算性能超过86MIPS@100MHz。
第二代产品SoC2012是一款4核CPU处理器,内部集成四个SPARC V8内核,性能超过了300MIPS 80FLOPS@100MHz,功耗不大于2瓦,基于SoC2012设计的新一代抗辐射加固星载计算机,其体积、重量和功耗只有同类传统星载计算机产品的一半,性能是现有产品的20~60倍,可以满足卫星对高性能、高可靠、小型化的进一步需求。截至2016年年底, 共有 200套以上 SoC2012 片上系统用于二代导航卫星、探月卫星等的控制计算机、敏感器等电子产品中。
第三代产品是SoC2016芯片是一款异构多核芯片,除了集成SPARC V8架构高性能LEON4处理器核以外,还在片内集成了DSP数字信号处理器、浮点处理器、1553B总线、CAN总线、SpaceWire总线、DMA控制器等模块,SoC2016计算性能超过800MIPS 200MFLOPS@200MHz,功耗不大于3瓦,性能指标达到国际先进水平。
当然轩宇空间自身也提供了一些SiP也就是微系统产品,比如SiP2113型通用星载计算机模块,就在SoC 2008的基础上集成了内存、Flash和1553B总线等模块,提供一体化解决方案。
三、想上天还得指望强化学习
虽然天问和祝融是否使用人工智能技术并没有明确的资料显示,但是我国的月球探测器嫦娥五号肯定是有AI技术的加持,在2019软件定义卫星高峰论坛上中国科学院院士、中国探月工程首任首席科学家欧阳自远表示“嫦娥五号仍采用软着陆。这实际上是人工智能的自主决策。”其实火星和月球探测车并无本质区别,都需要解决探测车的着路与航线控制等问题。
如果超远距离的通讯,通讯延时过长几乎是一种必然会遇到的问题,如果探测车所有动作完全依靠遥控的话可能会有一定的潜在问题,而用欧阳自远院士的话讲,“它一直在边走边找,最后作出判断和决策。”这其实是向我们说明了星球探测科技的背后应该是强化学习。
我们知道在目前人工智能领域分为深度学习模型和强化学习模型两种流派。其中深度学习模型以深度神经网络模型为主,在图像及自然语言识别、分类以及生成等方面都有不错的成绩。而强化学习从目前公开的资料来看,当属GPT-3之父Open AI的实力比较强。深度学习比较合适根据海量的数据推测数据之间规律和关联,而强化学习主要用于探索未知领域,所以由本次天问和祝融要执行的火星探测任务来看,由于火星表面的数据匮乏,使用深度学习的可能微乎其微,如果有AI技术的应用也几乎可以肯定应该是强化学习的模型。
强化学习(reinforcement learning,RL)技术,要做是一系列基于时间序列的决策。它先假定每个问题都对应一个Environment,这时每一个Agent在Environment中采取的每一步动作都是一个Action,做出Action之后,Agent从Environment中得到observation与reward,再不断循环这个过程,以达到总体reward最大化。其原理图如下:
所以从RL的原理中也能看出,RL是一种在不确定且复杂的环境中通过不断试错,并根据反馈不断调整策略,最终完成目标的AI, 目前虽然RL的应用还不如深度学习那样普遍,但是在一些具体的场景中例如,控制步进马达、电子竞技方面还是取得了不错的成绩,强化学习的确是比较适合在由机器自主实现某些目标。
这和天问和祝融的火星任务非常的契合。因此笔者预测祝融探测车上应用初步强化学习成果的可能不低。
十年饮冰,难凉热血,百年回首,自请长缨,千载暗室,一灯即明。相信在天问与祝融的鼓舞下,中国科技将重搭主心骨,只要给我国半导体业以时间,那么必能补齐短板,终成大业。
参考链接: