我们要用100%的精力来解决1%的问题

        编者按:本公司首席科学家——刘心松教授早就提出了数字有机体(系统)的概念,后在2004年11月的四川省博士专家论坛上公开发布了题为《下一代计算机系统——数字有机体》的论文,并由合作者进行了公开演讲。现在,当我们重读这篇论文时,仍然可以从中获得许多新的灵感,并激发我们不断创新。为此,在数字有机体系统推出新版本之际,再次向各位推荐这篇论文,以便共享这一人类智慧成果。        下载pdf版下载完整PDF版
 

下一代计算机系统——数字有机体

王典荫 刘心松

(电子科技大学8010研究室,四川省 成都市 610041)

摘 要: 本文提出了数字有机体——下一代计算机系统的基本概念。数字有机体引入了人类信息基本结构中经验、知识和其它感知等富有价值的有机元素, 模仿了生物的基因功能、繁殖、遗传、免疫和进化机制, 以实现计算机系统从“信息处理平台”向“知识处理平台”的跃升。数字有机体是一种自适应、自传播和具有自组织、自学习能力的先进信息代理。可以为人类用户完成大范围内的人工智能技术支持,包括搜寻、恢复、分析、知识创造和推测。并具有自防御、进攻和复制能力。可以构成像生物有机体一样可长久生存型自适应抗毁信息结构。

关键词: 数字有机体 知识创造 抗毁结构

1. 前言

21 世纪初叶是中华民族伟大复兴的时刻。一系列令人兴奋不已的技术创新和群体突破正在我国的信息产业领域发生,推动着我国从信息大国向信息强国转变。

我国政府十分重视信息化对21世纪经济和社会发展的推动作用。提出了跨世纪信息化发展纲要。《中共中央关于制定国民经济和社会发展的第十个五年计划的建议》给予信息化以高度重视,指出:“信息化是当今世界经济和社会发展的大趋势,也是我国产业化优化升级和实现工业化、现代化的关键环节,要把推进国民经济和社会信息化放在优先位置,顺应世界信息技术的发展,面向市场需求,推进体制创新,努力实现我国信息产业的跨越式发展”;并且明确提出:“大力推进国民经济和社会信息化,是覆盖现代化建设全局的战略举措,以信息化带动工业化,发挥后发优势,实现社会生产力跨越式发展”。

中国国家下一代互联网( CNGI) 示范工程以及电信业的下一代电信网( NGN ) 启动, 标志着我国信息产业的创新和突破进入了一个全新的阶段。在这一阶段, 我国在一些重要的标志型技术方面和西方国家站在了同一起跑线上。而在上世纪90 年代, 我国信息技术的群体突破还限于打破别人的封锁和垄断, 例如当年的程控交换、SDH 和DWDM, 比别人总要晚几年甚至二、三十年时间。

在上一世纪末,由于美国在信息产业的发展策略上坚持“市场原教旨主义”,美国发生了由于泡沫经济而引发的“新经济”条件下的第一场经济危机。这场危机波及了全球的信息产业,至今“泡沫经济”的影响仍未散尽。

在这种情况下,一些人士根据美籍奥地利经济学家熊彼得(Joseph Alois Schumpeter:1883 ~ 1950)的产业发展周期理论提出预测,认为信息产业革命的中高级创新阶段快要结束,信息产业开始逐步转为成本竞争阶段,信息产业将由长周期的繁荣转向长周期的衰退阶段。

熊彼得是20世纪最为著名的两位经济学家之一。他在1942年出版的一本名著《资本主义、社会主义与民主》中预言,企业创新将使旧的发明、观念、技术、技巧和设备成为荒废之物。不管现存的管理结构怎样,资本主义将沿着怎么创造就怎么样毁灭的路走下去。熊彼得认为,资本主义将由经济内部的不断创新要求而不断地毁灭。熊彼得的经济周期理论正是这种“创造性毁灭”规律的体现,它是资本主义竞争的基本规律。

但是,信息产业发展的周期是工业经济向知识经济转变的第一个长周期,其发展规律与工业经济时代应当有一些本质的差异。在信息产业发展的长周期内,经济的增长主要来自于信息产业,其显著的特点是创造和应用知识产品。而工业经济时代的制造业是把原材料转化为最终产品,属于凝聚资源的产业,其发展面临边际收益递减的困境。而信息产业是“凝聚知识”的产业,面临边际收益递增的趋势。这种趋势可以形成经济加速的正反馈效应和带动传统产业的溢出效应。正反馈效应可能造成失控,产生自激而产生泡沫,这就是我们看见的泡沫经济及其负面影响。也是我们看见的酷似工业经济时代产业革命长周期结束的衰退情况。不过我们认为,信息产业还有一些期望中的重大技术创新正在进行,信息产业出现的低潮应当是经济发展中等周期的谷底。信息产业的新的技术创新将创造新的生产力因素,为下一代经济高潮创造条件。

随着CNGI 示范工程的建成和NGN 的推进,我们将迎来信息革命的下一次浪潮。在信息革命的下一次浪潮中,除了下一代互联网和下一代网络之外,还应当有一当仁不让的主角,这就是下一代计算机系统。

我国随着CNGI 示范工程的建成,迎来信息革命的下一次浪潮。在信息革命的下一次浪潮中, 除了下一代互联网和下一代网络之外,还应当有一当仁不让的主角,这就是下一代计算机系统。

2. 数字有机体的特点

电子科技大学提出的“数字有机体”这样一种新一代计算机系统,应当成为我国信息革命下一次浪潮中的新星和主角。

电子科大8010研究室在多年研究分布式并行计算机系统的基础上,进入了数字有机体的研发。在自主知识产权的操作系统和数据库的支持下,“数字有机体”项目已形成系统并开始投入实用。

因此,继作为第五代计算机技术的标志——分布式并行计算机系统之后,一种具有生物体基本特征的计算机系统——数字有机体应运而生。它将具有如下特点:

1)数字有机体具有从环境中获取正确的数据,并将其优化提取为行为的知识,包括对确定性及不确定性的管理和决策。数字有机体将完成计算机从信息管理平台到知识管理平台的跃升。

2)数字有机体具有生物体的自适应、自学习以及自传播和自复制的能力,是一种作为人脑功能的延伸的先进信息代理,为人类用户完成大范围内的人工智能支持,以完成目的驱动活动。

3)数字有机体模仿生物体的基因直至种群,采用大量分布式并行的加工系统,组成有机的整体,即分布式并行操作系统和数据库。以获取、储存、传递、交换以及利用大量适合的信息。自动匹配所分配的资源,完成预定的任务,即协同工作的网络计算。

4)数字有机体模仿了人类抵御病菌侵袭的免疫系统的免疫机制,采用安全自主式数字代理程序可以完成可信赖的安全任务。可以完成协同检验入侵(包括自学习——获得性免疫机制)、响应、自主防御和攻击计算机病毒以及恢复受到破坏的网元的功能。数字有机体可以具有如生物种群一样的自适应抗毁结构,因而可以为大规模的信息基础设施和系统提供自动化抗攻击的手段。

5)数字有机体模仿了生物体的遗传能力,因而开始具有犹如生物一样的进化能力。它采用一整套遗传学算法,可以自主地将适应环境和竞争的所发生的操作程序保留,而淘汰不适应环境和竞争的部分,体现了生物学的“物竞天择、适者生存”的达尔文进化理论。将有助不断提高对特定复杂问题进行推理并做出决策的能力,以及系统的生存和抗毁能力。获得性遗传将使系统日渐“聪明”和“强壮”。

6)数字有机体模仿了生物体的基因功能。生物体的基因具有全息特性,某物种的所有基因都具有该物种的生命程序。而数字有机体的每一个网元都具有完整的操作系统,但它只有在自动软件代理的作用下才能发挥网元应有的作用。在竞争和冲突的环境中,只要有一个网元残存,也会将既定程序继续执行,保持系统在性能适当降低的情况下生存下去,而不至崩溃。

7)数字有机体模仿了生物的繁殖能力。数字有机体可以将正在运行的数据库内容经由不同路径存入不同位置的其它网元的数据库,作为“副本”复制或繁殖成两个或多个。当入侵发生而导致正本——软件代理“死亡” 时,“副本”将取代“正本”执行软件代理功能,隔离“死亡”节点,并根据学习或预定要求,繁殖出更多的“副本”,以应对下一步发生的入侵和攻击。这一种分布式的防御系统可以具有理想的多样性实现,避免了常规系统的脆弱性。

8)数字有机体模仿了生物群落的生态链系统。以公共对象的开放式交换协议,支持数字协调代理利用跨网络异质数据库,通过多媒体或超媒体提供虚拟对象层次数据库功能。以构成异质数据库的生态链系统和价值链系统。“数字有机体”强调了与其它网络和异质数据库构成功能强大的有机的生态系统,但它绝不充当任何网络的附庸。自主知识产权的操作系统和数据库将作为自身安全的基本保障。

9)数字有机体采用最接近理解人类自然语言的语义Web 这一智能型网络技术,它可以帮助人们提高自身的直觉和分析能力。因而可以对特定的复杂问题进行逻辑推理并做出决策。

10)数字有机体采用了处理人类社会的复杂问题的社会科学方法论,例如经济学等。也正在考虑从人类的文化艺术中借鉴其营养成分,以期“数字有机体”未来向人类的“文化有机体”的融合。

电子科大8010研究室对数字有机体系统的一个根本观念在于,引入了人类信息结构中经验、知识和其它感知等富有价值的有机元素,并且模仿了生物的基因结构,繁殖、遗传、免疫和进化机制。以实现数字有机体系统由“信息处理平台”到“知识处理平台”的跨越式跃升。对获取知识和对知识进行处理的价值理论贯穿了过程的始终。这也涉及对信息和知识这一抽象资源进行定义、量化和处理。由于这一范围的外延很广,我们还采用了现代经济学对有形资源进行度量和处理的方法来度量和处理信息资源。

3. 全球自然史的启迪

通过自然史,人们知道了更多样化和复杂的类是如何产生的。地球上的事件与其他行星上的事件形成十分显著的对照。行星上有地质和气候的扰动,而且仍在继续。但是没有地球上生物物种的形成,没有相互竞争,没有生存竞争,也没有适者生存。但是生命的故事不同了,与物理、化学、地质学或天文学不同,我们可以学到一些新东西。

在生物进化的历程中,生物在变化的环境中延续和生存下来。自然选择与自组织的作用,使这些“平衡系统”中的创造性时常与机遇和混沌交织在一起,构成了进化的根源。对自组织作用的认识,是自达尔文以来,生物学家一直认为自然选择是进化唯一根源之后一大进步。

在自然史中进步可以定义为“增进获取和加工有关环境信息的能力”。进化——再生这样的现象可以理解为成就和力量方面超过以前的水平。多种多样的物种,每一种都有自身的价值,呈现着价值观的多元化。或者有更复杂的技巧,诸如获得知识的能力;或者更适应于生存的能力,例如在寒冷的气候环境中有较厚的皮毛。生物生存在一个迂回曲折的世界之中,自然史是增进多样性和复杂性的进步的故事。从微观的角度讲,进化把基因的适应调节系统调节至有序的领域。秩序建构在无序边界最有可能。

如果我们考查物理学和化学,自然界中有两类东西:物质和能量。但是如果我们考查生物学,那么我们就有了第三类东西:信息。物质和能量不可能创生和消灭,两者可以相互转化。生物体表现出的多样性和复杂性的建构,如果不在物质和能量存在的同时创生组织和维持结构的过程的信息,是不可能出现的。正是这种信息,记录在基因之中。而且信息与物质和能量不同,可以创生也可以消灭,这种遗传信息是生物自然界的关键。

在进化的种群中,基因库获取、储存、传递、变换并利用大量比较适合的信息。这些大量分布式并行的加工系统的信息处理能力远高于目前那些最复杂的人造系统。

从生物学的角度来看,在生物体的自我中,以它自身的完整性维护者一种建构的(系统性的)、负熵的(信息论的)控制论的完整性,这是一种内在的价值。生物体利用它的基因,以保护其它的内在价值。

生物的价值有内在的、工具性的和系统性三种,这三种价值相互交织在一起,在重要性上,没有一种最终比其它的更为优越,虽然系统性价值是基础性的。内在价值的每一个部分都在保卫自身的类,每一个这样的生物体在系统中也掺入了工具价值。如果没有内在价值,也就没有了工具价值,也就没有了其它价值的系统创造性。适当的理解是,微观的基因层次的内容反映了物种生态系统层次的故事,生物个体是宏观的中间层次,基因组则是一种编码物种的操作系统和数据库,个体是这种操作系统的具体化实例,而生态系统则是产生一切生命的发生基质。

生命的故事映射了信息科学三大基石:信息论、控制论和系统论的重要内容。

人类作为地球生物圈的最重要环节,还给我们留下了更多的东西。

人类的祖先传递给后代有两大类基本的信息系统,一是由基因传递的生物遗传密码;二是神经—生理及社会—心理机制传递的语言能力。对这两大类信息系统的研究,用计算机系统逼近和实现,是我们研究的目标,也是我们实现跨越式发展的动力所在。人类祖先传递给我们的还有两类宝贵的财富,这就是知识和智慧。知识可以被认为是被理解和解释的信息,而智慧则是被理解被有效利用的知识。

计算机科学目前是一门信息处理平台建构的科学,也是人类文明史一大飞跃的标志,是继文字发明、印刷术、近代以电视电话为中心的媒体革命之后的第四次先进文化作业方式的革命。研究三十亿年来生物进化史弄清自然界的文化创生及其意义,将对计算机科学演进提供不可取代的重大意义。

信息技术、计算机科学的进展,以及我们对自然史和人类及人类社会自身更深刻的认识。计算机科学从一门信息处理平台建构的科学跃升至知识处理平台建构的科学的时代已经到来。

4. 社会科学与生物学——对外部复杂世界的理解

数字有机体在其自身的演进过程中,除了从计算机科学的基础:信息论、数学、语义学的发展中汲取营养和动力以外,作为有机化、生物化的特征,还必须向人类的社会科学以及生物学学习处理复杂外部世界环境的智能技术,这些内容目前包括:

  • 将外部世界的复杂变量抽象为“价值”;
  • 利用现代经济学对价值的处理进行分析和建模,用以处理复杂事件和环境,特别是数字有机体进入冲突和竞争环境的分析和决策;
  • 利用基于自然选择和自然遗传的生物学方法,引入了加工和适应环境的进化机制。也提供了解决复杂问题的一种新的途径。

4.1.市场——具有自组织能力的复杂外部世界

市场经济的鼻祖亚当•斯密200年前在《国富论》提出:人们在追求私人利益目标时会在一只看不见的手的操纵下,实现社会资源的最优配置和增进社会福利。

亚当•斯密相信市场规律具有一种天然的约束力,即人类社会存在着一种自组织能力。这就是著名的“看不见的手”理论。这一假设在理性和完全信息,即处于一般竞争均衡的前提下是有效的。

此时,市场将存在资源配置的帕累托效率:

1)交换效率

商品必须以不可能从进一步交易中获益的方式在所有个人中加以分配;

2)生产效率

经济必须处于生产可能性曲线上;

3)产品组合的效率

经济必须生产反映消费者偏好的产品组合;

在一般竞争均衡条件下,任何一个社会想得到帕累托有效资源配置都可以通过市场机制来实现。

因此,当“价值”的内涵被确定之后,由价值而代表的资源、资本、信息的最优化配置在一般均衡条件下可以比较帕累托效率三个方面来确定。一般而言,信息和知识的交换中产生的价值由帕累托效率的第一个方面确定;信息和知识自身的价值可以由第二方面确定;前两者可以由信息体价值公式予以诠释。也可以由柯斯定律加以进一步的解释。而不同信息体之间组合相互作用则对应于帕累托效率的第三个方面,所谓“梅特卡夫定律”则给了形象化的解释。

然而,在不少情况下,由于某些原因,例如竞争受到限制以及信息不对称——竞争模型不能提供对经济的很好描述,失业和环境污染,突发事件,都可以使上述一般均衡条件失灵。从国家治理来讲,需要政府这只“看得见的手”的干预;从信息和知识管理来讲,需要人为的干预或系统经“学习”后对冲突事件的决策。

数字有机体采用了经济学方法论针对复杂事件的处理。因为,“价值”理论可以将复杂的多变量关系简化和抽象为“价值”的处理。采用了人类对世界复杂性理解的社会科学方法论。应当讲这是一种有效的方法,但并非是一种求得精确的唯一解的方法。因为经济学并不是一门精密的科学。

现代控制论中,有一个公认的“不兼容原理”。它认为高精确度和高复杂性是不兼容的。计算机科学的奠基人冯纽曼(Von Neumann)曾提出:人脑是这样一种“信息处理机”,它的各个元件的精确度很低,而它的各层次结构的复杂性极高,因而可以保持可靠性。

计算机科学在自身生物化、有机化的进程中,学习人类处理自身组织结构的方法论,应当是必须要经历的过程之一。

数字有机体目前采用以下与经济学有关的方法论有以下几个方面:

1)在一般均衡条件下,信息和知识管理理论

2)决策论

3)博弈和不确定性

4.2.生物学方法——向大自然学习的数字有机体

遗传算法模拟了基因在自然选择压力下似乎是偶然的探索。现代生物科学的探索已经发现,自然选择并非是完全随机和盲目的,“自组织”的作用大大加快了进化的进程。

完全模拟自然选择的系统是不一定现实的。因为自然系统对于有限的时域一般是发散的、非闭合的。遗传算法的过程大部分是试错法,但加入了由于“自组织”作用而产生的足够高的选择性。选择性的提高,例如可以采用来源于遗传算法中模拟生物体的有性繁殖和杂交优势技术。

人类解决问题的方法,从最鲁莽的到最具有洞察力的,无非是试错法和选择的各种不同的混合。

遗传算法涉及组合和重组一个问题的部分解,以便产生改进的解。这是一种基于自然选择和自然遗传学的检索算法。其程序的模型是生物学模型:性交配和染色体上的基因串可以被混合和选择。潜在的隐喻是自然选择,因此这一领域也被称为进化计算。

数字有机体开始运行程序时,将产生一些解的可能值,它以“比特串”或“基因型”序列出现,类似编码在染色体上的信息。这些序列是最初的“种群”。然后检测种群中哪些成员在解中有效,再把它按“适应性”而排序,并选出其中最适应的成员。然后,计算机将在最高等级的解中激发变异——“突变”,以产生新的解,并抑制低级的解;为它们的“适应性”评估新的可能性,让它们与以前的部分有效解相互竞争。数字有机体也使不同的解相互“交配”,切下和拼接那些似乎是编码了最有效值的比特串,然后检测这些“后代”的适应性。

遗传算法还模仿取得远缘杂交优势的作法。数字有机体对相互校准的族群进行工作,使之进行交配,并可能改变它交配的解集集合的“种族”大小,并舍弃低适应性的解。如果两个或更多的很少共同点的(局部最优相距甚远)解集开始出现,数字有机体将保存这些多重解的轨迹,并尝试偶尔将不同的局部最优分段交叉混合,某些交叉混合将在有足够适应性的后代中形成,从而可以保持在有效的种族中。远缘杂交方式可以防止陷于在总体范围内不是最优的局部最优之中。这与杂交水稻、杂交玉米的育种程序有些类似。意味着加入了加速进化过程的“人工选择”的过程。

需要指出的是,与自然界相比,目前任何一种计算机系统的设置是相当简化的,它必然抽象掉了生物学的许多丰富内容。

不论怎样,遗传算法的使用提出了一种进化的观点,自然选择、遗传和变异的机制,可以用于传递和处理信息、提取知识。生物机体是无比的问题解决者,利用进化的机制,通过突变、重组、再生并且检测,可以“培育出”新的甚至当时还没有人完全理解其结构的软件甚至计算机芯片和系统结构。

5.从信息处理平台到知识处理平台

数字有机体将完成从信息处理平台到知识处理平台的过渡,必须具备对数据、信息及知识进行确定性分析的有效方法。对数据和信息的处理涉及对分析性和综合性先验知识的学科如信息论、控制论和系统论、,他们符合现代科学的逻辑标准和陈述方式,他们符合经典“本体”的逻辑规则,即逻辑上的可推演性、自洽性、简单性和可检验性,以及陈述方式符合科学陈述的语言特征:普遍性、精确性、开放性和直言式。

然而,人类对大量知识的认知受到知觉和感知的不完全甚至错误而无法用“科学”的逻辑标准加以陈述,而它们又是大量的客观存在。其中最重要的是人类的自然语言,它无法用经典的三段论式加以完全规范。

因此,在对知识的处理的问题上,我们不能不求教于不那么“精密”的经济学和生物学。这两门学科存在着一个共同的特点,它们承认并且具有综合后验知识(Synthetic a Posteriori Knowledge)的处理能力。

所谓“后验”,即凡是在感觉经验基础上获得的,或从经验的角度也包括在信息不对称情况下认为是合理的知识。它并不一定可靠,但却可能包含新的知识。通过试错和选择的“进化”机制,可以“挖掘”出新的知识。这类知识在工程和科学上有很大的实用价值,也可以在处理人类自然语言方面,发挥重要的作用。事实上,人类和生物体实现其“价值”的行为,主要的是在不完全信息条件下,加工和适应环境的过程。在不完全信息条件下,如何生成知识的过程,是数字有机体的有机化进程的核心所在。

5.1 创造知识的方法

根据创造知识的推理方法,可以把创造知识的方法分为两类,即数据挖掘(Data Mining)和数据融合(Data Fusion)。

假设一归纳推理过程,称为数据挖掘(Data Mining)也称为“数据库中的知识发现(Knowledge Discovery in Database,KDD)”,是通过寻找一定意义上“感兴趣”的模式或者是数据间的关系,在众多数据源中检测先前已经被认知的模式(有关数据中一个已知模式存在的新知识),而理解当前状况的过程。

进行了对比,在数据融合与数据推理中,创造知识所使用的数据是不完整和动态的,包含了被噪声污染的数据,这些不确定因素应用下述方式进行特殊处理予以消除。

  • 模拟描述——数据挖掘寻求归纳一般的模型描述(参考模型,资源描述框架)以描述所理解的数据的特点,而数据融合运用这些描述来检测新数据存在的类型。
  • 推断的知识中的不确定性——数据和参考模型是不确定的,从而导致了认知或知识的不确定。
  • 推导的知识的动态状态——推导知识过程是连续的,推导而得的知识是动态的,而且在新数据到来之后还将推导的知识进行提炼。
  • 域知识的使用——除了所观察到的数据以外,也可以使用有关域的知识(即限制条件和应用环境)。

5.2.语义Web的理解和内涵

语义Web就是建立一个以本体(Ontology)为基础的具有语义特性的网络,使计算机能真正理解数据的语义,随着语义Web在实际中的推广,人们期待已久的各种智能化网络应用将成为现实。

“本体”是一个古老的哲学范畴,按照古希腊哲学家亚里斯多德的理解,自然界的一切变化都决定于这些本体,它是事物运动、变化的“质料因”。西方哲学和自然科学的发展史,可以讲是与“本体论”的产生、发展、怀疑、批判有密切的关系。引入“本体论”的语义Web,它不应当再是研究“是”之所以“是”的古老理论的翻版。必须具有人类对客观世界新的认识的广泛内涵。它应当具有下面四个方面的基本构成:

  • 决定事物基本构成的本体;
  • 决定事物基本性质的本体;
  • 决定事物自我生成的本体;
  • 概念本体——对事物的存在和运动方式的高度抽象。

它可以组成人类认识世界知识的“海量百科全书”。

在语义Web中,本体的作用应当为:

  • 给出在不完全信息条件下解的限制条件和环境条件,即“域知识”; 
  • 提高不完全信息条件下对复杂问题解的选择性; 
  • 给出不完全信息条件下寻求归纳的一般模型描述;
  • 对传统逻辑三段论式提供“变元”的定解; 
  • 作为“后验”的假设推理而得到的新“知识”的学习成果作为“信念”存入本体。

对语义Web本体作用的定义打破了经典逻辑的束缚,它具备了类似生物体对外部环境(这种外部环境在绝大多数情况仅能向主体提供不完全信息)的适应性和选择性,并具备对外部环境信息加工为认知的能力。它不再去回答“是”之所以为“是”的古代经典,而去进行从混沌或模糊条件加工或创造出“确定性”的工作。这个过程,从本质而言,正是从热力学第二定律所描述的物质运动从有序走向混沌的熵增加的进程中,利用信息、知识、智慧获得逆向的负熵流的过程。这也从一定意义上说明,作为逻辑学——哲学的一个组成部分,应当是具备解释自然科学和社会科学的普遍意义的能力,然而古典逻辑却与物理学和信息科学的基本定律和原理相悖。这注定了语义Web必须冲破古典逻辑的桎梏,而回归到对人类社会和自然史的认知上来。

6.数字有机体——具有生物特征的可长久生存型的信息结构

计算机系统一旦进入经济、政治以及军事社会的领域,也就意味着进入了竞争、冲突的环境。在冲突中的生存能力,也就成了计算机系统必须面对的课题。新一代计算机系统——数字有机体在冲突中采用了生物体乃至人类运用信息的一些基本原则,即在面对攻击时,如何取得信息优势而得到防卫和生存的能力。

公元6世纪,中国的军事战略家孙武在《孙子兵法》就阐述了信息和信息优势的重要性:

  • 孙武曰:“兵法,一曰变,二曰量,三曰数,四曰称,五曰胜”。孙武在这里说明了监视、评估、对策、选择的评价过程及决策的风险中,信息的重要性。
  • 由信息不对称性而呈现的对信息的占有,以及对可能出现的预测和决策是区分军队的优劣的分水岭。孙武云:“故明君贤将所以动而胜人,成功出于众者,先知也。”

早在2600年前,信息的获取、处理、分发这些准则以为我们的先人所运用。将信息转换为有价值的知识,并进入数字有机体运行和提高生存能力的设计思想,将远胜于仅在物理层设置可靠性保护备份的系统。因此,在数字有机体中,采用了类似人类的免疫机制来构筑自适应、自学习和鲁棒性的安全体系。

6.1.经典的可靠性保护方式

经典的可靠性保护系统的理论是基于电子设备的故障发生概率服从于统计分布。当用物理方式设置系统的可靠性备份时,由于工作设备与备份同时发生故障的概率在设备系统的有效寿命周期内服从二项式分布(在大数量时服从正态分布)。因此,在忽略串联单元影响时,在系统的寿命周期内,可以将系统的故障概率降低一个幂级数。因此,用可靠性备份的方式是提高电子系统可用性的经典方式。但是,系统也沿用这种方式,运用于冲突和竞争的环境中,将出现如下困难:

1)在有冲突的环境下,攻击方可以针对串联单元如保护切换本身发动攻击。而在主备切换方式中,切换在可靠性模型上是一个串联单元,事实上系统可靠性由保护切换的可靠性决定。切换失灵,系统将整个失灵。

2)在主用设备被攻击失灵后,主用设备即使被倒换到备用设备上,攻击方仍然可以用同样的策略对备用设备发动攻击,从而使系统失灵。

在这种情况下,一些重要的行业的信息设置,例如政府、金融、军队、电信和广电的关键信息设施不得不引入“灾难性备份”的概念,为了避免在受到攻击时与主用系统“同归于尽”,它们在地理上可能作离散的安排,系统上与主用设备完全独立,甚至平常处于不为他人所知的蛰伏状态,在冲突或攻击造成主用系统崩溃以后,才投入使用。

3)为了系统生存性的需要,必须用资源的耗费来换取可靠性。例如通信网广泛采用的光自愈环系统,被认为是可靠性设计的重大成功,受到广泛的推崇。但它需要100%的额外网络余量用于自愈环保护。此外,用于DXC交叉连接还需要30%至60%的额外网络容量。光自愈环方式采用了环路保护,避免了早期的可靠性保护方式攻其一点,全线崩溃的“单点易损性”的问题。但它对额外容量的巨大需求,仍然可以认为它与早期的可靠性保护系统一样,基本上属于“蛮力”实现的系统。

6.2.数字有机体的耐久性与抗毁性——自组织特性的体现

  • 容错能力——指信息系统承受攻击的能力,能适度降低系统性能(而不是系统“崩溃”)并分配响应资源。
  • 鲁棒(Robust)的自适应响应——信息能够检测出各种复杂的反常事件(包括前所未见的事件),向存活部件分配关键任务,隔离失效节点,并可以准实时地作出适当响应的能力。
  • 分布式和可变性能力——分布式的防御系统结构具有理想的多样实现,不带有单点的易损性,可以避免常规设计带来的脆弱性,即对单个部件的攻击将影响所有的串联部件。
  • 运算和恢复能力——评估损失,有计划地还原,完全恢复服务和信息的能力。

由于复杂系统不可避免的有其薄弱环节。模仿生物体的免疫系统来设计一个自适应的为信息基础设施提供鲁棒的自动保护系统,是一种先进而且安全的考虑。

类似人类抵御病菌侵袭的免疫机制,响应序列由四个层次构成,每一层代表更严重的响应级别。(表6.1)

许多独立细胞之间的相互合作形成了极其复杂而有效的分布式并行生物安全系统,它可以成功地防御难以理解的各种侵袭,如伤害和疾病。

电子科大8010研究室的数字有机体系统正是这种生物化、有机化的机制。

  • 由在地理上可以分散布署的一群电脑组成的分布式防御系统没有单点易损问题,在整体上更加安全。
  • 分布式并行各节点之间相互支持、协同工作,有利于稳定系统和抗毁能力。
  • 分布式并行的各网元和各节点可以共享资源和高速连接,其强大的功能可以实现对安全事件的可量测性(在正常情况下)及可容错性(面临失效或攻击)。
  • 正本的动态转移功能保证一种自动软件代理功能,为了整体的安全性,识别入侵并作出针对性反应。正本肯定是攻击者的首要目标,分布式代理的方式肯定有效地提高了系统的生存能力。
  • 动态的分布式并行数据库备份方式和恢复方式较传统的热(Hot)和暖(Warm)备份方式,提高了效率、灵活性、特别是抗毁能力。

美国国防部高级研究计划局(DARPA)正在开发的抗毁项目采用了“公共健康系统”模型,其模型可以概括为:

1)采用了分布式的免疫控制系统;

2)积极探查和确诊攻击,并向网络人员通报;

3)给可信部件重新分配关键性任务;

4)隔离不可信部件的检疫过程;

5)对网络人员进行免疫处理。

电子科技大学8010研究室的数字有机体设计思路和实现目标基本上是与上述模型有许多共同之处,而且形成系统接入应用。因此,可以为一些大规模系统提供自动化的抗攻击工具。

6.3 已实现系统的基本功能

1)系统由网格构成,电脑及信息设施住于网格节点上,节点之间的互联经由网格并可由不同的路径组成,整个系统按分布式并行的原理由自动软件代理协调协同工作。

2)每一个节点或网元均具有完备的操作系统,犹如生物体的每一个细胞都具备作为生命程序的基因一样,以保证在面对攻击时,只要有一个网元残存,系统还可以适当降低性能的情况下生存下来,而不至崩溃。

3)当系统处于常态时,每一个节点的数据应用内容和程序被及时复制或“繁殖”到异地和相关的节点,根据使用的重要性和频度所标定的价值函数,“繁殖”出的副本数量根据预定或网络“学习”以后形成的策略在异地形成两个或多个副本并且具有不同的路径。在正常情况下,各节点在“正本”的软件代理协调下,以组态方式工作。但“副本”不参加运行。

4)当系统中的一个或多个节点(小于节点总数)受到攻击或发生故障时,受到攻击或发生故障的节点“死亡”或“受伤”后,系统将“死亡”或“受伤”的节点迅速隔离。由“风险决策”或“价值决策”(应对故障)而决定的某一副本庚即启动,替代已“受伤”或“死亡”的节点的工作而成为“正本”。这个过程可以连续发生。但只要剩下最后一个节点,系统仍然可以执行预期的主要工作任务。

5)已“受伤”或“死亡”的节点,将由附近的节点“诊断”,并进行修复或重新启动,直至“宣告死亡”,通知修护人员进行人工修复或更换。

6)被启动的“副本”转为“正本”以后,如果被攻击的节点“死亡”已被确认,系统将根据风险决策或价值决策的原则,复制或“繁殖”出更多的必要的副本,以保证系统在受到“攻击”或故障发生后,再次面临新的“攻击”或故障时,生存能力和可靠性必须得到保障。

这种方式不仅仅解决了经典的“可靠性备份”存在的问题,也大大超越了SDH/SONET光自愈环保护机制,其应用前景是难以估量的。

在这里,我们把与每一次冲突看着是“事件”(Event),对“事件”所采用的“行动”(Operations)有两种原则:

1)用物理上的冗余以对抗,例如备份设备,额外的网络容量,建设地理上分离的通路等。

2)对事件的理解和精确控制,分布式并行工作,自适应,复杂化以及能力和意志的对抗。

第一种方式沿用的是工业经济时代的典型方式,它服从统计分布,也就是服从热力学的熵增加原理。这种方式缺乏足够的智慧来应对灾害。

第二种是将对事件了解的信息提升为知识,用知识精确控制处理事件,由物理的能量和物质消耗转变为了信息消耗和信息的精确控制。这正是知识经济所体现的特点,也是现代信息战的重要核心原则。这种方式用知识和智慧处理引入了负熵流,因此并不能简单地用统计分布来解释和处理事件的过程。

这是一种生物化、有机化自适应的反应机制,它模仿了社会化的生物群落在面对冲突时的应激反应。是30亿年的生命发展史给我们留下来的宝贵财富之一,可以构成具有生物特征的可长久生存(Survivable)的信息结构。

7.数字有机体出现的意义

7.1 计算机技术历程和互联网的发展

美国的微电子计算机中心(MCC)与欧洲信息技术研究与发展战略计划(ESPRIT)以及日本通产省(MI-TI)启动的第五代计算机研究计划将大规模集成电路计算机以后的发展基本定位在分布式并行网络单元计算机上。

在前四个发展阶段,计算机的所有信息都要通过单一的中央处理器CPU。这种单一处理器最终确定了计算机的性能。因此,单一处理器的方式被称为“冯•纽曼(Von Neumann)瓶颈”,其命名来自于数学家和计算机先驱冯•纽曼。

按照冯•纽曼在1945年关于“离散变量电子计算机的报告初稿”中的设计,计算机需包括下列五个主要部分:中央算术逻辑单元、用于协调操作的中央控制单元、存储单元、输入单元、输出单元。它使用二进制,电子计算机操作按时间有序的执行操作。不少的计算机和语言例如COBOL、FROTRAN、BASIC、C等遵循这种有序方式完成其工作步骤的原则。

第五代计算机的关键是分布式并行处理技术,它指的是多个处理器、数据库之间的联网工作,在分布式处理中,两个或多个相互连接的处理器可以同时处理同一个应用程序的不同部分。可以用普通PC实现很大的速度方面的优势。

分布式并行的组网,也促进了多任务的工作方式。通过将分布式并行数据库联网,不同的计算机处理器就可以并行运行多个应用程序。而且不仅仅是计算机,人们和应用程序也开始并行工作。因此,在互联网上,不同的部门并行工作成为可能,即使他们相隔千山万水。

采用分布式并行技术的计算机系统,突破了冯•纽曼瓶颈对计算机技术发展的制约。

随着对冯•纽曼瓶颈的突破,我们迎来了一个新的时代,这就是以电脑——互联网为先进生产力代表的知识经济时代。

从最基本的意义上来讲,互联网诞生的原因之一就是,通过启用一组共同协议,越来越多的计算机系统及组合获得了交际能力。从最终用户的角度来看,互联网也许像一个统一的系统,但事实上它是一个有许多相互合作的计算机网络组成的庞大集合体,越来越多的个人与团体决定共同操作计算机系统,功能越来越大的分布式并行计算机系统成为计算机技术发展的主流。

在这里,需要指出的是,第一代互联网技术事实上是处理人机基于Internet的交互,而计算机与计算机之间的交互还难以进行。在Web技术发展的第二阶段,在XML的基础上,可以处理计算机——计算机的交互,即计算机——计算机分布式并行工作,下一代互联网无疑是由分布式并行计算机系统组成的网络。

互联网技术的真正独特之处在于,利用它可以在以前无法沟通计算机功能孤岛之间建立一种流动的、多样化的连接。在此基础上,一系列将越来越多的跨国互联网团体捆绑在一起的应用程序成为可能。

由于互联网把从性质上讲受到局限的互不相干的计算机活动连接起来,人们发现互联网的用途很广。事实上,互联网正以超人意料的速度迅速普及,将其他许多很有潜力的网络排挤出去(例如ISDN、ATM等)。通过提供一种适应时代发展大方向的现成手段,互联网成为了主流。

作为电脑网络空间组成部分的互联网原来是应政府机构、军队以及结为同盟的教育机构而建立的,它原本和市场经济毫不相干。近十余年来,互联网已经转向为企业和个人服务。因此,互联网的内在逻辑正在发生根本的转变。从这个角度讲,互联网已成为广义的政治经济体系的一个重要组成部分,它不仅仅是这一体系的代表,也在影响着政治经济体系的结构发展。互联网正在带动政治经济向“知识经济”转变。尤其是目前正在席卷全球电信业的摧枯拉朽的大变革中,互联网扮演了一个领导者的角色。而且我们注意到,在“网络空间”庞大的建筑工地上,各种政治经济工程都在建设之中,其中最具雄心的当是新的消费媒体的建设工程。

在这一阶段,电脑和互联网成为知识组织、传送、分发即知识联网的工具,使得信息的传输能力和知识生产能力空前提高,而成为了一种先进生产力的代表。同时,我们也注意到,在这一阶段,电脑和互联网将知识传送和分发降至零边际成本,知识传送和分发作为制约生产力发展的瓶颈不复存在。但是,知识本身高昂的产生成本依然作为生产力进一步发展而产生制约的要素。因此,除了本文第一部分提及的知识经济发展面临的“制度成本”制约之外,知识生产成本也是制约知识经济发展的又一个因素,而数字有机体作为在计算机技术发展的下一阶段,我们将面临知识创造和有机化、生物化的联网的历史机遇。知识的地位将达到一个新的空前的高度。数字有机体将作为新一代文化作业方式的先进工具,成为技术、经济、治、文化舞台上的一颗新星。

7.2 数字有机体与信息产业的第四次浪潮

在计算机技术发展的第六个阶段,出现了数字有机体,它以计算机系统的生物化、有机化为目标,将开创计算机技术发展的一个新阶段。

计算机行业一般认为,未来计算机技术面临的变革有三个方面:

*智能计算:

  • 识别特定用户和应用数据以及兴趣偏好的数据的能力;
  • 针对这些模式“挖掘”真实数据和知识的能力;
  • 分析和合成大量数据的能力。

*分布式并行计算

由一群电脑、服务器和存储器构成虚拟的大型计算机系统,以完成网络资源的充分共享和协同应用。

*高信度计算

为未来的计算创造一个安全、可靠、值得信赖的协同计算环境。

而数字有机体是一种先进信息代理,它将强调计算机系统的生物化、有机化的自组织能力,可以完成分布式并行的智能协同组网,组成高信度协同工作的生态环境,以人工智能技术支持,包括搜寻(网上浏览)、恢复、分析、知识创造、推测以及自适应、自防御、进攻和复制。

数字有机体集成了数理逻辑的最新进展,遗传学算法及现代经济学的成就,将提高人类推理效率到一个新的水平,这些工具将帮助人们可以在多学科的基础上,对特定的复杂问题进行逻辑推理并作出决策(如社会、经济、政治、军事和环境等带来的问题),数字有机体将实现计算机技术的知识表达、自主学习、演绎推理、自组织功能。

数字有机体不仅仅是计算机技术预期发展趋势的集中表现,而且还由于生物化、有机化的特征使计算机技术发生质的转变。

数字有机体与国家下一代互联网CNGI结合,将产生一种能最终理解人类智慧的智能型网络技术,可能在数字处理方面早就跑在人类前面的电脑于推理方面同样与人类的能力媲美。为人类的发明创造活动提供近乎无穷的源泉。迄今为止人类大部分发明创造与科技突破(包括互联网技术)绝大部分都是对已有知识累积进行全新组合以及在此基础上诱发突变而创新的结果,如今数字有机体模拟和“学习”了这一过程。数字有机体将可能在一夜之间“挖掘”和“融合”的知识,比一个高智商的专业人员穷其一生的心力和智慧所“想”到还要多。因此,人们因此可以更有效地获得知识,帮助人们提高自身的直觉和分析能力,从而更快地将这些知识信息进行整理综合并将其发展到更新的高度。

数字有机体与下一代互联网将开启一个智慧启迪的新时代。一方面它将促进全球范围同不同范围不同文化背景的人们进行高效合作,可以能够更加容易地解决一些重大的国际问题,例如全球变暖的问题和环境污染问题。

另一方面,数字有机体作为一种具有强抗毁能力的信息基础设施,可以构成应对冲突、反抗侵略的攻防武器,可以成为知识经济的新条件下发扬“人民战争”的战略思想先进信息工具。

数字有机体的出现,将有助于开拓新的商业应用,例如智能搜索引擎、个性化智能信息推荐、智能信息代理、智能电子商务(智能交易代理)、个性化电子服务,按需获得知识的KoD(Knowledge on Command)以及未来型的数字电视业务、虚拟现实等。

一些专家认为,继以硬件为核心的浪潮、以软件为核心的浪潮和以网络为核心的浪潮之后,信息产业必然迎来以信息采集、处理和传播为核心的浪潮。这被称之为信息产业的第四次浪潮。由信息技术引发的第四次浪潮将是21世纪信息社会的核心事件之一。是各国政治、国家安全和经济发展的制高点,各国政府从国家利益出发,纷纷调整和制定相应的战略方针、政治和具体措施,以期在21世纪处于主动地位。数字有机体正是迎接信息产业第四次浪潮的重要产物。


参考文献

[1] 江泽民.中国共产党第十六次全国代表大会上的报告.

[2] 胡鞍钢,周杰志.我国信息化发展及战略选择.电信软科学研究,总第22期

[3] 张功耀等.科学技术导论.中南大学出版社

[4] [美]Dan Schiller,杨文平译.数字资本主义.江西人民出版社

[5] [美]Joseph E Stiglitz.经济学,第3篇,不完全市场.中国人民大学出版社

[6] [英]Mark Blaug等著,张大宝等译.经济学方法论的新趋势.经济科学出版社

[7] [英]Holmes Rolston Ⅲ著,范岱年等译.基因、创世纪和上帝.湖南科学技术出版社

[8] [美]Charler M•Sarage等著,谢华强等译.第五代管理.珠海出版社

[9] 徐建军等.智能化应用的基石.计算机世界2004年底1期

[10] [美]Edward Waltz著,吴汉平等译.信息战原理与实践.电子工业出版社

[11] [美]Richard A•Poisel著,吴汉平等译.通信电子战系统导论.电子工业出版社

[12] 刘列励.新一代智能互联网——Semantic Web.电信软科学研究,总第25期


2004年11月12日