大机制项目(Big Mechanism)由社交网络算法性能和硬件图形理论研究(Graph-theoretical Research in Algorithm Performance & Hardware for Social networks (GRAPHS))项目衍生而来,在2014财年获得资助,资助期5年,累计资助额0.746亿美元,年平均资助额0.1492亿美元,2018财年该项目完结时,在该项目成果基础上,衍生出世界建模者(World Modelers)项目。
2018财年项目描述:大机制计划正在创建适用于生物学、网络、经济学、社会科学和情报学等不同领域的自动计算智能新方法。要驾驭这些领域,就必须有能力从人类行为者、物理传感器和联网设备生成的大量不同数据中创建抽象但具有预测性(最好是因果关系)的模型。当前的建模方法在很大程度上依赖于人类的洞察力和专业知识,但这些模型的复杂性正呈指数级增长,现在或不久将超过人类的理解能力。大机制将创造出各种技术,用于提取信息并将其规范化,以便纳入灵活的知识库,随时适应新的问题场景;创造出强大的推理引擎,能够从一系列观察结果中推断出一般规则,将一般规则应用于特定实例,并为一系列事件生成(并计算其可能性)最合理的解释;创造出知识合成技术,以推导出抽象原理和/或创建与海量数据相一致的极端复杂的模型。大机制应用程序将通过接受以人类自然语言提出的问题、提供深入分析以揭示答案的基础、接受用户输入以改进/纠正推导出的关联、权重和结论,以及查询操作员以澄清含糊不清之处和调和检测到的不一致,来满足操作员在环中的需求。大机制技术将把大量数据整合到因果模型中,并探索这些模型以进行精确干预。该计划将癌症建模作为最初的重点,因为实验数据的可用性和问题的复杂性代表了国防部在网络归因和开源情报等领域面临的挑战。
从项目描述来看,大机制项目资助期始末,项目描述变化幅度较小,仅在2017财年及2018财年的项目描述中,将原先较为宽泛的关键应用领域(癌症建模、系统生物学、流行病学、网络归因、开源情报以及经济指标和预警)聚焦至癌症建模方面,因其在实验数据的可用性和问题的复杂性方面最具代表性。
表1 大机制项目资助计划一览表
年份 |
资助计划 |
2014财年 |
1.制定适用于不同领域的自动计算智能新方法; 2.创建提取和规范化各种信息(符号信息、定性信息和定量信息)的技术,以便纳入灵活的知识库,随时适应新的问题情景; 3.将自动化计算智能技术专门用于生物学、网络和情报学等领域的特定应用。 |
2015财年 |
1.开发推理引擎,使其能够从一系列观察结果中推断出一般规则,将一般规则应用于具体实例,并为一系列事件生成(并计算其可能性)最合理的解释; 2.创建知识合成技术,以推导抽象原理和/或创建与海量数据相一致的极端复杂的模型; 3.开发操作员钻取、模糊澄清和不一致调节工具; 4.在一个或多个应用领域展示自动化计算智能技术。 |
2016财年 |
1.通过确定一种或多种特定癌症的药物靶点和药物,展示生产模式下的原型技术; 2.演示自动测试机器生成的假设; 3.创建可视化和探索庞大模型的新模式,这些模型的整体规模超出了人类的认知能力; 4.制定统计方法,揭示数字数据/时间序列和分类数据/符号序列中的因果关系; 5.开发并实施可扩展的算法,揭示大型、复杂、异构数据集中的因果关系网络。 |
2017财年 |
1.创建界面和工具,支持基于机器的癌症路径公共网络资源; 2.创建实用程序,将基因组信息添加到机器编辑的癌症路径中; 3.发布 Ras 癌症通路的高保真模拟; 4.探索大机制技术在其他领域的可移植性; 5.探索基因型-表型模型在生物制造中的应用; 6.开发并实施可扩展的算法,揭示大型、复杂、异构数据集中的因果关系网络。 |
2018财年 |
1.将技术应用于其他癌症类别,并将技术扩展到其他问题领域; 2.开发并实施可扩展的算法,揭示大型、复杂、异构数据集中的因果关系网络; 3.开发经验算法,用于早期诊断和/或跟踪神经损伤、肌肉骨骼损伤和心血管问题等医疗状况。 |
从资助计划来看,与其它重点分析项目不同的是大机制项目的开发环节基本贯穿整个资助期计划的始终,而其它项目多为在资助中前期以开发为主,中后期以验证应用为主,但这并不意味着验证应用环节的缺失,与开发环节相对应的验证应用环节在当年或次年财年计划中会与开发环节形成配套,如2015财年推理引擎的开发与应用,以及2016-2018财年均列在财年资助计划中的用于揭示大型、复杂、异构数据集中因果关系网络的可扩展算法的开发及实施。
写在最后:大机制项目作为隶属于DARPA基础研究阶段的项目,其应用色彩十分浓厚,无论是在项目描述中对于应用领域的选定、筛选和聚焦,还是在项目资助计划中围绕开发成果应用开展的资助计划逐层部署,均体现DARPA所资助项目极为明显的应用导向。