新闻资讯

金融科技中人工智能开源软件的选型方法探析

浏览:184 发表时间:2020-11-21 09:00:00


    当前全球AI主流开源软件多达90余种,各种AI开源软件的特性有所差异,这为金融科技领域的应用系统和工具的研发提供便利的同时,也造成了选型的困难。传统的依靠专家经验选择AI开源软件的方法难以合理地胜任当前金融业务的需求和金融科技的发展。因此,探索并提出一套客观的、科学的AI开源软件选型方法是金融科技发展中亟需解决的问题之一。


     金融科技中的AI开源软件选型力求面向金融业务,解决实际问题,着重考虑金融业务中面临的技术实现重点。例如,业务需求究竟突出资源利用性,还是突出兼容性等等。一般来说,AI 开源软件的选型方法包括四个主要过程:启动、构造、评价和选择。AI 开源软件的评价和选择的关键是在构造过程中明确需求,根据需求筛选候选AI 开源软件,通过从评价模型中选择合适的指标对候选AI 开源软件进行评价,最终做出选型的决策。其选型过程如下图 所示。


1. 启动

    为AI 开源软件的评价和选择定义一般的目标和需求,并确定管理相关的内容(如进度、资源、成本等),包括:

 

  1. 设定工作目标:为AI 开源软件的评价和选择制定方针策略和目标; 
  2. 建立选择准则:依据设定的工作目标,明确选择开源软件的功能性和非功能性需求,制定功能和非功能方面的选择准则; 
  3. 制定项目计划:基于以上过程建立的目标和选择准则,编制项目计划,并实施有效管理控制。


2. 构造

    根据使用AI 开源软件的领域和应用场景分析需求,评价AI 开源软件相关的必要信息,***确定候选软件集,包括:


  1. 需求分析:依据目标和业务场景确定软件需求,包括功能性和非功能性需求;
  2. 收集信息:收集满足需求的开源软件的相关信息,包括授权策略、功能接口和成熟度等;
  3. 确定候选AI 开源软件:根据需求及收集到的信息,筛选能够满足更多高优先级或关键性需求的软件,形成候选软件集。



3. 评价


根据选型需求对候选软件集中的AI 开源软件进行评价,包括:

  1. 评价计划:根据实际条件从评价计划中选择适当的评价要求,包括特性集、评价准则、评价环境、评价工具以及评价报告的要求等;
  2. 特征集:输入到AI开源软件的算法的特征和对应数据的集合。为了公平评价,通常输入的特征集应该相同。
  3. 评价准则:按照一定的标准或规则进行评价,例如,制定准则:先由n个专家选出评价指标、后按选出的评价指标进行评价;
  4. 评价环境:评价时所处的环境,如用户、任务、设备(硬件、软件和原材料),以及使用某产品的物理和社会环境;
  5. 评价工具:本文通常指用于评价AI开源软件的软件,例如准确性评价软件、可靠性评价软件等。
  6. 评价报告:按照评价计划,在评价环境中使用评价工具测量、评估AI开源软件的特性集实现水平,梳理候选AI 开源软件评价结果,并编制评价报告。
  7. 评价指标用于提供估算或评价的测度。常见的评价指标如表1所示。在进行评估时可以选择全部或根据需求选择部分指标进行评价。



4. 选择

       将候选软件的评价结果进行比较,选取最适合的AI 开源软件,并确保所推荐的软件满足最初设定目标,包括:


a)  选择准备:最终确定选择准则,并定义选择算法;

b)  选择算法:对评价结果应用某种选择算法是选择过程的重要组成部分。选择过程主要依靠对特性加权,并用某种算法综合这些带加权的评价评级结果。


        加权的考虑

        对特性和子特性的加权应反映该组织的实际需要。

        为使评价能为选择过程提供有用的信息,如果各候选软件在满足该组织的特别需求方面有明显不同, 需对确定候选软件的权重加以区别。组织应对难以评价的特性赋予较窄的等级范围。用户应为反映该组织实际需要的特性以及能被详细评价的特性制定较高的权重。


        算法类型

        在开展结果评价过程中,算法选择途径包括:

  • 1. 组织宜使用一种能够让每个候选软件得到单一评级的算法,然后再比较这些评级;
  • 2. 组织宜建立***和***的预制,任何一个软件的评级都需在这个范围内;
  • 3. 组织宜根据每个软件的优势条件进行选择。

        目前通常使用的评价算法包括基于成本、基于得分和基于排名的算法。组织在选择算法过程中,宜保证有足够资源实现这种算法,且该算法适合相应的特定情况。


        基于成本的算法

        根据需求确定***可接受的应用层次,并确定所有提供该能力的软件,将可接受的软件按成本排名。成本***的可接受软件即是可能的推荐软件。该方法的缺点是难以精确定义实际用户的需求,低成本的软件仅能满足最基本需求。


        基于得分和排名的算法

        通过给每个组织所需的权重值乘以一个数值,并累加这些乘积为每个软件计算出一个单值。在基于得分的算法中,权重是根据某些预定义的尺度反映该软件如何能满足需要的得分。在基于排名的算法中, 被加权的数是一个与其他考虑的软件,进行比较时反映该软件如何满足需要的顺序排名。


        轮廓算法

        消费产品测试机构通常会对每一种候选产品提供轮廓形式的结果,评价对用户比较重要的特性,并将结果输入到选择过程中。选择者检查这些轮廓性结果并给予不同的特性对于该组织的相对重要性的判断来进行选择。


c) 评估评价结果:将选择算法应用到候选软件集评价中进行综合评估;

d) 推荐***结果:确定***候选AI 开源软件;

e) 软件验证:将推荐的选择决定与最初的目标进行确认。



表1 评价内容与对应的指标


评价内容评价指标指标详解
功能完备性软件涵盖的AI算法、数据处理方法、与外界进行交互的完备程度;
正确性使用软件实现算法、进行数据处理、与外界进行交互时的正确程度。
适合性使用软件实现算法、进行数据处理、与外界进行交互时的适合程度。
性能时间特性响应时间、周转时间、吞吐率。
资源利用性CPU占用率、内存占用率、外存时间负载、外存空间占用率、传输带宽负载、I/O设备占用率。
容量***请求数、事务累积容量、数据吞吐容量、数据处理容量。
兼容共存性在与其它软件共享通用的环境和资源条件下,AI开源软件能够有效执行其所需的功能并不会对其它软件或其它AI开源软件造成负面影响的程度。
数据一致性软件实现降低数据同步延迟,保证数据的一致性,避免造成数据混乱和失准的程度。
可协同性被测AI开源软件与其它AI软件以及训练的模型间的互操作程度。
易用可辨识性根据软件资料或软件操作来辨识软件功能的程度。
易学性软件资料的丰富度、软件使用的难易度、疑难问题的解答频率。
易操作性用户使用软件实现功能的难易程度;用户通过用户界面使用软件操作的难易程度。
可靠成熟性缺陷排除率、平均故障间隔时间、故障密度、缺陷密度、验证覆盖率。
可用性服务时间率、平均故障间隔时间、特殊条件运行时间满足度。
容错性避免宕机率、避免失效率、抵御发生的误操作率、冗余率。
易恢复性复原能力、备份数据率、可重新启动性、故障通告时间满足度。
运营组织的可靠性组织涉及政治或外交时,软件可靠和安全的程度。
信息安全保密性访问数据和访问操作的可控制性。
完整性软件防止数据抗讹误能力符合需求的程度;缓冲区溢出的预防。
可核查性访问数据、访问类型的可审计性;日志保存的符合性。
维护可重用性模块可重用率;注释、代码、文档的规范性。
易修改性代码的可修改性、可配置性、维护实施的效率、修改的复杂度、软件变更的可控性。
易测试性是否可以通过软件自动验证来完成;维护后,是否容易地用检测点执行测试。
可移植适应性硬件、操作系统、数据库、支撑软件、组织环境、通信环境、数据结构、开发语言的适应能力;
易安装性软件安装的难易程度、是否会影响其它软件或环境、安装时间;安装后是否正常运行,功能是否完整,是否可由用户定制。
易替换性软件更新或升级后,相同数据或相似功能是否可以继续正常使用,新功能是否与用户期望一致,是否被用户接受。


参考文献

1. 《信息技术服务 人工智能 开源软件选型指南》(AIOSS-02-2019)

2. 《人工智能深度学习算法评估规范》(AIOSS—01—2018)

3. 人工智能在金融行业的应用探析[J].金融科技时代,2019(09):26-28.

4. 金融科技发展趋势分析[J/OL].科技经济市场


上海U8代理商,用友软件服务商,报销管理系统,软件定制

文章内容如有侵权,请联系站长删除。


推荐文章

如果需要了解更多产品信息

欢迎来电咨询

关于我们

我们的产品

解决方案

应用案例

 上海悦流软件有限公司版权所有   沪ICP备15052271号   沪公网安备 31011202004286号