哪些交易属于可疑交易 什么样的商品会造成可疑交易的产生影响( 三 )


关于风险信号的“频率”分析,以“午夜或凌晨交易”为例 。在类似双十一等特殊时点的小额高频交易,可能就属于一种偶发现象 。“频率”属于对事物发展过程特征的一种衡量,而“概率”往往是对事物发展结果的衡量 。从“频率”推导至“概率”,需要对整体的客户情况尤其身份背景有着较为完整和深入的认知,再通过模型加以应用 。在进行逻辑设计时,避免出现两种极端情况,一种情况是从简单的“高频”维度直接推断为可疑,另一种情况是完全无视频率对预测结果的影响,如上述特殊场景下的偶发性案例 。
由于金融机构自身并无专门的可疑案例数据库,或者类似的数据仅可能通过系统取数的方式获得,但由于系统的初始架构设计以及上游系统的数据质量等一系列问题,均可能导致取数结果的偏差,这更进一步加剧了可疑案例数据的匮乏 。
从模型评估的角度,离不开可疑案例的数据支撑 。因此,日常工作中注重以洗钱风险提示、洗钱类型指引等作为案例特征的信息来源,这也契合了《金融机构大额交易和可疑交易报告管理办法》(中国人民银行令〔2016〕第3号)中交易监测标准的参考因素这一要求 。
对于可疑案例样本的分析,特征的提取是关键,其次是特征的识别问题 。为什么“特征”的识别会成为问题?对于金融机构而言,原始业务系统中“数据”可支撑的特征,是建立模型的基础,然而上游数据质量较差仍是不容忽视的问题 。
与此同时,依然存在一些可能无法通过系统准确定位的特征,例如“地下钱庄呈现家族式特点,其账户持有人多为家族成员”、“部分公司名称中出现生僻字眼”等特征,家族成员关系如何定义,生僻字本身亦无官方标准,系统层面对于生僻字的定位更多属于一种弱特征的识别 。
类似于这种无法明确给出标准业务定义的特征,对系统识别同样存在一定的难度 。尽管现有技术可通过一定的“强关联”或“弱关联”锁定目标群体,但这种锁定更倾向于一种概率事件,跟现实情况可能还是存在一定的偏离 。
结 语
本文从“模型”和“评估”两个不同层面,分别对模型评估中存在的问题和 *** 进行了一定的探讨 。总结以下两点:
1.横向从模型单一视角来看,以最终的输出结果反推模型设计等合理性,是实务当中可运用的 *** 之一,但需注意样本案例的选择 。
2.纵向从模型涉及的关联模块来看,需考虑上游系统数据质量、客户分类等直接影响模型框架的一些大的维度是否可支撑后续的计算 。
模型评估这项工作复杂程度较高,不仅涉及政策规定、业务理解、实践落地,还涉及数据治理、技术选型等多个领域 。因此,实务当中建立对模型的充分认识和理解至关重要,以此为基础再进行模型评估 。不论是业务评估还是技术评估,需对评估目标有个初步的方向定位 。
目前交易监测实践中,普遍存在的牺牲准确率来降低漏报可能的做法,随着交易和数据体量的不断增大,面临着资源制约的瓶颈,甚至对资源配置的经济效益产生一定的负面影响 。可疑交易的分析与判断,借助模型对于大数据的预处理是无法回避的处理环节,但适当降低该环节对人力资源的消耗也是需要重点考虑的 。因为实务中往往一个案例的甄别与分析,都需要投入大量的人力、时间、沟通与协调成本,何况每天面对大量的系统预警 。
最后结合实践经验给出两点建议:
1.在“计算能力”方面,系统模型(或称之为“机器”)具有人工无法比拟的优势,那么也可以尝试将这种能力“优势”做进一步的延伸 。例如针对一定周期内、多次被人工甄别后最终排除的客户案例,交由系统处理,再定期(如三个月或六个月)让人工轮询进行复检,防止随着时间的推移原先的判断结果发生变化 。这种经由“系统→人工→系统→人工”的模式,可以避免未对模型做充分评估论证的前提下,直接以人工去消化每日大量的系统预警,而造成的人力资源瓶颈 。

推荐阅读