一般情况下,那些身价较高、稀少性较高、易被盗窃或伪造的商品,往往会引发可疑交易 。例如奢侈品、艺术品、珠宝、贵金属等,因其具备高价值和易流通性,常被用于洗钱、走私等非法活动 。同时,易被仿冒或伪造的商品,如名牌奢侈品、药品、食品等,也容易引起可疑交易的发生 。此外,一些可能涉及到国家安全、公共安全等重要领域的商品,如武器、核材料等,更容易受到监管部门的关注 。
上篇从“模型”的概念解析开始,对“评估”过程中的输入和转换环节分别做了阐述 。下篇继续展开对“输出”环节的评估与分析,并对全文进行总结 。
文章插图
3. 输出环节
3.1 评估指标从业务人员的角度,假设以可疑交易的预测“准确率”为评估的主要指标 。评估指标的确立需要考量:无论是单一指标触发预警的模式,还是组合触发模型生成案例的模式,“准确率”评估的结果,是“证实”的结果更大一些,还是“证伪”的结果更大一些 。对两种不同的结果仍需采取辨证思考的方式 。所谓“证实”,举例来说,假设现实当中的可疑案例编号为001,通过模型可以精确预测出001案例,那么我们可以说模型预测与现实情况相符,或者说与预期目标相符,即可“证实”;而所谓“证伪”,即指依然是相同的情形,但模型未能预测出001案例 。
从理论上来说,可“证伪”说明模型的最终效用与预期结果之间存在偏差 。但现实中案例的情况往往较为复杂,我们不建议单一从“准确性”角度考量 。模型预测的“准确性”是大的方向,但仍需考量外部多重因素影响 。这中间案例样本的选择也有一定的作用,案例样本的选择将在以下3.2章节中进行论述 。
从技术人员的角度而言,类似ROC曲线和AUC指标对于模型的评估,业务人员较难理解 。这里转换一下说法,下文将从业务人员可理解的角度来进行描述 。现实当中存在“可疑”和“不可疑”两种类型的案例,模型在进行结果的预测时,存在以下四种可能性:
文章插图
延伸以下两个技术指标的解释:
1.ROC曲线 。根据百度百科中的简介,ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(True Positive Rate)为纵坐标,假阳性率(False Positive Rate)为横坐标绘制的曲线 。传统的诊断试验评价 *** 有一个共同的特点,必须将试验结果分为两类,再进行统计分析 。ROC曲线的评价 *** 与传统的评价 *** 不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如“正常”、“大致正常”、“可疑”、“大致异常”和“异常”五个等级再进行统计分析 。因此,ROC曲线评价 *** 适用的范围更为广泛 。对于分类后得到的概率可以使用不同的阈值将同样的样本归结于不同的类 。因为实验结果可能对分类的阈值比较敏感,因此可以判别模型在不同阈值情况下的所有表现 。【38】
2.AUC指标 。表示ROC曲线下的面积,主要用于衡量模型的泛化性能,即分类效果的好坏 。AUC是衡量二分类模型优劣的一种评价指标,表示正例排在负例前面的概率 。一般在分类模型中,预测结果都是以概率的形式表现,如果要计算准确率,通常都会手动设置一个阈值来将对应的概率转化成类别,这个阈值也就很大程度上影响了模型准确率的计算 。【21】
3.2 样本选择“输出”视角下的评估,拆分成以下三个步骤解析 。
第一步,先从模型(或者说反洗钱系统)最终预测的结果来看 。例如统计2020年全年口径,A模型触发了监测预警10000份,最终形成可疑交易报告10份,余下9990份排除 。《义务机构反洗钱交易监测标准建设工作指引》银发〔2017〕108号文中也有关于“报告率”的表述:报告率=可疑交易报告数/监测预警报告数 。则上例中的报告率为0.1%(10/10000) 。
推荐阅读
- 福建师范大学研究生招生专业目录 福建师范大学研究生院
- 不一样的春节作文600字_不一样的春节作文初中600字
- 卡巴斯基安全部队2011教案设计 卡巴斯基安全部队2011有什么功能
- 做什么行业可以赚快钱?
- 长春亚泰热力公司 长春亚泰订购球票
- 抗过敏奶粉有哪些 抗过敏奶粉哪款最好
- 奥运会跆拳道比赛设置男女金牌 奥运会跆拳道比赛男子女子各设有八个级别
- 中国广核吧 中国广核中签率多少
- 插肩袖卫衣裁剪教程,插肩袖卫衣款式图