猿梦 2022-12-30 11:57:27
鄙人曹沛山缩回去*开关曹觅松做完^关于机器学习对银行业影响的研究自20世纪以来,已经持续了很长一段时间,但一直没有获得过重大的突破。直到大数据技术的实现,摆脱了传统数据存处理技术对计算机硬件要求的枷锁,机器学习才真正在银行业务中发挥出了其实战作用,例如信用风险管理等。机器学习(Marchine Learning)听起来比较复杂,很有未来感,但其实它的工作原理很简单。简单来说,机器学习就是结合大量类似于决策树的决策模型,来创建一个更加精确的模型。通过快速地对这些决策模型进行迭代训练,机器学习能够找到“隐藏”的最优解,特别是在统计模型中经常遗漏的非结构化数据方面。银行投资组合中经常会出现长尾数据,相对于传统的统计方法,机器学习对长尾数据的解释力更强。考虑到那些个体投资较少但总体数量庞大的客户,我们通常对这一群体的客户知之甚少,并且他们也是相当被动的接受银行业务。但是,机器学习能够对这类客户的行为进行很好的分析,从而指导业务人员有针对性的挖掘潜在的盈利目标。举一个机器学习在银行业信用卡产品线中实际应用的案例,该银行的目标是针对每个客户寻求最优的信用额度,简单来说就是他们希望知道能够在哪些方面增加或减少信用额度。现有统计模型虽然已经具有了相当可观的预测能力,但当利用机器学习方法去重新训练与之相同的数据集,并在训练时添加一些诸如政策规定等非结构化数据时,模型的预测能力直接提高了1.6倍。这种改进能够从基于现有模型中风险较低的客户手中获得显著收益,由此会导致信用额度下降,并且会避免因为信用额度增加而导致的额外损失。那么,是什么导致了银行业并没有更广泛地采用机器学习方法呢?通常来说,有以下三个方面的问题:首先,变量规模的扩大会使得当前的银行系统需要更多的资金进行研发和维护;其次,机器学习中许多模型都是一个黑盒子,以至于造成了预测结果的不可解释性,这严重触犯了银行业的稳定规范;最后,机器学习准确性的检验比较复杂,因此使用机器学习方法在验证环节具有一定的挑战。尽管机器学习方法具有诸如此类的问题,但也有一些切实可行的办法来弱化这些问题。例如,直接使用现有所有可用的变量开始建模,根据每个变量对模型的贡献率快速地进行筛选,从而在不影响模型预测精度的前提下,留下一批可受控制的变量;或者是减少机器学习模型中的一些“分支”,从而获得一组核心的线性规则,这些规则所使用的变量更少,但同时还保留了原模型80%以上的预测能力。关于银行业是否能够用更复杂的机器学习模型来获取更多的价值?这个答案是肯定的,并且也是未来银行业发展的一个趋势。据中金数据业务中心数据分析师刘总介绍“机器学习通过利用银行业现有模型所忽略的大量的“小”数据,加上内外部监管系统中常见的非结构化数据,从而能够更深入的了解潜在客户需求,帮助银行挖掘更多的客户价值。”
在下小白多,本大人宋之槐拉住—数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
|
|
|
|
|