本篇文章5352字,读完约13分钟

大数据帮助金融企业提高智商互联网主要涵盖支付、信贷和金融储蓄。我们认为大数据主要解决互联网金融领域的三个问题。第一是解决运营交易成本高的问题。网上银行降低了20万个网点的成本,而阿里主要取代了信贷和抵押贷款。二是提供流动性,解决资产和负债之间流动性不匹配的问题。P2p意味着转移存款,比如众筹。三是扩大4000万中小企业市场。互联网金融出现后,更大的变化是扩大市场容量,不仅要服务于我们现有的客户,还要整合分散的需求和供给,然后渗透到许多中小企业市场和中小客户市场的细节。 我们还关注市场的另一端,即高端客户市场,即财富管理的操作市场。对于金融市场客户来说,线下联系是最好的方式。然而,海外金融机构也提到,对于每一个高端客户来说,与他联系的次数和准确联系的能力都非常有限。那么,如何向高端理财客户提供准确的内容和手段呢?这也是大数据解决的问题之一。 每个人都在谈论互联网的优势,并且认为它很棒。然而,如果我们想研究互联网,我们必须面对互联网本身的问题,其中最具挑战性的问题是信息过载。在互联网上,信息以网页的形式呈现,等待人们点击,那么互联网的主体必然是注意力经济。例如,2013年1月,金融网站总访问量为38.1539亿次,访问时间为9122万小时,即10413次。在这种情况下,用传统的方法不可能获得所有的信息。如何从过载的信息中获取稀释的数据值?这是移动互联网面临的最具挑战性的问题。 那么,互联网是终极形式吗?我们给出了经济范畴的定义,即如何通过这个模型来赚钱。互联网早期最简单的商业形式是2b。在传统经济模式下,企业向顾客销售产品或服务的目的是直接赚钱,而衡量指标是产出的概念。第二个时代是2c。在网络经济下,企业尽可能地开发用户,而不是直接从用户身上赚钱,而是希望通过向用户收费或探索用户的终身价值来获取利润。在这个时代,像谷歌、脸书等公司。主要是操作用户,而用户的大小是衡量的标准。 我们未来将看到的是一种2d商业形式,即大数据经济。数据将是企业未来的重要资产。企业可以通过数据创造新的商业模式,或者直接销售数据,利用数据提供增值服务,获取巨额利润。在这个时代,庞大的用户和良好的数据资产将成为未来核心竞争力和收入的重要来源。这些数据不一定取决于人们的点击量。例如,您可能与运营商没有任何交易,但是移动电话的传感器会记录您的位置信息,并且该信息会与基站保持通信,您的行为已被运营商捕获。因此,2d更像是一种数据驱动的商业模式。这种商业模式极大地扩大了附加值。互联网只能通过广告盈利,因为它依赖注意力经济。在这种模式下,很难赚钱,只有很少一部分可以通过马太效应获利。如今,细分市场中的许多数据规模可以带来新的价值。 这些是大的经济形式。具体来说,大数据更多的是帮助包括传统银行在内的金融企业获得金融智商,即接触市场和用户的权利和能力。在我们看来,传统银行的数据价值远远大于互联网公司。事实上,金融企业的许多离线数据都沉睡在数据库中,所以不要低估它们。这些数据的价值远远大于阿里的数据。 金融规则创造了一种良好的商业形式,但这种形式离市场和用户越来越远,数千万用户的数据对银行来说是一个陌生的形象。因为互联网是直接免费使用的,所以有必要非常准确地定位用户,用户背后甚至有100,000多个标签,这些标签的维度非常稀疏。你可能对准确的推荐感到好奇,比如高跟鞋、高跟鞋、坡跟鞋、外面的高跟鞋、里面的高跟鞋等等。这种精确的描述是对以前的方向数据维度的重大突破。这一突破使得对客户的理解和描述变得非常清晰。这就是我们所说的大数据的含义。 总的来说,识别用户的行为和潜在需求,理解和感知市场,进而形成积极的反馈干预市场的能力,可视为金融企业的智商。 金融企业如何拥抱大数据? 大数据可以帮助金融企业解决信息不对称、营销、定价、风险和欺诈问题。在过去的一年里,我们做了一些案例,主要体现在三个方面: 第一是营销,包括交叉销售和二次销售,这体现在如何留住客户和评估客户价值。例如,在为保险公司做了大量的数据处理后,许多财产保险和人寿保险可以匹配。它还包括客户服务投诉评估和产品发布评估。某一产品的在线和离线数据不需要在几个月后从市场上获得,而是直接从在线数据中获得。二是信用与风险,主要包括信用分配、风险评估、实施授权、风险干预和欺诈识别。第三是预测和估价,包括周期性行为分析、定量分析、损失分析、收集分析等。 实施路径的关键点是“转到ioe”(取代ibm小型机、oracle数据库和emc存储)。完整的数据是核心,可以处理1000倍以上的数据规模,这需要颠覆性的系统架构来解决。我们已经为一家大型股份制银行做了很长时间的完整数据,这个过程非常有意义。它可以帮助用户看到许多他们以前看不到的事实。过去,商业判断是由商业规则和银行家的经验形成的。现在,通过机器学习已经发现了许多新的规则。例如,异常交易、欺诈等。,其中许多是通过数据本身的特性发现的。 科技创新本身带来的深刻变化今天正在发生。自从阿里巴巴在2009年高调宣布“去ioe”战略以来,今年告别了为支付宝用户服务了五年的最后一台小型机,标志着阿里巴巴“去ioe”运动的又一个阶段性成果。目前,太多的银行使用严格的表格结构以字段的形式描述客户、市场和业务规则,而新互联网的理念是用一张表格来处理它们。我们只需为运营商提供一个一维表,就可以覆盖2.5亿用户。数据可能非常稀疏,但是数据处理逻辑的许多复杂操作被保存下来。这些新结构完全依赖于云计算的新方式。 此外,金融业本身也在进行业务创新。银行属性从簿记卖方变为风险、欺诈和定价的买方属性,其中许多特征是非线性的,需要大量的计算能力。业务驱动和技术驱动使得新基础架构的部署不可避免。 大数据必须全部在线。目前,太多的系统是孤立的,银行的公司、私人和卡业务是分开的。当所有的企业合并在一起时,许多客观规律就会被发现。勋伯格的大数据时代在中国非常流行,书中有一个核心概念——总量。因为从全量的角度看,内容和方式是完全不同的。有一个保险公司的案例,它以前只能做抽样,调查高端人群和某个被保险人群,从2000个维度中抽取一些维度,比如收入,建模,建模后尝试,然后检验结论。现在,有了大规模的计算能力,我们就不干预了,让机器自己去发现规则,让机器学习在两千个维度中建模规则是什么。这就是黑盒建模的想法。 黑盒建模允许我们发现许多我们以前不知道的内容和规律。例如,在实现机器学习后,我们可以发现有1000多个在线反洗钱规则。对于保险用户,我们也发现了许多有趣的现象。在9000多万用户中,0.0%的人年收入超过4万英镑,但他们购买了7万多种保险产品。那么相应的销售人员用什么样的保险和财务管理概念来推广产品呢?你有什么样的经历?这是需要被发现的东西。当然,为了面对用户,所有大数据处理都应该易于理解。在这个过程中,大量的数据有助于发现业务规则。 在没有假设的情况下,可以通过机器学习找到用户的一些特征。这些工具、方式和方法帮助金融用户非常清楚地了解以前未知的市场和未知的用户。 现在,大数据已经扩展到另一个类别。自然语义内容、视觉内容、行为关系网络等复杂关系。,这在以前的数据结构中很难处理。现在,有了大规模计算平台,大数据可以使系统使用新的组织方法,如矩阵和向量。例如,在关系网络中,信使呼叫许多接收者,而这些人彼此之间并不形成拓扑结构。这些数据非常稀少,但却具有巨大的社会属性和经济价值。它将通过评估关系链来描述许多个人的社会属性,即个人的社会资本。如今,供应链金融的规模相对较大,但它依靠线下和专业技能来识别供应链。事实上,银行可以通过建立一个基于转账记录的大型社交网络来传播这些供应链,并通过计算模式挖掘出一些小型供应链。 例如,面对像流感这样的突发疫情,可以利用互联网信息快速确认疫情的分布。传统的方法是通过搜索引擎技术来跟踪相关关键词,从而得到疫情分布。 大数据的一个著名故事是,谷歌使用推特数据进行预测,它也是第一个使用大数据技术预测美国流感分布的公司,并且取得了成功。例如,在最近中国爆发h7n9禽流感事件中,田芸大数据公司采用语义空的主题投影方法,跟踪数百个相关信息点,建立语义网络,深入挖掘二级传播空,从而发现更多未被认识的事实。使用了数千个变量,包括h7n9、流感、豆粕、鸡肉、发烧、口罩、医院等。每个变量都有权重,每个变量都有依赖关系。这些依赖性和权重是从数亿个论坛、微博和专业信息网站中提取的。建立模型后,我们可以跟踪整个主题的变化。将主题热与豆粕价格进行比较,显示出明显的负相关关系。对于期货公司来说,这些零散的公开信息具有巨大的经济价值。这些我们认为支离破碎且情绪化的东西很难量化,但现在它们可以通过大数据的能力来量化。 通过分析数据,我们可以挖掘出许多沉睡的文字内容。例如,银行信用卡记录,在过去,我们只能依靠用户的消费水平来识别用户是属于高端、中端还是低端。除了数字,还有其他信息吗?例如,消费记录,他是否经常去沃尔玛或其他超市、夜总会或星巴克购物,如何识别他是白领还是新人?这些可以通过分类非常清楚地获得。也就是说,以前我们可以对数据进行操作,现在我们也可以对文字进行操作。如何描述人与人之间的关系?例如,社会资本来自对经营者电话记录的评价,经营者可以通过电话输入输出记录客观地输出一个人的社会资本。人力资本来自招聘网站和社交网络,这可以通过他的简历来评估。金融资本来自网上交易、生活支付、房屋、车辆和房地产。如何解决互联网上的过载问题?一个股票分析师每天花四五个小时阅读大量信息,这个过程可以被机器自动化,超载的东西可以通过机器写缩写来突出显示。这是不够的,但关键是情感,突出两极内容,如激增,激增和下降。极性在机器中被理解为一个维度和一个价值,它可以与商品期货相关联。 大数据的实践是准确的还是复杂的? 例如,一家保险公司,如何评估其产品?品牌非常模糊,难以量化。我们用超过10亿条微博数据和论坛数据绘制了一条曲线,即这个周期内品牌的波动可以量化品牌感知和产品推出。你想要团体还是个人? 您如何看待大数据和传统数据之间的区别?银行从事数据业务已经十多年了,那么大数据和传统数据仓库有什么区别呢?事实上,这是群体和个人之间的区别。互联网数据完全针对个人,数据结构对个人来说是准确的,而传统数据则面向业务指标和群体。从宏观上看,如果小明去书店一百次,他之前要回答的问题是他是否第101次买书,也就是业绩和经营指标的问题;现在,互联网关心什么?他最关心的是他第101次买了什么书,以及他需要向他推荐什么内容。这不是一个概率问题,而是一个模糊度问题。 要量化这个程度,我们必须基于个人的一般描述,而不是群体。传统上,更多的注意力是放在一群人身上,而包装是用同样的规则为他们制作的;在网络时代,每个人都应该被准确地描绘和匹配。一些电子商务公司表示,他们希望拥有100万用户和100万商店,尤其是在移动小屏幕上,三次点击后就会失去一个客户。因此,差异永远不可能是对群体共性的描述,而是对个体差异的描述。 你想做决定还是工具? 大数据是面向决策还是面向工具?许多人认为大数据是决策,是人们获得更多洞察力的工具。事实上,大数据更多的是一种自动匹配工具。 在一个典型案例中,我们计算了一家保险公司每种保险中9000万用户的损失概率,然后他们要求我们编写一份报告,并将损失百分比数据报告给领导。当领导者得出结论时,决策必须是宏观的,周期很长,几个月后反馈后可能会有偏差。大数据的作用是直接接收数据,9000万用户的所有损失概率被分配给5万个保险代理。每个人都可以通过特殊的程序看到他所负责的客户在做什么样的行动,而这个行动是由基层直接完成的。因此,所有这些权力和能力都被推到了第一线,而不是被提升和总结到总部进行决策。因此,大数据与其说是一个分析和决策过程,不如说是一个自动过程。

大数据于金融领域的思维与实践

关注最关心的金融话题,一起讨论。

三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....

当前流行度:0

[娇娇]http://itougu.jrj/view/189514.j.....

当前流行度:0

1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??要坚强,要坚强。.....

当前流行度:0

你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........

当前流行度:0

缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......

当前流行度:0

那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....

当前流行度:1

你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....

当前流行度:0

咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....

当前流行度:0

来源:零度新闻网

标题:大数据于金融领域的思维与实践

地址:http://www.0ccn.com//flbxw/7607.html