知识图谱 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Wed, 17 Apr 2024 02:22:13 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 40亿美元投资Anthropic 亚马逊云科技夯实生成式AI三层架构 //www.otias-ub.com/archives/1685289.html Wed, 17 Apr 2024 02:22:13 +0000 //www.otias-ub.com/?p=1685289 毋庸置疑,在追加投资27.5亿美元之后,亚马逊云科技完成了对Anthropic总共40亿美元投资,拿到了生成式AI领域的全球顶级船票。这也是2024年生成式AI的关键性事件之一。

在近期的2024亚马逊云科技生成式AI媒体沟通会,亚马逊云科技大中华区产品部总经理陈晓建介绍了亚马逊云科技在生成式AI领域的最新进展。相关的进度。陈晓建表示,亚马逊云科技与Anthropic的合作是非常紧密,Anthropic推出下一代模型Claude3的时候,第一时间在Amazon Bedrock平台上完成了发布。同时,Anthropic做出长期承诺,将通过Amazon Bedrock为世界各地的亚马逊云科技的客户提供访问其下一代基础模型的能力。

没有一个基础模型能适用所有业务场景

亚马逊云科技在生成式AI领域为客户提供了三层架构。

最底层,亚马逊云科技为客户提供了基础算力,包括英伟达最新推出的G200芯片,亚马逊自研芯片Amazon Trainium、Amazon Inferentia以及用于训练和推理的平台Amazon Sagemaker。

中间层,以Amazon Bedrock为代表,通过一个模型平台支持多种技术大模型。Amazon Bedrock提供各种领先的基础模型供客户选择:既有知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。

最上层,应用GenAI技术的开箱即用的云服务。例如Amazon Q,可以与、Amazon QuickSight、Amazon Connect、Amazon CodeWhisperer等应用都实现了非常有效地结合。

与Anthropic在生成式AI领域进行广泛的深度合作

Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最领先的大模型之一,共包含三个模型:具有几乎即时响应能力且最紧凑的 Claude 3 Haiku;在技能与速度之间达到理想平衡的 Claude 3 Sonnet;以及为处理高度复杂任务设计的最智能模型 Claude 3 Opus。客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。

Claude 3的能力已经非常突出,包括四个方面:

1.Claude 3创造模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。客户可以借助AI驱动的响应,自动化完成任务并保证高准确率,特别是Claude 3 Opus,它不仅在大多数常见的AI系统评估基准测试中表现优异并且在复杂任务中表现出优秀的理解能力和流畅性,走在通用智能的最前沿。

2.Claude 3现已具备多模态能力——Claude 3可以接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型(尤其是Claude 3 Haiku)。

3.Claude 3能够降低幻觉,提升回答准确率——在处理挑战性开放问题(100Q Hard)上准确性明显提升,并且减少错误答案。

4.Claude 3系列模型均提供200K 超长上下文准确召回,针对某些特殊场景,会开放支持 1M token的上下文窗口;大海捞针(Needle In A Haystack, NIAH) 召回率表现优异;甚至还能识别出测试本身的局限,比如发现某“目标”句子明显是后来人为添加进原始文本的。

Claude 3应用场景包括内容续写、代码辅助、电商商品描述撰写、长文本知识召回总结等。

在活动现场互动时,Claude 3对于随机提出的相对论问题及中国古代丹法流派伍柳派相关问题均快速得出逻辑清晰的答案。

亚马逊云科技如何平衡模型能力和客户成本

亚马逊云科技之所以推出Amazon Bedrock这样的产品,是因为它为客户提供了丰富的选择,客户可以在自己的应用场景下,选择成本和性能更合适的环境。

陈晓建也列举出客户的疑问:既然Claude 3如此强大,为什么要加Amazon Bedrock这么一层呢?

在陈晓建看来,模型能力和真正的运营生产之间,需要增加很多辅助能力。Amazon Bedrock提供一系列除了大模型以外的能力。

首先是Provisioned Throughput(预置吞吐量)。客户可以购买后台资源,这些资源提供的大模型能力完全独享。

其次,是模型微调(fine-tunning),很多客户都会关注如何将自身的业务数据与大模型结合,进行微调。这毫无疑问是业务能够产生差异化价值的关键,关键在于如何用好业务数据,而非仅仅简单使用完全标准化的大模型。这个能力也是Amazon Bedrock提供的一个关键能力。

此外,还有类似Guardrails的能力,能够全面监管大模型使用情况,通过适当的配置来降低幻觉现象的产生,同时提供全方位日志。

从用户角度来看,除了大模型之外,如果他们需要充分利用大模型的能力,那么应该如何与业务结合呢?陈晓建认为需要一个非常强的数据基础或者称之为数据底座。要使用大模型,必须有一定的生产结合。生产结合意味着需要拥有大量的业务数据,需要去与大模型打通。

陈晓建表示,“大模型非常重要,非常核心,然而仅靠大模型对你的生产是远远不够的。你需要一系列周边能力帮助你正确、合理、安全、高效地使用大模型。这就是亚马逊云科技一系列产品所提供的价值所在。”

 

]]>
英国生物库:在普通人群中大约每500名男性中就有1人可能携带额外的染色体 //www.otias-ub.com/archives/1450860.html Fri, 17 Jun 2022 11:16:04 +0000 //www.otias-ub.com/?p=1450860

对20多万名男性进行的全面基因分析发现,大约每 500 人中就有一人携带额外的性染色体,而他们中的大多数人并不知道。这个比例比以前认为的要高得多,而且这似乎会增加他们患糖尿病和心血管问题等疾病的风险。

这项新发现来自英国生物库项目收集的数据,该项目多年来全面跟踪50万参与者的健康和基因数据。在这项研究中,剑桥大学和埃克塞特大学的研究人员对生物银行数据库中20万名男性的基因数据进行了分析,寻找额外性染色体的普遍性。

性染色体的特征是X或Y,顾名思义,性染色体是负责生物性别之间的差异。通常,女性有两条X染色体,而男性通常有一条X染色体和一条Y染色体,但情况并非总是如此。

在新的研究中,科学家们在所研究的20万名男性中发现了213名有额外X染色体的男性,以及143名有额外Y染色体的男性。考虑到生物库参与者的整体健康状况,研究小组计算出,在普通人群中,大约每500名男性中就可能携带一个额外的性染色体,这个比例比以前认为的要高得多。

研究中的大多数男性在他们的医疗记录中没有任何关于异常的迹象。在有额外X染色体的213人中,只有49人(或23%)被诊断出患有这种疾病,也被称为克林菲尔特综合征。它通常表现为不孕不育或青春期延迟,当时可以被发现和诊断,但往往不被注意。同时,在143名拥有额外Y染色体的男性中,只有一人被诊断出来,因为这种情况的外在迹象更少。

研究人员随后调查了这些男性的健康状况,并将他们与生物库中的其他人群进行了比较。拥有XXY染色体的男性血液中的睾丸激素水平明显较低,青春期延迟的风险高出三倍,无子女的可能性高出四倍,这表明不孕不育。另一方面,拥有XYY染色体的男性似乎有正常的生殖功能。

研究人员发现拥有任一染色体额外拷贝的男性患其他一些疾病的风险更高。他们患2型糖尿病的风险比普通人高三倍,患静脉血栓的风险高六倍,患肺栓塞的风险高三倍,患慢性阻塞性肺病的风险高四倍。

研究小组表示,他们不确定为什么额外的染色体会增加这些风险,或者为什么两种类型的风险相似。但是进一步的研究可以帮助回答这些问题,以及开始对人们进行额外染色体筛查是否有用,作为预防相关疾病的一种潜在方式。

该研究的第一作者赵亚杰(音译)说:“即使相当数量的男性携带额外的性染色体,他们中很少有人可能意识到这一点。这种额外的染色体意味着他们患一些常见的代谢、血管和呼吸系统疾病的风险大大增加–这些疾病可能是可以预防的。”

这项研究发表在《医学遗传学》杂志上。

自 cnBeta.COM

]]>
海德堡大学:新研究表明人类决策处理信息的能力直到60岁才会下降 //www.otias-ub.com/archives/1391743.html Mon, 21 Feb 2022 06:40:56 +0000 //www.otias-ub.com/?p=1391743

业内普遍认为心理速度(Mental speed)在 20 多岁就开始下降,而最新研究结果表明,我们在决策过程中处理信息的能力直到 60 岁才会下降。

德国海德堡大学的米沙·冯·克劳斯(Mischa von Krause)和他的同事分析了从大约 120 万名 10 至 80 岁的人中收集的数据,这些人参加了一个最初被设计用来测量隐性种族偏见的实验。

在这项任务中,参与者被要求对词语和图像进行分类,例如将人脸标记为白人或黑人,或将“joy”或者“agony”等词语进行褒贬分类。研究人员发现,人们的反应时间从十几岁到 20 岁左右加快,然后随着年龄的增长而减慢。Krause 说,这种下降通常被归因于较慢的心理速度,但事实并非如此。

该团队使用了一个基于先前研究的既定认知模型,该模型假设人们通过不断考虑信息做出决定,直到他们达到一个确定性的阈值。根据这个模型,从 20 岁开始反应时间的减少可能是由于人们在做决定之前希望有更多的确定性,随着年龄的增长,视觉信息从他们的眼睛到他们的大脑需要更多的时间,以及随着年龄的增长,人们需要更长的时间来实际按下按钮。

分析表明,人们的思维速度在 20 多岁时就会增加,并在 60 岁之前一直保持高速度。Krause 说:“直到成年后,我们研究的任务中的信息处理速度几乎没有变化。随着年龄的增长,人们在做决定时变得更加谨慎–他们试图避免错误。同时,运动过程–在实验中按下反应键–随着年龄的增长而减慢”。

这些发现挑战了40和50岁的人在精神上比年轻成年人慢的假设。冯-克劳斯说,这可能会影响现实生活中的结果,例如谁在工作场所被雇用或晋升。虽然该团队预计这些结果将适用于广泛的认知任务,但年龄可能会对其他任务产生不同的影响,例如那些依赖记忆的任务。

自 cnBeta.COM

]]>
亚马逊云服务(AWS)加快云产品和服务落地中国的速度 //www.otias-ub.com/archives/1096162.html Tue, 04 Aug 2020 14:08:52 +0000 //www.otias-ub.com/?p=1096162 日前,AWS大中华区云服务产品管理总经理顾凡接受记者采访表示,伴随着中国云计算市场的高速发展,AWS正在加速新服务和功能落地中国区域。仅今年上半年,亚马逊就在中国区域落地了150多项AWS云服务和功能。

(图:AWS大中华区云服务产品管理总经理顾凡 来源:199IT)

中国信息通信研究院7月29日发布的《云计算发展白皮书》显示,从2017到2019年,中国公有云的市场规模从264.8亿元增长689.3亿元,2018年、2019年的增速分别达到65.2%、57.6%。预计到2023年,市场规模将达到2307.4亿元,是2019年的3倍多。

2020年7月31日,亚马逊发布2020年第二季度财报,其中AWS季度收入为108亿美元。在中国,面对未来的良好增长前景,AWS也充满了期待和信心。

顾凡说,AWS要为中国企业和机构的创新赋能,非常重要的一点是要加快AWS云服务产品和功能在中国落地。

AWS云服务落地中国有两种情况:大部分服务和功能只需要做一些简单的本地化开发就可以在中国区域部署落地,有一些服务需要做更多的工作。但无论哪一种,AWS都会根据中国客户的需求,尽快、尽早地将全球的服务和功能落地到中国区域。

中国企业数据量的爆炸式增长,对大数据处理和分析有着非常迫切的需求。针对这些企业客户的需求,今年上半年AWS在中国区域就推出和部署了交互式查询服务Amazon Athena,数据提取、转换和加载 (ETL) 服务AWS Glue,以及流式数据处理服务Amazon MSK。

在容器领域,AWS在中国区域落地部署了Amazon EKS,让管理、运维K8S容器变得简单方便。

7月刚刚发布的AWS Cost Management,是一组帮助客户省钱、精细化管理云资源的服务。让客户少花钱,这种事情在IT界可以说是前所未有的。AWS还经常主动降价,截至2020年6月23日,AWS已经公布了自2006年上线以来的第85次降价。

在今年新落地中国区域的云服务和产品中,特别值得一提的是机器学习服务Amazon SageMaker。

人工智能现在是非常热门的话题。亚马逊认为,人工智能的本质和核心是机器学习。人工智能、机器学习的概念早在50年前就出现了。之所以现在才热起来,是因为过去机器学习的门槛比较高,只有少数科技巨头和硬核的研究机构才有条件进行研究。一方面是机器学习需要的庞大算力不容易获得;另一方面,机器学习模型的训练过程特别复杂,要搭建训练环境、准备数据、寻找合适的算法、进行大量的运算、优化算法。

现在有了云计算,算力不再是问题。SageMaker则可以降低机器学习模型训练过程的复杂性。SageMaker是一项完全托管的服务,它可以化繁为简,帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习模型,大大降低了模型构建和训练的难度。

SageMaker是一个非常开放的产品,无论对于各类机器学习框架和算法的支持,模块化的设计方式,还是对于生态合作伙伴解决方案的支持,能够真正让各种类型、各种需求的客户都很方便地应用这个服务。此外,SageMaker Studio还是业界第一个面向机器学习的集成开发环境。

目前,Amazon SageMaker成为了全球上万家客户的选择。Gartner在2020年2月发布的《云上AI开发者服务魔力象限》,在技术执行力和对技术未来发展愿景的完整规划方面将AWS排名在领导者象限最高位置。

SageMaker一经推出就受到了中国客户和合作伙伴的欢迎。大宇无限、虎牙直播、嘉谊互娱、华来科技等公司已经在使用SageMaker解决机器学习技术的需求。中科创达、东软、伊克罗德分别将SageMaker运用到产品质检、企业安全网关、标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等多种解决方案和应用场景之中。

AWS在加快产品落地、为中国的企业创新赋能的同时,也担当了中国市场全球化桥梁的角色。

一方面,很多知名的中国公司,例如像美的集团、猎豹移动、小米、OPPO、虎牙直播、海信、德比软件、安克创新、TP-Link、一加、币安、晶泰科技、华大基因、传音控股、网易游戏、我爱我家、携程旅行、迈瑞医疗等等,都在利用AWS的全球基础设施和云服务。得益于AWS全球24大区域、77个可用区的广泛布局,这些公司不需要费力地,去异国他乡构建IT设施,在中国就可以做好海外业务。AWS还利用亚马逊的全球资源,例如全球开店、Prime会员、物流配送体系、生态合作伙伴资源等等,为他们提供销售、市场、产品交付、融资等帮助。

另一方面,还有很多跨国公司,例如博西家电、英孚教育、玫琳凯、太古可口可乐、先锋电子、英伟达、赛默飞世尔、西门子、飞利浦等等,他们在海外就使用AWS。进入中国后,他们可以使用AWS中国区域,快速部署应用,在运营上享受一致的体验。

顾凡说,在海外区域使用AWS的客户,也是AWS新服务落地中国区域的向导,他们给AWS提供反馈,希望哪些服务尽快落地中国区域。根据客户反馈制定服务落地中国区域的优先级,让AWS赋能中国客户的工作事半功倍,更加高效。

]]>
Gartner最新报告建议企业客户借鉴亚马逊的数字化模式 //www.otias-ub.com/archives/1096110.html Tue, 04 Aug 2020 14:02:54 +0000 //www.otias-ub.com/?p=1096110 日前,亚马逊发布2020年第二季度财报,季度收入889亿美元,同比增长40%。在当前的全球经济形势下,显得尤其亮眼。亚马逊这些年的成功,得益于该公司在业务上不断创新。以亚马逊云服务(AWS)为例,这项开始于2006年的业务,在2020年第二季度的收入达到108亿美元,过去12个月的收入超过400亿美元。这在企业IT市场已经是相当可观的规模。

知名研究和咨询机构Gartner最近发布了一个针对AWS的供应商评估报告。这一名为Gartner Vendor Rating 的评估报告,是Gartner面向企业用户所做的IT采购决策参考指南。它通过对一家IT供应商进行全面的评估,告诉最终用户,这家供应商作为战略性的供应商合作伙伴,在各方面技术实力如何,发展走势和长期定位怎样,从而帮助用户管控供应商风险,为用户的关键采购、投资及续约决策提供参考。Gartner在这项评估报告中,对AWS给予了有史以来的最高评分:28分(满分为30分)。记者了解到,Gartner还没有给过其它IT供应商27分以上的评分。

Gartner在评估报告中指出,亚马逊利用科技力量颠覆传统市场,缔造独树一帜的客户体验。而亚马逊云服务(AWS),充分展现了其颠覆性技术在市场上的强大影响力。Gartner建议企业应该充分借鉴亚马逊的数字化模式,将其作为技术驱动力的杰出范例,在业务中融入数字流程,模仿亚马逊,在寻找新市场机会和响应竞争威胁方面打造敏捷性。

这一评估报告可以Gartner官网下载,网址:https://www.gartner.com/doc/reprints?id=1-1ZFLWYKW&ct=200709&st=sb

借鉴亚马逊的数字化模式,AWS是最佳的入口。AWS大中华区云服务产品管理总经理顾凡告诉记者:“AWS为亚马逊的各种创新提供了技术支撑,其中云原生架构是关键。”

云原生架构有三大特征:微服务、自服务和开发运维一体化。微服务实现了应用模块化、应用模块之间接口的标准化,让应用更敏捷灵活;自服务可以让开发团队快速获得资源,不需要冗长的流程;开发运维一体化,可以让应用快速迭代和升级。AWS为客户的创新赋能,最重要的是提供广泛、全面、深入、功能强大的云服务。客户使用这些云服务,就能够构建云原生架构,实现敏捷创新,缩短新应用上线时间,加快应用升级迭代速度。通过丰富的云服务,客户可以借力最新技术,而不需要自己造轮子。

目前AWS提供的云服务超过175项,涵盖计算、存储、数据库、网络、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等诸多方面。其中很多服务是AWS在云上首创的,有些至今仍然是非常独特的。 例如,无服务器服务、云上庄闲网络娱乐平台进入 服务、云上卫星地面站数据服务、云上机器学习平台服务等等。

AWS Outposts、AWS Local Zone、AWS Wavelength、AWS Ground Station、Amazon Bracket是AWS在 2019 re: Invent全球大会上推出的创新服务,分别实现的功能包括:帮助用户从本地的数据中心无缝衔接公有云,在特定城市建设本地可用区让当地终端用户缩短延迟,5G网络边缘的电信运营商数据中心部署云服务让终端用户缩短延迟,让客户不需要高投入就可以使用卫星通信处理数据,让一般的企业也可以探索量子计算的用途和用法,等等。AWS可谓上天入地,竭尽云计算的各种可能。

AWS Snowcone是2020年6月推出的一个云服务,它是一个边缘计算设备,长宽相当于大半张A4纸,比最新iPad七代还小一点点。在AWS Snowcone上可以运行使用 AWS IoT Greengrass 或 Amazon EC2 实例,运行边缘计算应用,也可以用来收集、处理数据,将数据传输到AWS云。

AWS这些服务的推出,都引来业界人士一片叫好声。

在不断推出新服务的同时,现有的服务也会不断迭代新的功能。以最经典、最早的Amazon EC2弹性计算云(Elastic Compute Cloud)服务为例,AWS一直不断地更新升级底层物理服务器的体系架构、硬件配置、虚拟化软件,不断增加新的实例类型。

截止2019年12月,亚马逊提供超过270种实例类型,是两年前的4倍,这在行业中遥遥领先。所谓实例,通俗地说就是云主机。AWS通过创新的Nitro架构,推出新一代C5实例类型,让性价比提高了49%。通过自研ARM处理器推出新实例,基于AWS Graviton 2第二代自研芯片的第六代C6实例,比第五代的性价比再提高40%。此外,在芯片方面,AWS已经集齐了英特尔、AMD、英伟达、赛灵思等不同芯片厂商的处理器。各个芯片厂商发布最新的产品,往往意味着更高的性能,更高的效率,更高的性价比。芯片厂商只要有新处理器上市,AWS几乎都能第一时间放在云上供客户使用。

通过AWS提供的云服务,客户可以打造云原生的架构,提高敏捷性,快速试错,快速迭代,加速创新,缩短产品上市时间;同时还能降低一切技术门槛和资金门槛,减少资本开支,降低IT运维成本。

 

]]>
阿里云Quick BI和微软云Power BI实测比对 //www.otias-ub.com/archives/1090377.html Sun, 26 Jul 2020 05:15:04 +0000 //www.otias-ub.com/?p=1090377 本文作者:大涛学长

摘要:

Quick BI和Power BI分别是阿里云和微软云上的官方BI产品,两款产品都是比较好的自助式商业智能软件,都具备云BI的优势,既能够像SaaS运行在阿里云或者Azure云上,又能快速部署到本地的服务器中运行。但是,两款产品还是有非常大的区别的;比如Power BI微软主打的是组合策略,需要Power BI Desktop、Power Query、Excel等多个产品的各自使用;Quick BI崇尚“高效数据分析与展现”,是基于网页版能实现数据建模、可视化报表以及类Excel分析、数据门户分享等一站式数据分析链路。那么两款产品比较起来到底哪个更好用?下面我们对这两款商业智能软件做个对比评测。

一、Quick BI对比Power BI:数据源连接

从数据引擎的对接能力来看,两者差不多,比如Power BI支持连接文件、Azure、联机服务、SQL Server、MySQL、Oracle等多种关系数据库;Quick BI 支持连接文件、阿里云多种数据库、SQL Server等多种数据库。

不同点在于一是两个产品集中在于对各自的云数据库的支持,二是Quick BI在支持常见数据库的基础上,还支持跨数据源查询,以及对常见数据库支持上传本地文件。

Quick BI如下所示:

Power BI如下所示:

二、Quick BI对比Power BI:数据处理和建模

Quick BI支持自助式建模,和SQL建模两种方式,通过网页版连接到数据库,映射成逻辑表,可以直接对大数据量的数据表做数据集管理和处理,并支持对特定数据库的加速;Quick BI图示如下:

Power BI网页版无数据建模功能,需要安装Power BI Desktop版连接本地数据库,在本机上对数据表的行列进行灵活的处理和相关的数据集操作,但其中对于数据量会有限制和要求,而且Desktop版仅支持Windows系统,不支持Mac电脑;Power BI desktop版实例如下:

三、Quick BI对比Power BI:可视化展现和报表制作

Quick BI网页版支持可视化数据报表搭建和电子表格的两种数据分析分析方式,其中可视化报表支持40+种图表组件的展示,以及复杂的查询控件的设置来方便预览者动态查询数据,电子表格除包含本地Excel的基础功能以外,优势在于能直接联系加工好的数据集,并支持数据动态更新。Quick BI图示如下:

Power BI网页版支持可视化数据报表的搭建,并提供多种图表的配置和展现;同时本地支持Excel支持复杂的报表分析和制作,示例如下:

四、Quick BI对比Power BI:用户分享及数据

Power BI本地服务器用户能共享报表,但不能编辑仪表板,并缺少在Power BI SaaS上的机器学习功能。 用户还报告了不同数据支持方面的不一致之处。微软没有灵活性的提供对Azure以外的云服务器同样好的性能支持。

Quick BI 为网页版,网页版可以编辑和通过URL分享给企业小伙伴,开发者并一键发布即访问者可实时观测到报表的变化,同时Quick BI的本地服务器版(豪华版)支持的功能为云上SaaS版的功能集合;同时从Quick BI的权限架构体系中可以看出Quick BI更适合中国国情,是面向企业IT部门、业务人员,提供企业级管控下的业务人员自助式数据分析,从而实现上游IT部分做好数据管控,下游业务部分充分利用加工好的底层数据来自助式分析,支撑前台业务的快速发展。

五、Quick BI对比Power BI:移动端

Quick BI以HTML5形式集成钉钉微应用中,还支持对接企业的账号系统,嵌入到自有的APP系统中。Quick BI用移动端打造了以访问者为中心的报表搜索、查看、收藏、分享等一站式移动端服务;提供企业级的数据报表目录以方便用户快速找到相应的报表,支持快捷查看报表、权限审批流等,并支持通过应用内消息、钉钉、微信等渠道将报表分享给其他同事。

Power BI移动端为安装独立的APP,其中可视化图表是PC端做的简单适配,但和PC端相比,和其它系统无法进行互动和分享联系;

总体看来,两款产品各有优势,Quick BI在数据处理和建模、移动端及用户数据分享方面更胜一筹,大家可以根据自己的需要选择使用哪款产品哦~

阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!

阿里巴巴数据中台解决方案,核心产品:

• Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;

• Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;

• Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。

查看更多:https://yq.aliyun.com/articles/745039?utm_content=g_1000104749

]]>
阿里云零售数据中台:全域GROW解决方案 //www.otias-ub.com/archives/1089793.html Fri, 24 Jul 2020 03:56:36 +0000 //www.otias-ub.com/?p=1089793 本文来源: 阿里云数据中台 数智化转型俱乐部

摘要
7月22日,俱乐部开启了618回顾直播活动,细致介绍了阿里云零售数据中台如何帮助品牌实现消费者极速增长。今日推荐——课程2《全域GROW解决方案 赋能企业运营落地 》今年6月,阿里云数据中台正式对外发布了零售、金融、政务、互联网企业等行业数据中台。其中,零售行业数据中台主要提供多维的全方位洞察、全域自动化营销等服务,并通过与阿里巴巴生态联动,帮助更多零售企业实现数智化增长。在今年的618中,阿里云零售数据中台通过帮助企业建设一方数据中台,联动阿里生态,为百家品牌实现了全域赋能。昨天我们推送了618直播课程课《阿里云零售数据中台创新场景介绍》欢迎点击回看今天我们来深度介绍一个通过全域GROW解决方案帮助品牌实现品类增长的干货。

01

GROW品类增长方法论介绍

品牌营销已从流量至上,转变为以人群运营为核心的数字化增长阶段:

过去: GMV = 流量 * 转化率 * 客单价

现在: 以人群运营为核心,驱动数字化增长

02

全域GROW解决方案-场景案例-G

跨品类渗透

基于品牌一方人群+淘系数据, 寻找高相关品类,精准挖解决跨品类消费活跃人群

特色货品供给提升

一方IP人群上传算法放大,精准引流引爆IP货品

价格分层渗透

基于一方人群及价格带偏好/折扣敏感偏好,实现人群 分层运营,提升有效行动转化率

多渠道联动渗透

基于品牌一方用户及其行为,打通多端潜在受众资源池, 并 通过全域媒体矩阵进行全域触达和引流。

营销活动渗透

一方沉淀营销人群持续运营,提升品牌营销效率。

平台能力加速渗透

联动一方人群,探索平台直播趋势场景,精准渗透, 全面放大平台能力价值

03

全域GROW解决方案-场景案例-R

 

类目老客召回

品牌线下流失会员上翻,线上精准触达, 增强品牌黏着度

老客消费场景拓展

基于一方老客,通过挖掘细分场景需求以及培养新的消 费习惯,促进购买。

 

04

全域GROW解决方案-场景案例-O

 

商品溢价挖掘

基于品牌一方粉丝人群,挖掘偏好趋势,构建专属商品 孵化方案,提升品牌价值

未来:联动品牌一方数据资产,共建全域GROW由“人”及“品”场 景落地,加速品牌生意新增量

直播视频,扫码下方二维码,申请入群收看

 


如您想加入199IT数智化群或对199IT有任何建议,请加微信:wendy199it

 

 

]]>
合合信息联创、启信宝CEO陈青山:打造全景商业数据智能世界 //www.otias-ub.com/archives/1082285.html Mon, 13 Jul 2020 01:53:57 +0000 //www.otias-ub.com/?p=1082285 199IT讯 2020年注定是不平凡的一年,疫情给全球商业带来了诸多不确定性。但面对危机,有人看到了“危”,有人看到了“机”。

全球知名咨询机构埃森哲认为,除了政府的有效管控,数字化技术和新兴商业模式在中国的疫情发挥了关键的赋能作用。企业纷纷利用线上线下O2O服务和平台、虚拟现实和增强现实(VR/AR)技术,不仅满足了民众在隔离期间的基本生活需求,还可以帮助他们打发时间,缓解了长期居家的苦闷和情绪消沉。全国各地企业已普遍开始应用数字技术恢复运营。无论是通过直播与消费者互动、利用物联网和机器人技术实现智能制造,还是通过应用远程弹性办公方案帮助员工复工,均使得生产和运营逐步恢复常态。

本土咨询机构艾瑞咨询认为,疫情对中小微企业带来冲击的同时也带来了新的机遇,一些原本数字化程度高的企业,诸如电商平台、线上教育,知识付费等线上项目迎来了空前热潮,但平日线上业务空白、主要以线下业务为主的企业首当其冲,暴露出获客能力弱、经营模式单一、供应链运转难等短板,陷入停滞、亏损困境。能否实现线上-线下一体化服务模式转变成为疫情期间许多中小微企业生死存亡的关键点之一。且从长远来看,突破单一线下经营模式有助于提升企业抵御风险、多渠道获客、精准营销等综合经营能力,数字化改造下的企业商业模式进阶势在必行。中小微企业数字化升级并非简单的将线下内容转移至线上,而是可通过互联网线上手段,进行业务拓展、客户价值提升、订单、物流和配送综合管理等一系列经营环节,打造人、货、场、资全链接O2O模式,真正实现企业品牌和服务升级。

持相同观点还有合合信息联合创始人、启信宝CEO陈青山。 在接受199IT线上专访时,陈青山表示,金融企业特别是有一些本身基础比较好的金融企业,例如四大行,他们的技术的积累以及对于大数据、AI技术的使用,至始至终是走在全社会相对靠前的位置。所以,疫情对他们来说是最多是加速放缓的一个过程,如何更多、更快地利用AI的技术、数字化的技术来提高效率、降低成本、降低风险。

(图:合合信息联合创始人、启信宝CEO陈青山 来源:199IT)

而对于传统的制造业在这个过程中,如果要更多利用AI技术,首先把这些业务或者流程数字化,然后搬到线上,这是对传统企业是比较大的挑战。

合合信息是一家一直从事AI大数据的公司,始于2009年。从最开始的AI感知技术,包括图像处理、模式识别、文本识别、场景识别,一直到高阶层的认知智能,包括自然语言处理、知识图谱,在这个领域深耕了十几年。

基于企业大数据,合合信息创建发布了4款C端的产品。包括名片全能王、扫描全能王,这两款产品都面向全球发布,并且都已经超过了3亿以上的下载用户。另外一款商业调查类的产品启信宝,汇集了来自中国2.3亿家企业和社会组织机构,还有来自海外的2.2亿家企业,刻画了一个全景的商业大数据世界。同时合合信息还发布了另外一款产品“找到”,汇聚了全中国2亿以上的商业人士,服务于商业的营销、BD的产品。在后疫情的环境下为远程的办公、远程商务拜访,提供基于合合信息技术和产品的价值。

AI数字化技术转化物理世界

在世界人工智能大会2020云端峰会中合合信息主办的未来金融论坛上,陈青山做了主题为AI大数据创建智能金融新生态的演讲。在他看来,数字化的技术,特别是以AI为基础的数字化的技术,它是会将物理世界转化为虚拟世界中的数字。

金融环境下物理世界实体包括企业、人,还有金融业务中间场景中间的一些要素,比如单据、合同、财务报表、图像、声音、视频等。而以AI为基础的数字化的技术,会有文本识别、语音识别、视频识别、产品识别的技术以及LoT物联网等一些更加深入广泛的一些数字化的技术,它都是将我们的物理世界转化为另外一个孪生的虚拟世界,那个世界都是有数据构成的。合合信息在这个领域里面构建了自己的文本AI平台。

通过大数据和AI技术,能够极大解决金融、保险等领域的准确率和效率问题。陈青山举例称人工录入一份文件上的文字,它一般的准确率会在90%,但如果是以合合平台的平台文本机器人来做这样的录入工作,那么它的准确率可以超过99%。

对效率而言,譬如合合信息旗下扫描全能王,每年所扫描识别的文档的页数超过120亿份。如果用人工处理需要9亿个小时。如果按每个人每天工作8小时,一年工作250天来算的话,扫描全能王大概节约了45万人/年的工作量。这就是AI技术所创造的社会价值。合合信息把这些技术不断用在C端以及B端企业产品中。

STR+DATA+AI+SERVICES模式为客户创造价值

 要实现AI,需要三个要素,算力、算法、数据。

 企业内部业务数据资产建立好后,数据还是异构状态,要把这些数据经过清洗结构化、挖掘融合汇聚,变成一个知识库这样才能进行计算、关系挖掘,属性归类。把数据变成知识,要利用相关的自然语言处理,把数据信息转化为知识,这就包括实体提取、属性提取、关系挖掘。企业内部需要建立这样知识库,所有的建设的工作都是为了最终的使用数据。这些数据如果不用起来,它就是死的,没有价值。

企业数据需要以场景为指导,结合数据评分、报告、事件监控,能够指导业务决策,比如以金融业务为例,能够指导金融业务场景下面的智能化获客、智能风控,这才是整个数据的建设,AI技术的应用,最终要实现产品、业务的智能化。

目前合合信息已经形成“STR+DATA+AI+Service”的商业矩阵,比如在保险行业场景,对于保险业务前端的证件识别/分类;业务中端医疗票据、理赔单据识别;以及企业数据清洗、精准获客等,通过数据驱动为保险数字化提供全球领先的解决方案。

技术和商业需求是动态匹配

作为技术专家背景的企业负责人,陈青山坦言自己已经淡出一线技术多年。但作为业务的负责人,首先要从商业上、用户、客户的产品层面出发,结合公司本身的技术优势,以及产品上面的一些积累和布局,然后再去考虑以什么样的形式、渠道、方式,将产品和服务提供给客户。

从企业负责人角色,更多需要考虑客户的需求、场景、需求的本质以及技术和产品的边界,这两者的结合,的确是一个非常动态的过程。客户场景、客户需求形式上面可能会在不断的变化,但是有一些本质的东西可能是不变的。对于合合信息而言,技术上面需要不断的去创新,不断的去突破,不断满足用户和客户的需求。

在谈到合合信息未来资本层面的发展路径。陈青山认为目前国家的资本市场的一些变化,对人工智能类型的公司来说非常利好。包括人工智能、大数据以及产业创新、顺应科技发展趋势。创业板注册制、科创板的资本市场的变化,对AI企业来说都是比较积极的外部环境。

陈青山坚信,合合信息因为本身就是在AI和大数据领域在不断的深耕、实践,所以随着行业的发展也将不断发展壮大,实现资本共赢。(199IT Ralf)


199IT致力于TMT、大数据、人工智能等行业发展观察,如您有好的企业动态、行业趋势等故事,请与我们联系。微信:7281670


 

]]>
亚马逊云服务(AWS)全面推动机器学习创新应用 //www.otias-ub.com/archives/1080551.html Thu, 09 Jul 2020 12:01:57 +0000 //www.otias-ub.com/?p=1080551 AWS上海人工智能研究院联合AWS全球AI 研究团队、明尼苏达大学、俄亥俄州立大学和湖南大学的专家学者共同构建药物重定位知识图谱抗击新冠

在2020年7月9日下午举办的世界人工智能大会2020云端峰会产业发展高峰论坛全体会议上,AWS人工智能副总裁Swami Sivasubramanian发表了题为《突破常规:机器学习无处不在》的主题演讲。他表示,我们正在开启一个机器学习的黄金时代,机器学习已经在汽车自动驾驶、欺诈检测、呼叫中心、生产制造、语音转录、机器人技术、金融、零售、医疗等多个领域发挥重要作用。Swami还就企业如何使用机器学习技术及培养机器学习能力等方面提出建议,希望机器学习为各类企业和机构的发展注入强大动能,助力整个社会加速迈入人工智能时代的美好未来。

在“智联世界,共同家园”这一主题的号召下,今年的世界人工智能大会正在紧密推进使用 AI 对新冠肺炎的诊断、康复和复工复产等方面进行研究的工作。自新冠肺炎疫情爆发以来,AWS一直在大力推动机器学习在全球抗疫中发挥作用。本届世界人工智能大会期间,“AWS面向药物发现的深度图学习”成功入选2020卓越人工智能引领奖(Super AI Leader,简称SAIL)年度榜单,体现了AWS在深度图学习方面的领先技术和在医疗领域的前瞻应用。

这一入选项目包含了AWS所构建的一个生物医药知识图谱,以及研发的一系列面向新药研发的深度图学习工具。其中最为引人注目的是AWS近期公开发布的一个用于大规模药物重定位(老药新用)的知识图谱 DRKG (Drug Repurposing Knowledge Graph),以及一套完整的用于药物重定位研究的机器学习工具,目前已经在 github 上开源给全世界研究机构。DRKG是AWS上海人工智能研究院联合AWS全球AI 研究团队、明尼苏达大学、俄亥俄州立大学和湖南大学的专家学者共同构建的,其目的是帮助研究人员更有效地对新冠病毒及其它疾病(如阿尔茨海默病)进行药物重定位研究。相比较传统的新药开发,药物重定位可以缩短药物研发周期,降低成本,规避风险,因此是一种比较有前景的新冠肺炎治疗策略。DRKG是一个综合型生物医药知识图谱,它从六个公开的大型医药数据库以及近期新冠肺炎的相关医学文献中挖掘数据并进行整理和规范,包含了人类基因、化合物、生物过程、药物副作用、疾病和症状等六个主要方面的数据。

此外,入选项目还包含两个由AWS上海人工智能研究院研发并开源的深度图学习工具,包括专门针对大规模知识图谱嵌入表示的训练和推理工具DGL-KE及支持分子性质预测、药物设计、先导化合物优化、化学反应预测等的DGL-LifeSci。测试表明,DGL-KE相比同类型其他开源工具在标准测试集上有2到5倍加速,DGL-LifeSci使研究人员可以只用一行代码完成分子性质预测建模,较现有的实现最高能提速13倍。

AWS一直以来致力于将其在机器学习和人工智能方面深厚的技术积累,以云服务的方式,赋能给全球几百万客户。除了抗击新冠疫情之外,机器学习在各行各业都有着非常广泛的应用前景。本届世界人工智能大会期间,AWS专门举办了主题为“当AI在云端生长”的在线论坛,从前沿技术、行业应用场景和技术实现的角度,分享如何借助 AWS 机器学习和人工智能服务进行创新,提高效率和节约成本,推动AI实际落地及各行业应用场景的实现。AWS机器学习副总裁和杰出科学家Alex Smola、AWS机器学习副总裁Bratin Saha、AWS首席科学家李沐、AWS上海人工智能研究院院长张峥、AWS中国机器学习业务拓展和产品技术架构总监代闻、AWS首席开发者布道师费良宏、AWS 高级开发者顾问王宇博、天津华来科技有限公司 CTO季宝平、Freewheel 机器学习团队负责人吴磊、中科创达软件股份有限公司首席技术官邹鹏程等出席了这一论坛。

作为2020世界人工智能大会的战略合作伙伴,AWS连续三年鼎力支持大会。今年,AWS也将通过深度参与各类全体会议、主题论坛、行业论坛以及通过云端峰会AI家园展示区等,多方式诠释“当AI在云端生长”的无限可能!

 

]]>
中科创达携手亚马逊云服务(AWS) 加速智慧工业AI部署 ADC系统全面集成Amazon SageMaker //www.otias-ub.com/archives/1060802.html Thu, 04 Jun 2020 04:47:59 +0000 //www.otias-ub.com/?p=1060802 2020年6月4日,在亚马逊云服务(AWS)中国区域推出Amazon SageMaker机器学习服务之际,中科创达(ThunderSoft)率先宣布,已经将Amazon SageMaker集成到了中科创达智慧工业ADC (Automatic Defect Classification) 系统,让制造业客户可以在工业生产中轻松获得AI质检能力,通过Amazon SageMaker的弹性Notebook、实验管理、自动模型创建、模型调试分析,以及模型概念漂移检测等强大特性,中科创达将加速智能制造的落地进程,帮助企业以更少的工作量和更低的成本更快地投入生产,在节约人力的同时,提升产品良率,释放产能,提高竞争能力。

当前,以人工智能、大数据、物联网为标志的第四次工业革命方兴未艾,世界已步入智能化时代。今年以来,国家出台了多项加快新基建发展的政策和措施,进一步带动了5G、人工智能与工业领域的融合创新。劳动密集型的传统制造业越来越多地在生产环节主动引入人工智能等新型技术,解决生产效率低下和人力成本逐年增长的问题,提高行业竞争力。

作为全球知名的智能操作系统产品和技术提供商,中科创达深入了解传统制造业发展需求和趋势,基于在智能操作系统、图形图像处理和人工智能领域的深厚技术积累,在2018年推出了工业视觉检测一站式解决方案——智慧工业ADC系统。该系统包含缺陷自动化分类、新产品迭代数据清洗、业务作业员认证三个子系统,从作业员技能认证、数据集更新到新产品导入,贯穿工业检测的整个生命周期,有效帮助制造企业减少75%的工作量,产能提升35倍。相比人工检测,漏检率下降3%,准确率提升99%。目前,中科创达已经拓展到液晶面板、汽车制造、电子产品、化妆品制造、橡胶制造等行业,帮助众多客户提升工业自动化和智能化水平。

任何客户应用智慧工业ADC系统都需要实施机器学习工作。机器学习的实施是一项复杂的工作,涉及大量试错,需要大量专业技能,并消耗庞大的算力、数据存储和时间成本。Amazon SageMaker可以让这一过程变得更加简单高效,帮助客户去除机器学习涉及的混乱和复杂性,让客户能够迅速构建、训练和部署模型,来应对新的挑战。尤其是Amazon SageMaker Studio集成开发环境(IDE),为整个机器学习工作流提供了一个统一界面,使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

在智慧工业领域普遍涉及的边缘端,因为边缘设备内存和处理能力往往高度受限,但对延迟又非常敏感,还存在各种不同的硬件平台和处理器架构,开发者需要花费数周或数月的时间手工调优每个模型。同时,由于复杂的调优流程,模型部署到边缘后很少进行更新,开发者可能因此错失根据边缘设备所收集的数据来重新训练和改进模型的机会。借助 Amazon SageMaker Neo,开发者只需训练一次机器学习模型,便可在云端和边缘的任何位置运行。Amazon SageMaker Neo 可将模型的运行速度优化到两倍,同时仅占用 1/10 的内存,也不会对准确性造成任何影响。Amazon SageMaker Neo可以优化部署在Amazon EC2实例、Amazon SageMaker端点和AWS Greengrass管理的设备上的模型,实现工业视觉检测应用与其它应用无缝连接。

Amazon SageMaker可以有效贴近工业的实际需求,降低了算法实施过程中开发、环境、运维对工程师的依赖。例如,在电气行业ADC系统的实施中,通过集成Amazon SageMaker,最终用户的一次性投入成本降低了42%,软件开发的工作量降低了39%,系统的上线时间缩短了50%,系统运行效率是传统检测的35倍,解决了ADC系统落地工业场景的障碍。中科创达CTO邹鹏程表示:“中科创达智慧工业ADC系统汇集了我们在操作系统、人工智能和工程化建设等多方面优秀的能力,并已成功在液晶面板行业落地,具有非常完整的工业检测系统体系。近年来,中科创达提出‘服务上云’战略,打通前端和后端的产业链条,助推智能产业加速实现数字化。我们非常荣幸与AWS携手,通过集成Amazon SageMaker,大幅提升智慧工业ADC系统在工业制造领域落地、部署的效率。同时,依托AWS实现业务发展和持续创新,加速全球智慧行业的智能化、自动化和数字化升级。”

AWS中国区生态系统及合作伙伴部总经理汪湧表示:“中科创达是非常优秀的APN(AWS合作伙伴网络)合作伙伴,在IoT、人工智能方面的实力尤其突出。Amazon SageMaker一个重要的特点在于能够与各类行业应用进行集成,来进一步赋能各行业的应用场景。我们非常高兴中科创达能够成为首批在AWS中国区域利用Amazon SageMaker的APN合作伙伴。基于Amazon SageMaker,中科创达能够打造更加优秀的智慧工业视觉检测AI系统,满足更多客户的需求,助力他们实现智能化转型。”

关于中科创达

中科创达软件股份有限公司(股票代码300496)成立于2008年,是全球知名的智能操作系统产品和技术提供商。公司致力于提供智能操作系统产品、技术及解决方案。公司立足操作系统,聚焦人工智能技术,助力并加速智能手机、智能物联网、智能网联汽车、智能行业等领域的产品化与技术创新。中科创达拥有一支对操作系统技术有深入理解的国际化团队,总部位于北京,分子公司及研发中心分布于全球20+个地区,可以为全球客户提供便捷、高效的技术服务和本地支持。同时,中科创达与产业链中的芯片、元器件、终端、软件、互联网厂商、运营商以及云厂商等都拥有紧密的合作关系,具有独特的垂直整合优势。欲了解中科创达的更多信息,请访问www.thundersoft.com

关于AWS

14年来,Amazon Web Services(AWS)一直是世界上服务丰富、应用广泛的云服务平台。AWS提供超过175项全功能的服务,涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面,遍及24 个地理区域的76个可用区(AZ),并已公布计划在印度尼西亚、日本和西班牙新建3个AWS区域、9个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构都信赖AWS,通过AWS的服务强化其基础设施,提高敏捷性,降低成本。欲了解AWS的更多信息,请访问:http://aws.amazon.com

 

]]>
AWS张侠:TensorFlow全球85%负载都在AWS平台上 开发成本可降低54% //www.otias-ub.com/archives/1048701.html Wed, 13 May 2020 09:08:25 +0000 //www.otias-ub.com/?p=1048701 199IT讯 随着5月12日AWS宣布Amazon SageMake 在宁夏区和北京区正式上线,中国机器学习产业链迎来重要一极。

其重要程度如果要用数据来衡量,AWS首席云计算企业战略顾问张侠博士披露的一个数据足以让同行不可小觑。张侠博士表示,全球使用最主流TensorFlow框架做机器学习,大概85%的负载都在AWS平台上。

(图:AWS首席云计算企业战略顾问张侠博士)

作为全球机器学习最主流框架,TensorFlow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护,自2015年11月9日起,TensorFlow依据阿帕奇授权协议(Apache 2.0 open source license)开放源代码。据2019年9月TensorFlow 产品总监Kemal El Moujahid 披露的数据,TensorFlow在全球的下载量已经超过了 4000 万次。

同样让人惊艳的数据是,在AWS平台上有一个使用SageMaker+TensorFlow的具体案例,可以把效率从65%提高到90%,训练时间从30分钟缩短到14分钟。另一个角度,从全球目前看到的统计数字,整套Amazon SageMaker把总体拥有成本降低54%,开发效率提升10倍。而在中国AWS也在评估一些类似的数据。

为什么选择AWS的机器学习呢?张侠博士认为,AWS提供了非常广泛、深入的机器学习服务,其中它的一个重要产品就是Amazon SageMaker。它使得企业能够加速对机器学习的整个学习、建模、发展、实验的整个过程。AWS云平台其他所有的手段,包括数据存储、数据仓库,物联网和机器学习一起形成所谓的AIoT,智能的物联网。再包括使用一些容器的方法,快速的来部署,把机器学习的应用做成一个容器化的服务,在容器里可以快速部署。所以云计算和机器学习在一体化之后,AWS可以提供最广泛、最深入的解决方案。

而大宇无限机器学习技术总监苏映滨则认为性能、成本、算法、丰富度、便捷性都是企业决定使用Amazon SageMaker的考量范围,除此之外,还有一个重点是服务能力,或者说用户体验,就是可用率以及能够提供支持包括额外提供一些AI的支持。

十分重视中国市场  将改变企业服务、金融、教育、健康、卫生等创新场景

从2019年12月re:Invent上发布的Amazon SageMaker Studio等六大主要的功能开始,不到5个月时间,AWS在中国发布Amazon SageMake,包括SageMakerStudio等最新的功能。北京区、宁夏区作为AWS全球24个大区的第五个区和第六个区对产品的上线,表明了AWS对中国市场的重视程度。张侠博士表示,“我们非常清醒地意识到随着中国的经济发展,这个市场无疑是经济发展的最重要的市场之一,也是我们最重要的市场之一。”

而对于Amazon SageMaker的落地场景,张侠博士认为,中国是一个接受创新非常快的地方,如使用的人脸识别、使用汽车的牌照识别进入停车场等等类似的大量场景,不光开始的快,并把它落实变成一个真正的应用,在全球范围内很多还是处在非常领先的地位的。因为中国的文化现在是非常开放,也非常愿意去接受这些创新的东西的阶段。

“场景其实也是非常多方面的。比如说客户服务,这是一个比较独特的场景,这个场景里面现在很多进展,包括Amazon Connect的Contact Lens,在客服里面通过机器学习的方法、语义的理解,去强化这方面的内容。在金融里面,比如说交易里面越来越自动化,包括最近一些新的客户投资的产品,智能投顾,一直是比较热门的话题,很多券商、投资公司都在这方面去做一些事情。这个方面如果要建一些模型,然后再推荐一些股票、基金什么的,可能可以摆脱一些人为的因素,相对有一些比较独立的效果。从教育、健康、卫生等场景非常多。几乎想象力就是边界,我们在很多地方随着时间都能够往前推进。”

AWS机器学习方案包括SageMaker在内的三层服务堆栈

实际上,Amazon SageMaker只是AWS机器学习解决方案的一个层面。AWS提供的机器学习解决方案是一个包括三层的服务堆栈。如下图所示,Amazon SageMaker是其中间层。在这一层,主要通过Amazon SageMaker这一完全托管的服务,完全消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。

AWS也根据不同类型客户的需求,提供了全面的机器学习解决方案。三层服务堆栈的底层,为想要自己构建算法或开发新框架的客户提供灵活选择,客户可以选择使用TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras等机器学习框架和基础架构。在这一层,AWS 专注于性能、灵活性,降低成本,以便任何用户都可以使用最新的基础设施,对多种框架进行试验。借助AWS,客户可以访问针对机器学习的、最强大的 GPU 实例,应对最苛刻的应用场景。

在三层服务堆栈的顶层,AWS提供了训练好的人工智能服务,这些服务主要解决与人类认知相关的典型问题。例如,计算机视觉方面的服务,可以识别图像或视频中的对象、人员、文本、场景、活动和不安全或不适宜的内容。个性化推荐服务可以从库存中向消费者推荐多种产品和服务。客户可以直接在其应用中调用AWS提供的这些人工智能服务,而无需关注服务背后的机器学习模型。

开源产品随时推出 融合全球主流开源内容

AWS对开源比较重视,早在2019年1月25日,亚马逊AWS发布开源服务Amazon SageMaker Neo,它可以帮助使用者在多个操作环境中运行机器学习训练模型。

Amazon SageMaker Neo 让客户只需训练一次模型,即可以高达 2 倍的性能在任意场景运行。在连接的端点设备上运行的应用程序对于机器学习模型的性能尤其敏感。它们需要低延迟决策,通常部署在多种不同的硬件平台上。Amazon SageMaker Neo 针对特定硬件平台编译模型,自动优化模型性能,使它们能够以高达两倍的性能运行,而又确保精确性丝毫不打折扣。因此,开发者不再需要花费时间,根据每一个硬件平台手动调整他们已经训练过的模型(节约时间和成本)。SageMaker Neo 支持英伟达、英特尔、Xilinx、Cadence 和 Arm 硬件平台以及一些主流框架,如 Tensorflow、Apache MXNet 和 PyTorch。

对于未来AWS在开源方面的考量,张侠博士回答199IT提问时表示“实际上我们在整个Amazon SageMaker人工智能平台里面,多个方位、多个角度,从框架到算法,都经常会融进一些开源的内容。两周之前,在PyTorch方面,我们刚宣布了一个Torch Serve的开源模型,是PyTorch框架下的,所以开源产品是随时都会推出的。”

中国各行业如何Amazon SageMaker应用机器学习

据张侠博士了解,中国有各种各样的企业都有在使用Amazon SageMaker,一些大的传统企业,比如做家用电器的企业,智能冰箱是可以用语音对话的。

创新类的,比如在线教育、做自动驾驶的公司,还有一些新创的公司,集中在一些新的领域,像叽里呱啦、流利说,还有其他很多的教育相关的应用,比如判卷子、判分等等,所以在线教育有很多案例。

在医疗卫生行业,从基因到一些智能的新的应用技术,比如说用机器学习的方法来读一些脑部供血的状况、癌症发展的状况,有很多公司在做类似的内容,也是一个比较典型的应用场景。

张侠博士强调,“企业可以说从大到小,几乎各种各样行业都会有一些突破。他们真正的共同点是这些企业都处在一个创新的很好的状态,是一个在走上坡、积极努力进取状态,去找一些新的市场、新的服务和突破点,更好的提供更新的价值,我觉得这是他们真正的共同点。”

对数据分析行业和数字化的影响

Amazon SageMaker对未来数据分析行业有何影响,张侠博士认为,SageMaker对数据分析行业影响较大,云时代更多的海量的实时的数据,需要的不是像以前传统批量的分析,而更多是前瞻性的、预测性的、实时的分析。使用人工智能机器学习的这些方法做数据分析,无疑是一个大数据发展的非常重要的趋势。在这里如果能够使用SageMaker来加速数据分析模型、建模的过程,是能够很有效的推进这个工作的。“在实际工作中,我们也看到确实是这么个情况,比如今天我在准备一些材料,跟我们客户要分享,这个材料里面其中就有关于零售类客户的一些数据分析,数据怎么样通过SageMaker做一些机器学习类的分析,能更好的进行预测的内容。所以这个事情是真实发生的。”

随着疫情的过去,很多企业准备在数字化转型过程当中重新大显身手,通过这次疫情,整个企业的发展加速了。因为在疫情当中好的数字化的原生企业,在疫情过程中表现都非常优秀。张侠博士坦言道:“数字化转型实际上包括很多方面,从客户体验、整个运营、决策、创新、竞争多个方面都是下一步经济发展、企业发展的关键,而这里面大数据分析和机器学习可以说是其中的两个重要的支撑点。一个企业如果抓好这些,可以更好的准备好,在下一阶段的发展中处在一个非常有利的地位。”(Ralf)

 

]]>
亚马逊云服务(AWS)中国宁夏及北京区域正式上线Amazon SageMaker //www.otias-ub.com/archives/1047088.html Tue, 12 May 2020 02:57:35 +0000 //www.otias-ub.com/?p=1047088 Amazon SageMaker 是一项完全托管的服务,使开发者和数据科学家能够更广泛、更成功地使用机器学习

[2020年5月12日,北京] 亚马逊云服务Amazon Web Services, Inc. (AWS) 今天宣布,Amazon SageMaker在由西云数据运营的AWS中国 (宁夏) 区域和光环新网运营的AWS中国(北京)区域正式上线。Amazon SageMaker 是一项完全托管的服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。Amazon SageMaker在中国的上线还使中国客户获得一系列新发布的工具,例如弹性Notebook、实验管理、模型自动创建、模型调试分析,以及模型概念漂移检测等强大功能,所有这些工具都封装在首个面向机器学习的集成开发环境(IDE) Amazon SageMaker Studio中。进一步了解Amazon SageMaker,请访问: https://www.amazonaws.cn/sagemaker/

机器学习的实施是一项非常复杂的工作,涉及大量试错,并且需要专业技能。开发者和数据科学家首先必须对数据进行可视化、转换和预处理,这些数据才能变成算法可以使用的格式,用以训练模型。即使是简单的模型,企业也需要花费庞大的算力和大量的训练时间,并可能需要招聘专门的团队来管理包含多台GPU服务器的训练环境。从选择和优化算法,到调节影响模型准确性的数百万个参数,训练模型的所有阶段都需要大量的人力和猜测。然后,在应用程序中部署训练好的模型时,客户又需要另一套应用设计和分布式系统方面的专业技能。并且,随着数据集和变量数的增加,模型会过时,客户又必须一次又一次地重新训练模型,让模型从新的信息中学习和进化。所有这些工作都需要大量的专业知识,并耗费庞大的算力、数据存储和时间成本。而且,由于没有集成化的工具用于整个机器学习的工作流,机器学习模型的传统开发方式是复杂、繁复和昂贵的。

Amazon SageMaker消除了机器学习过程中各个步骤的繁重工作。通过预置的Notebook、针对PB级数据集优化的常用算法,以及自动模型调优,Amazon SageMaker大大降低了模型构建和训练的难度。并且,Amazon SageMaker显著简化和加快了模型训练过程,可以通过自动提供和管理基础设施来训练模型和运行推理。同时,AWS 最近宣布了多项重要功能和高级特性,让客户能够更轻松地构建、训练、调优和部署机器学习模型。这些功能包括:

  • 面向机器学习的集成开发环境(IDE):Amazon SageMaker Studio将所有用于机器学习的组件集中在一个地方。跟使用集成开发环境(IDE)做软件开发一样,开发者现在可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其它应用程序资产,例如用于移动应用程序的图像。当前,机器学习工作流有大量组件,其中许多组件都带有它们自己的一组各自独立的工具。Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面。Amazon SageMaker Studio为开发者提供了创建项目文件夹、组织Notebook和数据集,以及协作讨论Notebook和结果的功能。Amazon SageMaker Studio使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

 

  • 弹性笔记本:Amazon SageMaker Notebooks提供了一键启用的Jupyter Notebook,具有秒级的弹性计算提升能力。Notebooks包含了运行或重新创建机器学习工作流所需的一切要素。在此之前,要查看或运行Notebook,开发者需要在Amazon SageMaker中启动计算实例。如果他们发现需要更多的算力,必须启动一个新实例,转移Notebook,关闭旧实例。而且,由于Notebook与计算实例是耦合的,通常存在于开发者的工作站上,其共享和迭代协作很不容易。Amazon SageMaker Notebooks提供了弹性的JupyterNotebook,让开发者可以轻松地调高或降低Notebook需要的算力(包括GPU加速)。这些调整在后台自动发生,不会打断开发者的工作。开发者不再需要浪费时间来关闭旧实例、在新实例中重新创建所有工作,从而可以更快地开始构建模型。Amazon SageMaker Notebook还可以自动复制特定环境和库依赖项,实现Notebook一键共享。这将使构建模型的协作变得更容易,比如,一个工程师可以很容易地将手头工作共享给其他工程师,让他们在现有工作的基础上构建模型。

 

  • 实验管理:Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代,目的是隔离和衡量更改特定输入时的增量影响。这些迭代过程可能会生成数百个实验构件,如模型、训练数据和参数设置。但是,开发者目前缺乏一个便利的实验管理机制,甚至不得不依赖电子表格来跟踪实验,手动对这些构件进行排序,以了解对应的影响。Amazon SageMaker Experiments自动捕获输入参数、配置和结果,并将它们存储为“实验”,帮助开发者管理这些迭代。开发者可以浏览活跃的实验,根据特征搜索以前的实验,回顾以前的实验结果,还能用可视化的方式比较实验结果。Amazon SageMaker Experiments也保留了实验的完整谱系,如果一个模型开始偏离其预期结果,开发者可以及时回溯和检查。因此,Amazon SageMaker Experiments使开发者更容易快速迭代和开发高质量的模型。

 

  • 调试与分析:Amazon SageMaker Debugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型。当前,机器学习训练过程基本上是不透明的,训练时间可能很长、很难优化;而且,往往就像一个“黑箱”,解读和解释模型都很困难。使用Amazon SageMaker Debugger,在Amazon SageMaker中训练的模型将自动发出收集到的关键指标,这些指标可以在Amazon SageMaker Studio中查看,也可以通过Amazon SageMaker Debugger的API查看,为训练的准确性和性能提供实时反馈。当检测到训练问题时,Amazon SageMaker Debugger会提供警告和补救建议。Amazon SageMaker Debugger也可帮助开发者解读模型是如何工作的,向神经网络的可解释性迈出了第一步。

 

  • 自动构建模型:Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。当前的机器学习自动化方法,在创建初始模型方面做得不错,但是对于如何创建模型、模型中包含什么内容,并没有数据提供给开发者。因此,如果模型达不到期望,开发者想要改进它,就没有什么办法了。此外,当前的机器学习自动化服务只给客户一个简单的模型。有时客户希望做出一些取舍,例如以某个版本的模型牺牲一点准确性,以换取更低延迟的预测。但是如果客户只有一个模型可用,就没有这样的可选项。Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优,跟踪其性能,然后根据性能对模型进行排名。点击几下鼠标,用户可以得到用于部署的、性能最佳的模型推荐,而这只需很少一点时间和精力用于训练。并且,用户可以清楚地看到模型是如何创建的,以及模型中包含什么内容。缺乏机器学习经验的人可以使用Amazon SageMaker Autopilot轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型,团队可以在此基础上进行进一步迭代。Amazon SageMaker Autopilot为开发者提供了多达50种不同的模型,可以在Amazon SageMaker Studio中查看。因此,开发者能够针对应用场景选择最佳模型,并且可以结合不同的优化因子考虑多个候选模型。

 

  • 概念漂移检测:Amazon SageMaker Model Monitor允许开发者检测和纠正概念漂移(conceptdrift)。影响部署到生产环境后的模型的准确性的一大因素就是生产环境中的输入数据开始不同于模型训练所使用的数据集,从而影响预测结果,例如经济状况改变导致的新利率会影响国内采购预测,季节变化带来不同的温度、湿度和空气压力会影响设备维护时间表的预测,等等。如果输入数据开始出现这样的差异,就会导致所谓的“概念漂移”,即模型用于预测的模式不再适用。Amazon SageMaker Model Monitor自动检测模型部署中的概念漂移。Amazon SageMaker Model Monitor在训练期间创建一组关于模型的基线统计数据,将用于预测的数据与训练基线进行比较。当检测到漂移时,Amazon SageMaker Model Monitor会向开发者发出告警,并帮助他们直观地确定原因。开发者可以使用Amazon SageMaker Model Monitor的开箱即用功能立即检测漂移,也可以为Amazon SageMaker Model Monitor编写自己的规则用于监测。Amazon SageMaker Model Monitor让开发者更容易调整训练数据或算法以解决概念漂移问题。

“国内越来越多的企业正在探讨机器学习和人工智能技术带来的巨大潜力,探索如何把这些技术融入到日常应用当中。但实际上,除了少数具有专家人才和数据科学家的企业外,大部分公司还是很难应用机器学习这项技术,因此客户希望我们可以让这项技术变得更方便、更易用。”AWS全球副总裁及大中华区执行董事张文翊表示,“AWS提供了广泛、深入的机器学习和人工智能服务。Amazon SageMaker在AWS中国(宁夏)区域和AWS中国(北京)区域上线,将帮助更多中国客户去除机器学习涉及的混乱和复杂性,让他们能够胜任构建、训练和部署模型的工作,以应对新的挑战。”

全球已有数以万计的客户利用Amazon SageMaker加快机器学习部署, Autodesk、Change Healthcare、拜耳、英国航空、盖洛普、洛杉矶快船队、松下航空电子(Panasonic Avionics)、环球邮报和T-Mobile等等。中国客户如虎牙、大宇无限、嘉谊互娱、华来科技等也已选择Amazon SageMaker大规模地构建、训练和部署机器学习模型。

大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供移动短视频服务。大宇无限技术副总裁刘克东表示:“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整个流程极为复杂,需要大量的开发者耗费很长的时间才有可能完成。Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程,使我们无需构建基础设施,我们的算法工程师只需为Amazon SageMaker准备数据,仅用了三个月的时间就从零完成了整个系统的建设并承受了实际用户访问的压力。”

借助AWS提供的Amazon EC2 GPU实例和Amazon SageMaker,华来科技以优化的成本将机器学习创新融合到其智能家居、智慧安防设备和服务中。天津华来科技有限公司云业务部总监季宝平说:“在AWS上,我们可以完成算法的构建和模型训练,并且该过程完全不需要我们在本地投资昂贵的计算硬件,一切都是在云端以按需使用的方式完成。与行业通用的公开算法不同,更重要的是我们自己训练的模型在应用场景中具有更多个性化空间,并且我们对自己训练出的模型具有知识产权,这将是我们未来的核心竞争力。”

AWS合作伙伴网络 (APN) 成员对Amazon SageMaker在中国区域的上线也表示欢迎。

德勤D.Data是一个基于AWS的 PaaS (平台即服务) 平台,为企业客户提供数据分析和业务洞察。它为不同的行业和业务场景提供了各种数据建模和预测服务。德勤创新、数字化研发中心主管合伙人賴有猷评价道:“通过Amazon SageMaker,我们大大提高了算法和机器学习建模能力,提高了分析效率。Amazon SageMaker的IDE平台也帮助我们加快了开发进程。”

伊克罗德是AWS的核心级咨询合作伙伴 (APN Premier Consulting Partner),其基于AWS的解决方案极大地减少了用户的开发时间与运营费用。伊克罗德中国区副总裁桂梓捷表示:“我们运用Amazon SageMaker平台加速企业导入行业AI解决方案,如标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等,针对客户实际遇到的商业问题,量身打造真正解决问题的端到端AI应用。随着Amazon SageMaker在中国区域落地,我们将会以SageMaker平台作为企业MLOps(机器学习运营)核心,协助企业构建MLOps流程,尤其在金融行业领域,帮助企业内部数据科学家与AI工程师建立、训练与部署机器学习模型。”

###

]]>
中国农业银行姚琥:“AI+知识图谱”在信用风险管理领域的探索 //www.otias-ub.com/archives/902053.html Thu, 04 Jul 2019 02:31:12 +0000 //www.otias-ub.com/?p=902053 当前,在全球经济放缓和国内经济增速换挡的大背景下,商业银行赖以生存的环境正发生着深刻变化,过去单纯依靠信贷资产规模扩张的“外延式”高速发展和高盈利时代已基本结束,商业银行信贷业务面临紧迫的转型压力。与此同时,人工智能、大数据、云计算等金融科技快速发展,推动数字化转型日益成为商业银行发展的重要驱动力。农业银行紧紧把握金融科技发展的重要契机,制定“金融科技+”战略,在业内率先构建了知识图谱,并持续推进“AI+知识图谱”技术在信贷管理领域的应用,为全行信贷产品创新和信用风险管控提供了强有力的科技支撑。

中国农业银行研发中心副总经理姚琥

商业银行信贷领域转型已成必然之势

受国内供给侧结构性改革、利率市场化、中美贸易摩擦、互联网金融冲击和金融脱媒现象加剧等多重因素的叠加影响,商业银行利润增速放缓,信贷资产质量承压,信贷产品供需矛盾凸显。同时,伴随企业跨地域、跨行业、集团化经营业态的发展,使得客户信用风险表现形式更加多元化,风险传导机制日益复杂化,商业银行信用风险管理难度持续加大,信贷业务转型求变迫在眉睫、势在必行。

“AI+知识图谱”金融科技基础支撑体系建设

农业银行高度重视金融科技创新发展,制定“金融科技+”战略,以建设金融大脑为切入点,在同业率先构建了知识图谱,实现了知识图谱全生命周期管理,为全行数字化经营和智能化转型提供了基础性、核心性的科技支撑。

1.打造金融大脑。金融大脑是农业银行的人工智能核心系统,在业内首次提出企业级AI金融平台解决方案,实现了全行的“智能集中”。金融大脑打造了感知和思维两大服务引擎,建设了统一的智能服务,大范围集成了人工智能核心技术,为全行众多业务领域实现AI赋能。

金融大脑实现多项创新,搭建了基于GPU/CPU的高性能AI计算架构,应用虚拟化技术跨平台对资源进行云化管理,提供高精度智能感知服务能力。建设了全生命周期的一体化机器学习与模型管理平台,实现了全流程自动化建模和模型自学习演进。全渠道实时智能决策引擎为业务发展提供更为智能的实时决策服务。拖拽式交互中心、高效知识共享与沙盘演练等大大降低了AI创新门槛,提升了AI创新效率。

2.构建知识图谱。在金融大脑建设过程中,农业银行基于DIKW(数据Data,信息Informa-tion,知识Knowledge,智慧Wisdom)体系,经过知识识别、融合、存储等环节,从海量数据中提炼信息,发现知识,形成知识图谱,并通过知识服务,将知识升华为智慧,让金融大脑变得更加聪慧。知识图谱采用四层架构模式构建,自底向上分别是知识识别、知识融合、知识存储与计算以及知识服务(如图1)。

图1农业银行知识图谱构建全过程

(1)知识识别。综合运用ETL、全文检索、模式识别等技术手段,从行内结构化数据、行外已购工商、海关、舆情、司法等非结构化和半结构化数据中,获取实体、关系、属性和事件等信息,实现从数据到信息的萃取。

(2)知识融合。按照本体建模指引,对知识识别后的实体、关系等信息建立关联,并进行实体对齐,形成相对完整的知识图谱,完成从信息到知识的提炼。

(3)知识存储与计算。搭建了分布式的知识图谱存储平台,按照知识图谱内容不同,分门别类存储在图数据库、列数据库、索引库、关系数据库和RDF库中,支持根据应用场景选取相适宜的存储与计算,大幅提升查询和分析效率。

(4)知识服务。已建成四类知识服务,分别为语义分析、语义搜索、图挖掘和模型工厂,实现了知识发现,奠定了智慧基础。

相对于一般行业知识图谱,农业银行知识图谱实现了诸多突破与创新。

一是实现知识图谱全生命周期管理,涵盖从获取了融合到应用全过程,锻造出从结构化、半结构化和非结构化数据中提取知识的能力。

二是采用自顶向下和自底向上相结合的模式进行本体建模,形成本体概念、属性和关系等,易于业务人员理解、使用和管理。

三是采用混合架构,具备分布式存储与并行计算能力,支持大规模知识图谱构建与计算,具有高可用、高性能、可扩展等特点。

四是基于知识图谱的计算引擎,打造了语义分析、语义搜索、图挖掘和模型工厂四种智能服务,实现服务场景全覆盖,杜绝在知识应用中出现“孤岛”现象。

目前,农业银行知识图谱原始数据量在千亿级别,节点数在千万级别,各类关系(边)2亿条左右,支持各应用通过联机或批量方式接入。联机进行风险客户识别的平均响应时间约200ms,批量完成客群划分需要3小时左右。

通过构建知识图谱,农业银行打造了从“字符串”到“实体”的知识表征能力、基于“实体”关系网络图谱的知识关联能力、基于语义的精准检索能力,以及基于本体的知识推理能力,为金融产品创新和风险防控提供了强大的科技支撑。

“AI+知识图谱”成为赋能信贷变革的核心引擎

农业银行立足“AI+知识图谱”的创新体系,依托智慧信贷工程,实现“AI+知识图谱”在信贷管理领域的落地与应用,以科技创新助力信贷产品创新和信用风险防控的深入变革,全面提升了信贷智慧化经营管理水平。

1.加速信贷产品和服务模式创新,服务实体经济发展。综合运用大数据、“AI+知识图谱”等技术,进行客户360度刻画,准确识别和受理客户金融需求,构建科学的授信和风控模型,分层覆盖长尾客户,服务三大战略,大幅提升信贷产品有效供给能力和实体经济服务能力。

(1)服务乡村振兴战略。围绕农村金字塔形“上、中、下”层客户群,基于“AI+知识图谱”等技术,重点分析客户群所在产业链中的位置,精准识别客户群融资需求,分别推出快农贷、便捷贷、惠农电商贷、农民安家贷等产品线,建设服务“三农”的金融生态圈。

(2)服务普惠金融战略。运用“AI+知识图谱”等技术,对客户进行多维度精准画像,把控潜在风险,并逐步建立起以“e贷系列”小额线上融资产品、“云贷系列”供应链融资产品为核心的全线上小微企业信贷产品体系。以“e贷系列”微捷贷产品为例,上线3个月左右,已累计服务客户1.5万。

(3)服务消费升级战略。基于“AI+知识图谱”等技术,精准洞察客户需求变化,实现产品快速创新和智能推介,先后推出网捷贷、质押贷和车联贷等系列产品,为客户提供线上化、场景化、定制化和智能化的产品服务,持续提升获客、留客和活客能力。

2.创新信用风险管理模式,防范金融风险。应用“AI+知识图谱”等技术,通过构建智能化风控模型,实现大规模客户数据的关联分析和实时精准的智能化风控服务,完成信用风险防控从单体到群体、从人工到人机交互、从事后到事前的三项转变,大幅提升客户群体性风险防范能力,牢牢守住不发生系统性风险底线。

(1)建立关系视图。通过深度整合行内外数据,建立信贷客户标识特征库,全面识别客户间的关联关系,构建客户关系全网视图。目前,该视图已引入行内信贷、客户、交易三大主题和行外海关、司法、舆情、工商等六大主题数据,识别出担保、投资、控股等11大类33小类500多万条关联关系。

(2)划分风险客群。基于客户关系视图,运用知识图谱和社区发现理论,通过单一关联关系风险传导系数计量、客户间风险传导系数拟合、客群关系子网划分三个步骤,完成信用风险传导知识图谱构建和风险客群自动划分。相较以往专家经验模式,不仅可以高效处理大规模客群和多种复杂关系,且自动识别出的客群更为精准和可信。

(3)洞察客群风险。依托信用风险关系知识图谱,打造客群风险洞察引擎,主要包括核心企业识别、风险传导测算、客群风险测评、客群关系探索四大类应用。作为支撑信用风险管理模式创新及防控金融风险的智慧基础,有效提升客户群体性风险防控的意愿、能力、时效和成效。

图2农业银行“金融大脑”的五大突破

“AI+知识图谱”的未来展望

“AI+知识图谱”能够打破不同场景下的数据和知识隔离,避免知识孤岛,是商业银行发挥数据价值的良好手段,助力商业银行用智慧构建强大的护城河。当前,“AI+知识图谱”的理论和构建技术仍有待长足发展,在金融领域的应用还处于起步阶段,预计未来能够在智能风控、智能反欺诈、智能营销、智能搜索可视化等领域得到更为广泛和深入的应用,助力智慧银行建设。

“向之所欣、俯仰之间,已为陈迹”。世界在变革、时代在进步,深处金融业科技创新的最前沿,让我们共同迎接属于我们时代!

]]>
企业大数据挖掘:为员工构建职场知识图谱 //www.otias-ub.com/archives/567215.html Thu, 23 Feb 2017 12:49:58 +0000 //www.otias-ub.com/?p=567215 微软亚洲研究院有一位大名鼎鼎的个人助理,昵称EDI(音同Eddie),从帮助员工预订会议室到更新梳理公司内部“八卦”信息,随叫随到全年无休;不仅如此,EDI对员工们的喜好也堪称了如指掌,知道你最喜欢什么时候、最常在哪里开会,也知道你最关心哪些新闻。这份体贴赢得了越来越多员工的信任和喜爱,目前在研究院中已经有 超过一半的会议 是由EDI来安排——是的,你没猜错,EDI是人工智能。

职场知识图谱

EDI为何如此聪明?一方面,EDI拥有精准的自然语言理解和对话能力;另一方面,利用深度学习和社交网络融合等前沿技术,EDI为每个用户构建了一张关于他们的职场知识图谱。本文首先介绍如何构建用户的职场信息图谱,这是EDI个人助理的“大脑”,后续文章将介绍如何赋予EDI自然语言理解和对话能力,让它能为主人愉快地工作,欢迎有兴趣的读者继续关注。

“The more it has, the more it’s him.” 在英剧《黑镜》第二季第一集当中,女主人公通过和机器人对话的方式怀念自己逝去的男友。借助大数据的力量,这个机器人能够从主人公男友的社交网络甚至私人邮件中抽取和整合他的个人信息、关系网络和语言习惯,构建属于这位男生的个性化知识图谱,从而实现对他惟妙惟肖的模仿——如上图台词所说,系统抓取到的信息越多,机器人模仿的语言行为就越和他本人相似。

若说《黑镜》里的机器人是基于关于用户的全方位知识图谱,那么,本文要介绍的EDI 则专注于用户的一个侧面,即用户的职场知识图谱。

在一个机构里,我们把员工的职场知识图谱叫做EDI Graph( Enterprise Deep Intelligence Graph ),图谱内的信息包括员工的部门、技能、项目、文档、时间、会议室和办公室等,其中每条信息又有各自丰富的属性,信息与信息之间也存在丰富的关联;这些信息的来源主要分为企业内部数据和互联网数据两部分,其中,企业内部数据主要包括内部网页、文档、会议记录、员工基本资料等数据,互联网数据则主要包括维基百科、学术论文、LinkedIn等公开数据。如何将来自公司内部、社交网络、Web等不同来源的异构数据进行梳理和融合、构成一张完整的职场知识图谱,这是构建EDI Graph的关键技术。只要有了图谱,就能构建EDI Bot,让这个昵称为EDI的机器人拥有“大脑”,能进行理解和分析,了解每个员工的专长以及从事的工作内容,成为员工贴心的个人助理。

与《黑镜》里的机器人相似,EDI也是知道信息越多就越能了解人以及人与人之间的关系,越接近员工的工作知己。

信息融合

“EDI, where is BJW1?”

对于同一件事,人们往往会有不同的表达,这是人与机器的一大不同。 举例:“BJW1”是英文“北京微软西1号楼“的简称,但人们在不同情境下可能还有其他表达方式,比如“BJW-1”、“Beijing West 1”、“Microsoft Tower 1,Beijing,China”以及“微软1号楼”等,这些表达上的差异无法用简单的字符串匹配或缩写匹配的方式来完成相似度的计算。那么,EDI该如何知晓它们所指的其实是同一个地点呢?

我们的做法是将这些千变万化的表达看作不同的语言,通过机器翻译技术,找到词与词之间具有的某种翻译关系,从而实现相似词语的融合。

首先,利用种子规则,找到信息中高准确度的种子节点对,利用种子节点对中属性的不同表达,构建平行语料库。之后,使用深度学习技术构建翻译模型,完成不同信息源之间的属性“翻译”。通过机器翻译,不仅能计算简单字符串匹配无法计算的相似表达,甚至还能计算不同语言中同一表达的相似度,让EDI 能够吸收消化更多更广泛的信息来源,对用户的表达做出更准确的判断。

“Hi EDI, schedule a meeting with David now.”

得到不同表达的相似度之后,如何精准对应也是一门学问。例如,只要给个人助理EDI发送一条非常简洁的信息“帮我和David订个会议室”,EDI就能帮助员工准确预订好会议室。然而只要打开微软员工目录,就会发现名为David的员工大约有两千名,EDI如何分辨他们并从中确定要和用户开会那个David究竟是哪一个呢?要知道,这两千位名为David的员工,有些位于同一部门,甚至职务也都相同,这时,单单通过机器翻译得到的属性相似度,可能无法做出正确的对应。

精确匹配的突破口在于不同David的职场知识图谱,其网络结构也是不同的,我们使用协同训练(Co-Training)的方法,迭代地进行图结构信息的匹配。在每一轮迭代中,首先利用当前已匹配的实体对,更新神经网络翻译模型,并利用更新后的模型完成属性间的相似度计算;同时,根据当前已匹配节点计算待匹配节点的公共相邻节点对,通过结合属性匹配和图结构,可以得到新的匹配集合,如此迭代直到收敛。

简单说,EDI能将职场知识图谱中同一个David的信息融合到一起,把不同的David放在各自节点上,然后通过参会历史、项目合作、内部的汇报关系等等,了解公司同事之间的远近,从而锁定用户真正想找的David,完成用户交给的安排会议并预订会议室的任务。

信息分析与理解

《黑镜》中的机器人系统对主人公男友在社交网络上的电邮、照片、视频甚至聊天记录进行了深入的分析和学习,从而实现对其惟妙惟肖的模仿。同样,EDI在掌握丰富的信息之后,也需要进一步分析和理解这些数据,才能深入了解企业中的每一个员工。

在一个企业中为员工构建职场知识图谱,最为基本也最为重要的一点,就是构建出每位员工的工作内容时间线,通过时间线我们就可以了解到“who,when,what”,即:谁,在何时,做过什么事情。

有了这些结构化的知识,如果想知道谁在做Cortana相关的项目,只需要问“Who is working on Cortana?”,EDI就能给出你想要的答案。这对构建企业智能应用具有极为重要的意义。

顺带指出,项目名称的抽取也不简单。我们无法通过简单地标注数据、训练模型或是基于规则的方法来进行抽取,因为不同行业、不同领域对于项目的表述可能千变万化,那么EDI是如何抽取出工作内容以及相关项目的名称呢?

我们认为,项目的名称都是语义完整的短语——例如,在“微软亚洲研究院在丹棱街5号”这句话里,“微软亚洲研究院”就是一个语意完整的短语——于是,我们先从企业内部的数据抽取出语意完整的短语,再从这些短语中划分出项目的名称。在微软内部,各种文档、网页等总量在千万这个数量级,而统计规则例如互信息、熵等,在数据量较大的时候可以有效地完成对短语的切分。因此,我们在递归神经网络(Recursive Neural Network)模型中通过后验正则化(Posterior Regularization)引入互信息、熵等统计量定义的偏序切分规则,在完成短语划分的同时,得到其对应的语意向量表示,最后通过度量语意信息来判断其是否是一个项目的名称。

小结

有了基于企业内部和互联网大数据构建员工的职场知识图谱EDI Graph,就能让机器人个人助理EDI Bot拥有聪明的“大脑”,为用户提供贴心的服务。我们将在后续的文章具体介绍EDI Graph怎么被运用到机器人的工作场景中,以及怎样通过平台让机器人获得与人进行自然语言对话的能力,敬请关注,也欢迎你就这一题目分享自己的见解和经验。

]]>