机器学习 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Wed, 13 Nov 2024 12:57:33 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 世界经济论坛:加强AI生态系统 促进社会创新 //www.otias-ub.com/archives/1720168.html Tue, 17 Dec 2024 01:00:50 +0000 //www.otias-ub.com/?p=1720168 199IT原创编译

在私营部门、政府和中介机构的正确支持下,社会创新者可以扩大人工智能的影响力,造福社会。

人工智能的变革潜力受到广泛赞誉。研究表明,部署机器学习的员工可以实现高达30%的效率提升,并且发现该技术有可能将占用员工时间的活动自动化高达70%,因此这项技术被行业所接受也就不足为奇了。

在IBM全球人工智能采用指数调查的8000多家公司中约有42%已经部署了人工智能来提高客户服务、信息技术和营销销售职能的效率。此外,另有40%的受访者表示,他们已经开始探索在企业内部使用庄闲网络娱乐平台进入 技术。同样,66%的受访者认为人工智能将在未来三到五年内显著影响他们的生活。

虽然人工智能对经济增长有着巨大的希望,但认识到围绕这项技术对环境和社会影响的日益增长的担忧是至关重要的。一些研究表明,超过1/3的员工担心因人工智能而失去工作,这因职业和地域而异。

这些担忧促使我们迫切需要强有力的公共治理和政策。

分析显示,在基础样本集中审查的近100项人工智能举措,有31%的人关注积极影响。在这些以影响为重点的倡议中,提供直接财政资源的不到一半。相比之下,近60%的人工智能项目都是直接获得财政资源的,而不是专注于影响。

总体而言,近年来为以影响为重点的倡议提供的全球资金在业务预算和资金方面达到22亿美元。


199IT.com原创编译自:世界经济论坛 非授权请勿转载

]]>
PitchBook:2024年第二季度人工智能与机器学习报告 //www.otias-ub.com/archives/1726136.html Wed, 13 Nov 2024 21:00:15 +0000 //www.otias-ub.com/?p=1726136 6月11日,Mistral AI获得6.4亿美元B轮融资,融资后估值达65亿美元。

6月14日,医疗软件公司Tempus AI在纳斯达克上市,以10.9倍的企业价值(EV)/历史营收计算,融资后估值为61亿美元。

6月15日,基础模型挑战者xAI获得60亿美元B轮融资,估值240亿美元。

风险投资活动

风险投资活动在2024年第二季度激增,推动了30笔10亿美元的融资。PitchBook追踪了第二季度人工智能和机器学习公司308亿美元的风投资金,其中包括xAI的60亿美元。英伟达参与了本季度前五笔交易中的四笔:CoreWeave的11亿美元融资,Mistral AI的B轮融资,Scale AI与亚马逊和Meta的F轮融资,以及Wayve与微软的10亿美元融资。尽管有企业风险投资,但交易数量仍明显低于经济衰退前的水平,与过去7个季度保持一致。对于能够融资的初创公司来说,估值持续上升,早期和后期投资交易的投前估值中值分别达到了2820万美元和5000万美元的新高。

第二季度,投资退出活动在经历了前几个季度的下滑后出现反弹,退出金额和国别均有所上升。在Tempus AI以10.9倍的EV/revenue倍数上市的支撑下,退出价值达到115亿美元,是自2022年第二季度以来的最高水平。这是两项重大收购中的第一项,该公司还收购了Deci,这是一个优化人工智能模型以提高硬件效率的平台。这些交易总额估计为13亿美元,突显了硬件供应商愿意为加强其软件生态系统而进行的投资。竞争对手AMD紧随其后,以总计7.17亿美元的价格收购了Fireworks AI和silo AI,这表明并购集中在表现最好的股票的收购方身上。其他异常收购包括现代以9.23亿美元收购motion;JFrog以2.3亿美元收购Qwak。

​文档链接将分享到199IT知识星球,扫描下面二维码即可查阅!

]]>
Zscaler:2024年AI安全报告 //www.otias-ub.com/archives/1694463.html Sun, 05 May 2024 22:00:56 +0000 //www.otias-ub.com/?p=1694463 人工智能不仅仅是一种开创性的创新,它现在已经成为一种常态。随着像ChatGPT这样的生成式人工智能工具在大大小小的方面改变着商业,人工智能正在深入到企业生活的结构中。但是,关于如何安全地采用这些人工智能工具,同时防御人工智能驱动的威胁的问题尚未解决。

企业正在工程、IT营销、财务、客户成功等部门迅速采用人工智能和机器学习工具。但是,他们必须平衡人工智能工具带来的众多风险,以获得最大的回报。

重要发现

人工智能/机器学习工具的使用量增长了594.82%,从2023年4月的5.21亿笔人工智能/机器学习驱动的交易增加到2024年1月的31亿笔。

企业阻止了18.5%的人工智能/机器学习交易,在几个月内被阻止的交易增加了577%。反映了对AI数据安全的担忧正在增长。

制造业产生的AI流量最多,占Zscaler云中所有人工智能/机器学习交易的20.9%,其次是金融和保险(19.9%)和服务业(16.8%)。

ChatGPT的使用率继续飙升,增长了634.1%。

产生人工智能和机器学习交易最多的前5个国家是美国、印度、英国、澳大利亚和日本。

企业正在向AI工具发送大量数据,2023年9月-2024年1月期间,人工智能/机器学习应用程序之间总共交换了569 TB的数据。

人工智能正在以前所未有的方式赋予威胁参与者力量,包括人工智能驱动的网络钓鱼活动、深度伪造和社会工程攻击、多态勒索软件、企业攻击面发现、自动化漏洞生成等等。

]]>
40亿美元投资Anthropic 亚马逊云科技夯实生成式AI三层架构 //www.otias-ub.com/archives/1685289.html Wed, 17 Apr 2024 02:22:13 +0000 //www.otias-ub.com/?p=1685289 毋庸置疑,在追加投资27.5亿美元之后,亚马逊云科技完成了对Anthropic总共40亿美元投资,拿到了生成式AI领域的全球顶级船票。这也是2024年生成式AI的关键性事件之一。

在近期的2024亚马逊云科技生成式AI媒体沟通会,亚马逊云科技大中华区产品部总经理陈晓建介绍了亚马逊云科技在生成式AI领域的最新进展。相关的进度。陈晓建表示,亚马逊云科技与Anthropic的合作是非常紧密,Anthropic推出下一代模型Claude3的时候,第一时间在Amazon Bedrock平台上完成了发布。同时,Anthropic做出长期承诺,将通过Amazon Bedrock为世界各地的亚马逊云科技的客户提供访问其下一代基础模型的能力。

没有一个基础模型能适用所有业务场景

亚马逊云科技在生成式AI领域为客户提供了三层架构。

最底层,亚马逊云科技为客户提供了基础算力,包括英伟达最新推出的G200芯片,亚马逊自研芯片Amazon Trainium、Amazon Inferentia以及用于训练和推理的平台Amazon Sagemaker。

中间层,以Amazon Bedrock为代表,通过一个模型平台支持多种技术大模型。Amazon Bedrock提供各种领先的基础模型供客户选择:既有知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。

最上层,应用GenAI技术的开箱即用的云服务。例如Amazon Q,可以与、Amazon QuickSight、Amazon Connect、Amazon CodeWhisperer等应用都实现了非常有效地结合。

与Anthropic在生成式AI领域进行广泛的深度合作

Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最领先的大模型之一,共包含三个模型:具有几乎即时响应能力且最紧凑的 Claude 3 Haiku;在技能与速度之间达到理想平衡的 Claude 3 Sonnet;以及为处理高度复杂任务设计的最智能模型 Claude 3 Opus。客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。

Claude 3的能力已经非常突出,包括四个方面:

1.Claude 3创造模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。客户可以借助AI驱动的响应,自动化完成任务并保证高准确率,特别是Claude 3 Opus,它不仅在大多数常见的AI系统评估基准测试中表现优异并且在复杂任务中表现出优秀的理解能力和流畅性,走在通用智能的最前沿。

2.Claude 3现已具备多模态能力——Claude 3可以接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型(尤其是Claude 3 Haiku)。

3.Claude 3能够降低幻觉,提升回答准确率——在处理挑战性开放问题(100Q Hard)上准确性明显提升,并且减少错误答案。

4.Claude 3系列模型均提供200K 超长上下文准确召回,针对某些特殊场景,会开放支持 1M token的上下文窗口;大海捞针(Needle In A Haystack, NIAH) 召回率表现优异;甚至还能识别出测试本身的局限,比如发现某“目标”句子明显是后来人为添加进原始文本的。

Claude 3应用场景包括内容续写、代码辅助、电商商品描述撰写、长文本知识召回总结等。

在活动现场互动时,Claude 3对于随机提出的相对论问题及中国古代丹法流派伍柳派相关问题均快速得出逻辑清晰的答案。

亚马逊云科技如何平衡模型能力和客户成本

亚马逊云科技之所以推出Amazon Bedrock这样的产品,是因为它为客户提供了丰富的选择,客户可以在自己的应用场景下,选择成本和性能更合适的环境。

陈晓建也列举出客户的疑问:既然Claude 3如此强大,为什么要加Amazon Bedrock这么一层呢?

在陈晓建看来,模型能力和真正的运营生产之间,需要增加很多辅助能力。Amazon Bedrock提供一系列除了大模型以外的能力。

首先是Provisioned Throughput(预置吞吐量)。客户可以购买后台资源,这些资源提供的大模型能力完全独享。

其次,是模型微调(fine-tunning),很多客户都会关注如何将自身的业务数据与大模型结合,进行微调。这毫无疑问是业务能够产生差异化价值的关键,关键在于如何用好业务数据,而非仅仅简单使用完全标准化的大模型。这个能力也是Amazon Bedrock提供的一个关键能力。

此外,还有类似Guardrails的能力,能够全面监管大模型使用情况,通过适当的配置来降低幻觉现象的产生,同时提供全方位日志。

从用户角度来看,除了大模型之外,如果他们需要充分利用大模型的能力,那么应该如何与业务结合呢?陈晓建认为需要一个非常强的数据基础或者称之为数据底座。要使用大模型,必须有一定的生产结合。生产结合意味着需要拥有大量的业务数据,需要去与大模型打通。

陈晓建表示,“大模型非常重要,非常核心,然而仅靠大模型对你的生产是远远不够的。你需要一系列周边能力帮助你正确、合理、安全、高效地使用大模型。这就是亚马逊云科技一系列产品所提供的价值所在。”

 

]]>
ClearML:59% 的高管缺乏必要的资源来满足企业领导层对生成式人工智能创新的期望 //www.otias-ub.com/archives/1627563.html Fri, 21 Jul 2023 12:23:11 +0000 //www.otias-ub.com/?p=1627563 一项最近的研究揭示了 Fortune1000(F-1000)企业在采用生成式人工智能(generative AI)方面的情况。这项由开源 AI 解决方案公司 ClearML 与 AI 基础设施联盟(AIIA)合作进行的研究揭示了高管面临的挑战和资源不足问题。

据全球调查显示,根据这项全球研究,59% 的高管缺乏必要的资源来满足企业领导层对生成式人工智能创新的期望。预算限制和有限的资源成为企业成功采用人工智能的关键障碍,阻碍了有形价值的创造。

研究还发现,66% 的受访者无法完全衡量其AI/ML项目对利润的影响和投资回报 (ROI) 。这凸显了大型企业中资金不足、人员不足和管理不足的人工智能、机器学习和工程团队根本无法有效量化结果。

调查还发现,企业对人工智能和机器学习投资的收入期望越来越高。超过半数的受访者(57%)表示,他们的董事会预计在未来财年从这些投资中获得两位数的增长,而37% 预计增长率为个位数。

生成式人工智能的采用情况

根据该研究,大多数受访者认为释放人工智能和机器学习用例来创造商业价值至关重要。81%的受访者将其视为最优先事项或三大优先事项之一。

此外,78% 的企业计划在2023财年采用 xGPT/LLM/生成式人工智能作为其人工智能转型计划的一部分,另有9% 的企业计划在2024年开始采用,使总数达到87%。

受访者也几乎一致 (88%) 同意其组织计划实施针对跨企业业务部门采用和使用生成式人工智能的政策。

尽管生成式人工智能和机器学习在企业中是一个关键的收入和创新引擎,59% 的高管缺乏充足的资源来满足商业领导层对生成式 AI 创新的期望。

他们面临预算和资源限制,阻碍了采用和价值创造。具体来说,在构建、执行和管理人工智能和机器学习流程时,人员、流程和技术都是 F-1000和大型企业高管确定的关键痛点:

42% 的受访者表示迫切需要人才,尤其是人工智能和机器学习专家,以推动成功。

另外28% 的受访者将技术视为主要障碍,表明缺乏统一的软件平台来管理其组织 AI/ML 流程的各个方面。

22% 的受访者将时间视为主要挑战,表示在数据收集、准备和手动管道构建上花费了过多的时间。

阻碍生成式人工智能采用的主要挑战

调查揭示了生成式人工智能采用中的一些主要挑战,包括定制和灵活性、数据保护、治理、安全与合规性以及性能和成本。AI 和生成式 AI 治理的关注不断上升,导致了严重的财务和经济后果。

研究发现,54% 的首席数据官、首席执行官、首席信息官、人工智能主管和首席技术官表示,他们未能治理人工智能/机器学习应用程序给企业带来了损失,而63% 的受访者表示,由于人工智能/机器学习应用程序治理不力,损失达5000万美元或更多。

当被问及在企业和业务部门中采用生成式 AI/LLMs/xGPT 解决方案时的主要挑战和障碍时,受访者确定了五个主要挑战,包括定制和灵活性、数据保留、治理、安全与合规性以及性能和成本。因此,企业需要增加对生成式 AI 的投资,并寻求集中的端到端平台,以提高可见性、无缝集成和低代码,从而推动生成式 AI 的采用。

自 站长之家

]]>
Perkinscoie:2022年新兴技术报告 //www.otias-ub.com/archives/1590289.html Mon, 15 May 2023 22:00:49 +0000 //www.otias-ub.com/?p=1590289 Perkinscoie发布了”2022年新兴技术趋势”。技术,以及新技术的创新,越来越多地塑造了我们的生活方式以及与环境互动的方式。报告审视了 10 项新兴和新生技术的一些关键发展、趋势和影响,这些技术不仅颠覆了现在的市场,而且还在影响和塑造未来。

  • 人工智能、机器学习和量子计算
  • 云计算和分布式基础设施
  • 数字媒体与娱乐
  • 绿色科技
  • 健康科技与医疗科技
  • 移动无线技术
  • 隐私与安全
  • 零售与电子商务
  • 机器人与自动系统
  • 航天科技

在过去的二十年里,由于技术的扩散和演变以及转型,新的商业模式已经出现,颠覆了传统的工作方式,并促进了新产品和服务的开发。虽然仍处于早期阶段,但这些颠覆仍在继续。

疫情加速变革步伐

COVID-19 和随后的应对措施加快了创新技术的转型和采用。由于大流行造成或加剧了威胁个人健康和生计的挑战,科技公司开始发明更好的解决方案来解决现在和未来的问题。

先进技术的融合将继续推动增长

随着先进技术的扩展和发展,它们也在融合。曾经被认为是独立的技术有望在未来十年相互结合并促进增长和经济发展。这包括对现有商业模式的颠覆和全新商业模式的创建。新技术旨在使企业更安全、更有保障,同时降低成本和环境影响。

理解对工业、社会和法律的影响

创新技术也带来了独特的挑战,包括法律和监管要求,需要远见和准备。技术的突破性发展正在帮助我们发展经济,同时也在重塑社会和环境。


]]>
CSET:中国先进的人工智能研究报告 //www.otias-ub.com/archives/1531759.html Sat, 13 May 2023 22:00:06 +0000 //www.otias-ub.com/?p=1531759 报告根据公开信息分析中国正在采取什么措施实现通用人工智能,如公开表达和其他常见措施。虽然通常被认为是“通用人工智能”或 AGI,但本文拒绝了这个模棱两可的术语,以及它与机器智能的联系。这是一种支持识别在新环境中自主运行的具有广泛能力的人工智能。

本文探讨了原则上通向通用人工智能的路径,描述中国为实现该能力而正在进行的工作。中国研究的三个广泛领域被认为与通用AI具有潜在的密切关系:机器学习、类脑人工智能研究和脑机接口(BCI)。构成该生态系统的人员、机构和研究的数据是下游研究的基础。

用于构建数据库和原型观察板的方法使分析师能够捕获并预测中国 AI 相关事件。支持该试点的数据有条件地接受后续研究的发展,这些研究是在本地或与外部参与者一起完成的,涉及中国人工智能、人工智能的政治用途和其他新兴的中国技术。

2017 年,中国国务院发布了全面的“新一代人工智能发展规划”,旨在到 2030 年使中国成为世界领先的人工智能强国。这表明中国坚定不移地致力于推动人工智能的发展。

该计划有一个互补的目标,即实现“先发优势”。就人工智能而言,中国与能力较弱的国家之间的差距正在不断扩大,因为人工智能通过机器学习不断进化。


]]>
《创造力:内容元价值之AIGC核心价值与生态影响洞察》重磅发布,聚焦AIGC创造能力与内容新生态 //www.otias-ub.com/archives/1570463.html Thu, 16 Mar 2023 05:18:39 +0000 //www.otias-ub.com/?p=1570463 徐琦 江艺彤 胡亦晨

2023年3月15日,中国传媒大学媒体融合与传播国家重点实验室新媒体研究院与新浪AI媒体研究院联合发布《创造力:内容元价值之战——AIGC核心价值与生态影响洞察》。该课题由新媒体研究院院长赵子忠教授与微博COO、新浪移动CEO、新浪AI媒体研究院院长王巍担任首席专家,由新媒体研究院副教授、中国传媒大学青年拔尖人才徐琦与微博年轻用户发展部总经理、新浪AI媒体研究院副院长乔宇担任项目负责人,由微博机器学习总经理、微博技术委员会委员王健民担任项目顾问,由中国传媒大学新媒体研究院与新浪AI媒体研究院团队共同完成。

2022年,AIGC掀起了内容创造热潮,ChatGPT、DALL·E等应用在诗歌、绘画、作曲等创意领域惊艳亮相,成为现象级应用。在此背景下,本报告紧扣AIGC的内容创造能力与生态变革两大关键词,深入探究AIGC创造能力的本质,基于内容元价值——“创造力”,探讨人类内容生产的“核心竞争力”,辩证分析AIGC对内容生态的影响。该报告是AIGC领域产学研用协作创新的重磅成果,值得期待。

本报告全面剖析AIGC在内容创意领域的表现,包括四部分:第一部分直击AIGC生成的创意内容,纵览行业内外辣评、热评;第二部分聚焦AIGC引发的内容生产力变革,以三大核心技术突破支撑AIGC跨模态创意生成,引发PGC、UGC向AIGC的生产范式变革;第三部分着眼于内容元价值——创造力,揭示AIGC的创造力本质为“模仿式创新”,无法逾越与人类创造力间的鸿沟;第四部分从生产主体、生成范式、内容消费等八大维度揭示AIGC对内容生态带来的全局影响,立体展现内容产业发展新趋势。

《创造力:内容元价值之战——AIGC核心价值与生态影响洞察》不容错过的精华看点包括:

观察:AI打破创意天花板

看点1:目前,由AI生成的创意作品涉及到诗歌、文案、图片、音乐歌词等多个领域,其创意质量与创造能力始终备受关注,公众与专家学者对此展开激烈讨论。

战线:内容生产力革命

看点22022年是AIGC迎来爆发元年!在生成算法、预训练模型以及多模态技术突破的推动下,AIGC的创意生成从文字、图片、音频、视频延伸至跨模态形态,更具高效率、低成本、定制化、个性化、多样性和智能化优势,为人类创意生成带来新方案。

看点3内容生产范式经历了由PGC、UGC到AIGC的巨大演变,通过不断提高生产效率、扩大生产规模,生产关系由“少数人掌握制作工具和渠道”转变为“更多的人获取低成本的工具、平台,促进了内容的广泛传播和共享”,内容消费者也从“被动接收”变成了“主动参与和创造”,实现了生产和消费的双重革命。

对决:内容元价值之争

看点4报告厘定了价值与元价值的概念即内涵,提出“创造力是内容的元价值”,是内容的产生与发展之始。为评估AI智能和创造力,人们分别提出“图灵测试”与“洛夫莱斯测试”。目前,AI仍需更加先进的技术和算法以及对人类思维和行为的深入理解,才能通过“洛夫莱斯测试”,达到“人类创造力”水平。

看点5AIGC的内容生产是基于模仿、模型和概念的创作,在“理解和表达情感”、“独创性和创新性”、“非结构性问题”等方面的问题难以回避。尽管AIGC有诸多“创造力”表现,但其本质仍是“模仿式创新”,本质上无法替代人类创造力。

影响:内容生态面趋势

看点6AIGC的发展深刻影响了内容生态:AI作为内容生产主体的地位崛起,其内容产出量质升级,实现增效降本;AIGC重塑人智协作的内容生成范式,开启人智交互的内容消费方式,由AI巨头引领的内容生态洗牌业已展开;AIGC将成为元宇宙媒介化社会到来的“加速器”。与此同时,AIGC带来的内容速食泛滥、内容消费浅薄化、就业替代及结构性剩余问题也需引起警惕,未来,人类应积极理性应对AIGC带来的变革与挑战。

下面附上PPT完整全文

]]>
Plex:2022年智能制造报告 //www.otias-ub.com/archives/1519057.html Mon, 14 Nov 2022 22:00:17 +0000 //www.otias-ub.com/?p=1519057 Plex发布了“2022年智能制造报告”,揭示了制造商在供应链危机中面临的持续挑战,以及重新控制关键商品、供应商寿命、技术创新和物流复杂性的努力。这项研究调查了321家全球制造商,了解他们的敏捷性、技术采用和改进流程的需求,以应对市场逆境。

智能制造普及速度加快50%

技术和自动化正在推动下一代制造业,智能制造的采用将在2022年继续加速。软件模块化允许增量技术的普及,制造商希望在面对逆境时变得更加敏捷使得软件模块化越来越具有吸引力。

  • 智能制造采用率同比增长50%。
  • 供应链规划在组织关键组件方面排名第二。
  • 进入壁垒更低,导致更高的采用水平和更有吸引力的投资回报率。

疫情暴露出缺乏完整的供应链规划解决方案

大流行暴露并加剧了制造商此前使用的权宜之计。历史上被衡量为“足够好”的系统、过程和供应链解决方案的脆弱本质显而易见。

  • 现代供应链管理解决方案需要考虑到当今的复杂性。
  • 制造业职位空缺超过80万个,需要一种新的方法来解决技术工人短缺及其对供应链的影响。
  • 降低风险需要建立在替代供应商、持续监控和警惕的网络安全的弹性的基础上。

曾经被过度炒作的技术正在解决今天的问题

曾经被视为过度炒作、不太可能做出有意义贡献的技术,现在对成功至关重要。云计算、工业加固设备和过程自动化正在帮助企业克服熟练工人短缺、供应链管理和风险降低等挑战。此外,机器学习/人工智能正在获得主流采用,以支持复杂的供应链规划。

  • 80%的企业软件使用目标旨在连接人、系统、机器和供应链。
  • 74%的受访者正在积极使用或计划使用机器学习/人工智能,特别是在管理供应链规划的复杂性方面。


]]>
Mobidev:光学字符识别技术报告 //www.otias-ub.com/archives/1447077.html Thu, 25 Aug 2022 20:00:12 +0000 //www.otias-ub.com/?p=1447077 什么是 OCR,它是如何工作的?

光学字符识别(OCR),也称为文本识别技术,即将任何类型的包含书面文本的图像转换为机器可读的文本数据。OCR可以快速自动地使文档数字化,而无需手动输入数据。这就是为什么OCR通常用于业务流程优化和自动化的原因。OCR的输出进一步用于电子文档编辑和压缩数据存储,还构成了认知计算、机器翻译和文本到语音技术的基础。

根据解决的任务有不同类型的 OCR:

  • 智能文字识别(IWR)用于识别不受约束的手写文字,而不是识别单个字符。
  • 智能字符识别(ICR)是一种更高级的OCR形式,它基于更新算法收集更多关于手写字符变化的数据。
  • 光学文字识别(OWR)逐字扫描文字。
  • 光学标记识别(OMR)用于识别人们在调查、测试等标记的信息。

传统的光学字符识别系统功能包括三个阶段:图像预处理、字符识别、后处理。

1、检查文档类型和图像预处理

文本识别的主要挑战是每个文档模板都有自己的一组实体、值和实体在文档中的位置。要使OCR软件准确运行,它必须能够识别不同类型的文档并在此基础上运行正确的预定义管道。

选择正确的管道后,图像进入预处理步骤。

2、字符识别

通过使用特征检测和模式识别算法,可以检测到单个字符。然后,将一组字符组合成单词和句子。使用模式识别或特征检测算法识别字符。

大多数情况下,具有特征检测的OCR程序使用基于机器学习或神经网络的分类器来处理字符。

3、后处理

一旦识别出一个符号,它就会被转换成一个代码,计算机系统可以使用该代码进行进一步处理。任何OCR和OCR相关技术/算法的输出都有很多噪音和误报。

根据统计数据,在这个阶段,系统会纠正噪音以提高OCR输出的质量。

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
IFR:2022年全球机器人和自动化新趋势分析 //www.otias-ub.com/archives/1397549.html Fri, 15 Apr 2022 18:00:48 +0000 //www.otias-ub.com/?p=1397549 全球工业机器人的运营存量创下约300万台的新纪录,平均每年增长13%(2015-2020年)。国际机器人联合会分析了塑造全球机器人和自动化的5大趋势:

1、新行业采用的机器人

一些新行业正在迅速采用机器人。消费者行为正在推动公司满足对产品和交付的个性化需求。

电子商务革命是由大流行驱动的,并将在2022年继续加速。现在全球安装了数千台机器人,而5年前这一行业还不存在。

2、机器人更易于使用

实施机器人可能是一项复杂的任务,但新一代机器人更易于使用。用户界面有一个明显的趋势,用简单的图标启动编程和机器人的手动引导。机器人公司和一些第三方供应商正在将硬件包与软件捆绑在一起以简化实施。

3、机器人和人类技能提升

除了内部培训工人外,外部教育途径可以加强员工学习计划。ABB、FANUC、KUKA 和 YASKAWA 等机器人制造商每年在30多个国家/地区的机器人课程中都有10,000-30,000人参与。

4、机器人保障生产

美国的一项特别具有启发性的统计数据显示了自动化可以帮助企业恢复营业:根据推进自动化协会(A3)的数据,2021年第三季度美国的机器人订单增长35%。2020年,超过一半的订单来自非汽车行业。

5、机器人支持数字自动化

在2022年及未来,数据将成为制造业的关键推动力。生产者将对从智能自动化流程收集的数据进行分析以做出更明智的决策。

199IT.com原创编译自:IFR 非授权请勿转载

]]>
PERKINS COIE LLP:2022年新兴科技趋势报告 //www.otias-ub.com/archives/1411076.html Mon, 11 Apr 2022 22:30:16 +0000 //www.otias-ub.com/?p=1411076 PERKINS COIE LLP发布了“2022年新兴科技趋势报告“,关注了人工智能、机器学习等新兴科技的最新发展趋势。

人工智能、机器学习和量子计算

赋能科技

深度学习

深度学习是使用深度神经网络架构的机器学习的一个子集。神经网络是互连的处理器,它们协同工作以解决问题。他们的灵感来自人脑中神经元的结构和功能。

部门和行业信号

美国航空航天局(NASA)“引爆点”计划使用人工智能驱动的分析

除其他目标外,NASA的“引爆点”计划旨在开发无需人工干预即可在月球表面导航的机器人。博世将通过“AIoT”支持该计划。AIoT是指人工智能和物联网(IoT)的结合。

云计算和分布式基础设施

云计算可以降低客户的成本,特别是当它们被应用于云服务提供商的物流流程以降低成本时,例如通过更好地利用电力和冷却系统。

云计算在各行各业都有广泛的应用。医疗保健专业人员使用该技术提供远程医疗解决方案、管理客户数据和使用诊断系统。金融机构已将其用于各种银行和金融服务产品,包括存储和访问客户账户数据等传统管理任务。

数字媒体和娱乐

赋能科技

数字媒体和娱乐的融合

不同形式的数字娱乐之间的壁垒正在瓦解。音乐会以多种形式举行,美术馆提供沉浸式体验,社交媒体平台界面变得越来越相似,而已经引入互动内容的流媒体服务也将很快扩展到沉浸式现实和游戏平台。

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
Ifr:日本占全球工业机器人供应量的45% //www.otias-ub.com/archives/1408645.html Thu, 31 Mar 2022 18:00:14 +0000 //www.otias-ub.com/?p=1408645 日本是世界第一大工业机器人制造商,占全球供应量的45%。近年来,该国机器人供应商的产能大幅提升:2020年出口比例升至78%,工业机器人出货量达136,069台。

国际机器人联合会(IFR)主席 Milton Guerry 表示:“过去五年,日本工业机器人出口的年均复合增长率为6%,与此同时,机器人的进口量一直极低。2020年,只有2%的日本装置是进口的。日本国内的机器人市场是仅次于中国的世界第二大市场。”

日本在中国的成功

日本机器人和自动化技术出口的36%运往中国。与其他国际机器人供应商一样,日本制造商也直接通过其在中国的工厂为中国市场服务。事实证明,这些位于全球最大工业机器人市场的工厂在2020年是一大优势,当时国际供应链因新冠大流行而中断。日本供应商在中国控制住疫情的繁荣中全面受益。

从新冠大流行中反弹

美国以22%的市场份额成为日本机器人和自动化技术出口的另一个主要市场。预计美国和中国这两个国家都将从新冠大流行中进一步反弹。

“日常生活中的机器人” , iREX Tokyo

国际机器人联合会秘书长 Susanne Bieller 博士表示:“今年在东京举办的 iREX 展览将重点关注通过机器人搭建更友好社会的方式。 iREX 将展示机器人如何塑造我们的日常生活,例如通过提高我们收到的产品的质量和可用性、减少碳排放、健康结果或对老年人的护理。”

]]>
美国商业专利数据库:2021年美国专利授权量下降7.5% //www.otias-ub.com/archives/1393572.html Tue, 01 Mar 2022 18:00:35 +0000 //www.otias-ub.com/?p=1393572 美国申请活动

2021年美国专利授权总量比2020年下降7.5%,是自2018年以来的最大跌幅。授权从2020年的352,000项下降到去年的327,329项。在此期间,专利申请也略有下降(-1%),从413,173项降至410,093项。

哪些国家获得的专利最多?

在获得授权最多的前10个国家中,美国公司在创新方面遥遥领先于国际同行,占美国专利商标局2021年所有专利授权的一半以上。其150,801项新授权比日本(47,105)、韩国(21,264)、中国(20,679) 和德国(14,663)的总和高出69%。

中国崛起,而其他国家则在衰落

在美国专利授权在全球企业下降8%-12%的一年,中国企业脱颖而出,增长10%,从2020年的18,792项增加到2021年的20,679项。目前共有四家中国公司进入美国专利50强,其中华为排名第5,京东方排名第11,Advanced New Technologies排名第43,OPPO排名第49。

区域趋势

与2020- 2021年美国专利活动的整体下降相一致,今年所有地区均出现负增长。

美国专利商标局授予的机器学习专利

对专利进行分类很复杂,这就是为什么使用合作专利分类(CPC) 来对以前不存在的方法、设备和过程进行分类的原因。

寻求专利保护的顶尖技术

与2020年的情况一样,2021年专利申请增长最快的是基于计算模型的计算机系统 G06N,与2020-21年相比增长了24%。

]]>
世界银行报告:融合技术革命和人力资本 //www.otias-ub.com/archives/1314384.html Sat, 27 Nov 2021 22:18:36 +0000 //www.otias-ub.com/?p=1314384 南亚的人力资本挑战是世界上最严重的挑战之一。其中包括儿童严重营养不良、早期学习严重不足、持续的传染病负担、妇女权利的丧失以及普遍存在的结构性不平等。

到2020年8月底,在大流行第一波开始的几个月内,该地区报告了440万例感染和75000例死亡。强调了直接和间接影响的规模,预防和卫生服务被转用于抗击新冠病毒,导致最弱势群体的健康状况恶化。

在教育方面,2020年学校普遍关闭,这一损失在新冠大流行之前已经处于较低水平。2020年,南亚在新冠大流行的最初几个月采取的封锁措施比欧洲或北美更为严格,影响了近4亿儿童,对女孩产生了不成比例的负面影响。初步估计,每个学生的收入损失为4400美元,相当于总收入的5%。

与此同时,这场大流行导致了惊人的失业和移民中断,这将带来长期的经济后果。南亚在大流行的第一阶段失去了约5000万个工作岗位。

南亚地区的当务之急是如何遏制人力资本受到的冲击并从疫情中迅速恢复,确保在实现更好、更公平的成果方面取得快速进展。

此外,在新冠大流行之前席卷全世界的深刻融合技术革命正在改变技术与人力资本之间的关系,并通过创造大量新机会来加速人力资本成果,同时产生新的、巨大的风险,使之更加复杂。这场融合革命的特点是虚拟、物理、生物和认知技术与大数据、机器学习和人工智能(AI)的力量相结合。

除了这些积极的发展,对人力资本赋权也有着巨大的影响,因为多种应用程序和设备正在收集个人和社会群体的数据,人工智能正在自动分析来自不同来源的数据。

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
亚马逊云科技机器学习扎根中国产业带:二三线城市独具创新潜力 //www.otias-ub.com/archives/1253193.html Fri, 28 May 2021 09:53:49 +0000 //www.otias-ub.com/?p=1253193 本文来源:199IT  作者: Ralf

作为人工智能的重要部分,机器学习已经走过几十年时间。伴随着大数据时代,数据量级的几何倍增加,让机器学习能有更多的用武之地并焕发新的生命力。

传统的认知上,机器学习为代表的人工智能技术,更多地存在于一线城市科技领域,特别是互联网巨头所盘踞的各个方向。资源丰富、业务量大、科研技术人员多、应用方向广等奠定了一线城市的独特优势。而二三线城市,基础资源薄弱和人才缺乏,限制了机器学习等顶尖技术的发展。

然而,在亚马逊云科技机器学习Amazon SageMaker落地中国区一周年之际,亚马逊云科技大中华区云服务产品管理总经理顾凡却给我们带来了一些不同的视角,颠覆了此前对二三线城市尖端技术发展的趋势预判。

首先从行业的角度,顾凡认为一线城市的确有其得天独厚的优势,一线城市有大量的互联网公司和软件公司。这些公司的业务特征决定了它们比其他行业不得不走得更快更早一点。“无论是看新闻、听音乐、看视频还是购物,它们哪种客户体验没有机器学习?“北上广深一线城市涵盖了整个移动互联网。就行业而言,一线城市机器学习的应用程度的确高于其他线城市。

但如果从产业的角度,结论就非常有意思。放眼全中国很多省份和地域都会有产业的特点,特别是传统工业制造业基本分布在二三线城市。怎么使用机器学习的方式去做智能的、基于人工智能的质量监测,提升良品率和效率,降低人的参与度,甚至在未来工业制造现代化的过程当中怎么做设备的预前故障检测等等。大量的需求在这些产业带中产生。当产业带中有企业通过机器学习解决了某个行业问题,行业都会复制,带动整个行业的技术创新,而这种创新会更多落在这些产业带所属的二三线城市。

顾凡认为,越是传统行业,杠杆效应越高,因为这些传统行业的基础面大影响面广,可能与每个居民都息息相关。

一个比较典型的例子是山东淄博市热力集团有限责任公司。在使用机器学习技术之前,热力行业普遍遇到了从传统供热到产业智能化方向的瓶颈。淄博热力集团选择与亚马逊云科技一道,解决行业难题,并形成了行业创新标准同时将这一创新能力向同行做技术输出。

淄博热力集团利用亚马逊云科技丰富的AL/ML技术和服务,快速构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。

淄博市热力集团通过机器学习技术,将自身多年的行业专家级经验转化为全国领先的技术创新,成为众多同行的“产业智能化“师傅。这凸显了顶尖技术与产业带结合迸发出的创新潜力。而这些业务与民众的生活更为相关,解决了很多的实际问题。

淄博市能源集团公司、淄博市热力集团有限责任公司党委书记、董事长汪德刚表示,“多年来,淄博热力利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助机器学习能力创新,建成了基于机器学习和大数据分析的智能供热平台,帮助我们从传统供热向产业智能化方向转型,在满足用户需求的同时实现节能减排,建立绿色能源生态系统。未来,希望我们能借助先进的云技术持续创新,推动国内热力行业的数字化、智能化转型。“

据亚马逊云科技提供的数据,目前,全球数以十万计的客户选择亚马逊云科技运行机器学习工作负载。在中国,亚马逊云科技机器学习服务得到医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业客户的青睐,益体康、晶泰科技、新世纪医疗、LEMONBOX、有道乐读、叽里呱啦、全美在线、首汽约车、德比软件、Momenta、图森未来、行者AI、天和荣、中科创达、华来科技、大宇无限、陕西科技大学、易点天下、淄博热力等一批企业和机构的广泛采用,在各行各业实现了丰富多样的人工智能应用创新。

顾凡认为,全中国很多省份蕴含着不同的产业带特性,包括很多自动驾驶的汽车研发基地、跨境电商基地等,这些散布在二三线城市区域存在很多创新场景。“谁先用机器学习解决了一个场景,别人就会关注这个场景,所以从行业维度来看其实是很明显的,可以看到有扩大的效应在形成。“

在Amazon SageMaker落地中国区一周年之际,亚马逊云科技宣布进一步落地多项人工智能与机器学习的新服务和功能。

其中技术部分包括顶层-人工智能服务、中间层-机器学习服务以及底层-框架和基础架构。

在人工智能(AI)服务层面,亚马逊云科技在北京区域推出了Amazon Personalize,客户无需具备机器学习专业知识,即可方便、快速地构建个性化推荐系统。

在中间层,将Amazon SageMaker在re:Invent 2020上亮相的包括Data Wranger、Feature Store、Pipelines等七项新功能在北京区域和宁夏区域上线,让客户可以更轻松地构建端到端的机器学习管道。

在算力层面,亚马逊云科技在北京区域和宁夏区域推出了Amazon EC2 Inf1实例,该实例基于亚马逊云科技自研机器学习推理芯片Amazon Inferentia,与当前成本最低的基于GPU的实例相比,可以提高多达30%的吞吐量,并使每次推断的成本最高降低45%。

2021年1月,工信部印发《工业互联网创新发展行动计划(2021-2023年)》,制定了一系列推动工业互联网新型基础设施建设量质并进的发展目标。3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“纲要”)全文正式发布。在共19篇65章的纲要全文中,“智能”“智慧”相关表述达57处。

作为拥有全球领先机器学习技术能力的云计算厂商,亚马逊云科技正在扎根中国产业带,让这些传统的产业带与顶尖技术结合,碰撞出更多的创新机遇。

]]>
欧盟统计局:2020年7%的欧盟企业使用人工智能应用 //www.otias-ub.com/archives/1233525.html Thu, 13 May 2021 18:00:37 +0000 //www.otias-ub.com/?p=1233525 2020年,7%的欧盟企业(至少有10名员工)使用人工智能应用程序。2%的企业在内部使用机器学习分析大数据,1%的企业在内部借助自然语言处理、自然语言生成或语音识别分析大数据。2%的企业使用聊天服务,聊天机器人或虚拟代理生成对客户的自然语言回复。还有2%的企业使用具有一定自主性的服务机器人,例如进行清洁、危险或重复性任务,清理有毒物品、在仓库分拣物品、帮助顾客购物或付款等。

2020年在欧盟成员国中,爱尔兰使用四种人工智能应用的企业所占比例最高(23%)。其他广泛采用人工智能技术的国家包括马耳他(19%)、芬兰(12%)和丹麦(11%)。

相比之下,其他成员国使用这四种人工智能应用的企业不到10%。拉脱维亚(2%)、斯洛文尼亚、匈牙利、塞浦路斯(各占3%)和波兰(4%)的份额最低。

]]>
智能财务运营:CFO最强大的资产 //www.otias-ub.com/archives/1176058.html Sat, 16 Jan 2021 21:41:15 +0000 //www.otias-ub.com/?p=1176058 首席财务官(CFO)继续应对COVID-19带来的持续业务中断,埃森哲的一份新报告发现,财务主管需要更多实时数据,以从衡量转向创造价值。

埃森哲的新报告对年收入至少10亿美元的公司的450位首席财务官和其他财务负责人进行了调查。一个关键发现是,尽管几乎所有的受访者(99%)都认为使用实时数据对于应对诸如COVID-19或经济衰退的威胁等至关重要,但只有16%的受访者实现了所需的数据规模。

当被问及2021年其业务最关注的领域时,首席财务官最常提到利率上升(49%)、大流行中断(47%)、经济衰退(47%)和招聘并保留合适的人才(42%)。鉴于这些挑战的复杂性,大多数人(68%)认为,实时财务模型-利用AI、机器学习算法和实时、多样化的数据集-对于实现更好的业务决策至关重要。

即使在大流行期间,受访者也表示他们今年平均将33%的预算用于建立实时运营和流程。美国大型公司(即年收入至少100亿美元的公司)似乎更加致力于这种能力,将其至少50%的预算投资于此领域。大约2/5的受访者(44%)计划在未来三年内实时实现几乎所有财务流程和运营。

尽管优势众所周知,但财务主管在实施这些流程时也面临各种挑战。例如,实时情景规划在2021年CFO优先事项中排名最高(34%),但58%的受访者担心要确定或雇用合适的人才来实施此功能。虽然大约1/4的受访者(24%)将实时洞察力视为公司财务职能的最高优先事项,但大约2/5的人(43%)认为技术是实施的最主要障碍。


199IT.com原创编译自:埃森哲 非授权请勿转载

]]>
德勤咨询:2021年科技趋势报告 //www.otias-ub.com/archives/1179474.html Fri, 08 Jan 2021 22:00:37 +0000 //www.otias-ub.com/?p=1179474 德勤发布了新报告“2021年科技趋势”。

战略,精心设计。当今的技术为某些组织带来了新的竞争优势,并为其他组织带来了生存威胁。结果,公司战略和技术战略之间的区别变得模糊了。精明的企业战略家们正在超越其组织当前的技术能力和竞争格局,考虑技术的更广泛的可能性。但是,复杂的不确定性和可能性范围是人脑无法自行处理的。这就是为什么战略家转向拥有先进分析、自动化和AI的战略技术平台的原因。

核心复兴。对旧企业系统进行现代化改造并将其迁移到云可以帮助释放企业的数字潜力。一些开拓性公司开始使用巧妙的外包安排来重新设计传统业务案例以实现核心现代化。在充满不确定性的商业环境中,从传统核心资产中获取更多价值的创新方法可能很快会成为每位CIO数字化转型手册的标准组成部分。

供应链。长期以来,供应链一直被认为是做生意的成本,它正从后台转移到客户细分和产品差异化的增值前线。面向未来的制造商、零售商、分销商等正在探索将供应链成本中心转变为以客户为中心的价值驱动力的方法。

MLOps:工业化AI。先进的机器学习模型可帮助公司有效地发现模式,揭示异常,做出预测和决策并生成见解,并且正日益成为企业绩效的关键驱动力。

机器数据革命。机器学习有望全面改革企业运营和决策,越来越多的AI先驱者意识到遗留数据模型和基础架构可能成为机器学习成功的障碍。因此,他们正在部署新技术和方法。

零信任:永远不要信任,永远需要验证。复杂的网络攻击和不断变化的企业环境破坏了传统的网络安全方法。零信任源自以下概念:现代企业环境必须采用不同的安全方法,不再存在定义的范围,每个用户、工作负载、设备和网络都需要验证。

重启数字工作场所。通过更加有意地拥抱数字化工作场所的积极方面,公司能够克服数字工作场所的缺陷和歧义。这可以帮助企业优化个人和团队绩效,并通过个性化建议来定制员工体验,从而使远程工作更适应未来的企业运营。

量身定制。当我们回头看时,2020年将是大多数人适应数字交互以进行日常生活的转折点,无论是在家工作、在线学习,还是订购食品杂货。然而,数字互动的盛行使我们更渴望亲身互动。在展望未来时,线上和线下互动不再是单独的体验。

DEI技术:公平工具。许多企业都将多样性、公平性和包容性作为当务之急。越来越多的企业采用整体的、全组织范围的员工战略来解决偏见和不公平现象,以提高企业和员工的绩效。

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
AWS发布五大用于工业领域的机器学习服务 //www.otias-ub.com/archives/1168796.html Wed, 09 Dec 2020 06:30:36 +0000 //www.otias-ub.com/?p=1168796
  • Amazon Monitron提供包含传感器、网关和机器学习服务的端到端机器监控解决方案,以检测可能需要维护的异常设备状况
  • Amazon Lookout for Equipment为拥有设备传感器的客户提供了使用AWS机器学习模型来检测异常设备行为并进行预测性维护的能力
  • AWS Panorama Appliance帮助已在工业设施中装配摄像机的客户使用计算机视觉来改善质量控制和工作场所安全
  • AWS Panorama软件开发套件(SDK)允许工业相机制造商在新相机中嵌入计算机视觉功能
  • Amazon Lookout for Vision在图像和视频流上使用AWS训练的计算机视觉模型,以发现产品或流程中的异常和缺陷
  • 使用全新的AWS工业机器学习服务的客户和合作伙伴包括Axis、凌华科技、BP、德勤、Fender芬达、GE 医疗和西门子交通

北京-2020年12月9日,今天,在亚马逊云服务(AWS)举办的年度盛会——AWS re:Invent上,AWS宣布了Amazon MonitronAmazon Lookout for EquipmentAWS Panorama ApplianceAWS Panorama SDKAmazon Lookout for Vision。这五项全新的机器学习服务共同帮助工业和制造业客户在其生产过程中嵌入智能能力,以提高运营效率,改善质量控制、信息安全和工作场所安全。这些服务代表了现有最全面的从云端到边缘的工业机器学习服务套件,通过结合先进的机器学习、传感器分析和计算机视觉功能,解决工业客户面临的常见技术挑战。实际上,数十万客户正在使用AWS云服务进行机器学习工作,各个规模、各行各业的客户都在使用AWS服务将机器学习作为其业务战略的核心。要了解有关全新AWS用于工业领域的机器学习服务的更多信息,请访问https://aws.amazon.com/industrial/

企业越来越多地希望将机器学习功能添加到工业环境中,例如制造设施、配送中心、食品加工厂等。对于这些客户来说,数据已成为将复杂工业系统结合在一起的重要媒介。工业系统中通常具有许多相互依存的流程,这些流程容错能力低,甚至很小的问题也会带来重大后果。许多客户通过分析其设施中运行设备的数据来应对这一挑战,例如,许多客户利用AWS IoT SiteWise等服务从工业设备收集数据并生成实时性能指标。随着客户开始使用云收集和分析工业数据,他们还希望采用机器学习技术来解读数据,进一步提高运营效率。在某些情况下,客户希望使用机器学习来帮助他们实现预测性维护,从而降低成本并提高运营效率。同时,在非联网或对延迟敏感的环境中运行的客户则希望通过在边缘使用计算机视觉来发现产品缺陷并提高工作场所安全性。伴随这些不断变化的需求和机遇,工业企业要求AWS帮助他们利用云、工业边缘和机器学习,以从其设备生成的大量数据中获得更多价值。

Amazon MonitronAmazon Lookout for Equipment通过机器学习支持预测性维护

 今天,工业和制造企业面临的主要挑战是设备的持续维护。过去大多数设备维护都是被动的(在机器发生故障之后)或预防性的(定期进行以确保机器不会发生故障)。被动维护可能会损失大量成本并带来长时间停机,而预防性维护若维护过度则成本过高,若维护不够频繁则无法防止故障。实际上,预测性维护(能够预测设备何时可能需要维护的能力)是一种更有前景的解决方案。但是,为了实现预测性维护,企业在过去需要雇佣熟练的技术人员和数据科学家从头构建复杂的解决方案,同时需要针对用例识别和购买正确类型的传感器,并将它们与IoT网关(一种聚合和传输数据的设备)连接在一起。然后,公司必须测试监测系统,并将数据传输到本地或云上进行处理。只有这样,数据科学家才能构建机器学习模型来分析数据模式和异常情况,或者在检测到异常时创建警报系统。一些企业已经为在设备和必要的基础设施上安装传感器用于数据连接、存储、分析和警报方面进行了大量投资,然而,即使这些企业也通常仅停留在使用初级数据分析和建模方法的阶段,与高级机器学习模型相比,这些方法昂贵且通常无法有效地检测异常情况。大部分企业依然缺乏专业知识和人员来构建和完善机器学习模型,无法进行高度准确的预测性维护。这些都导致了很少有企业能够成功实施预测性维护,即使少数做到这一点的企业也希望让这些投资进一步发挥作用,同时减轻维护解决方案的负担。在这些问题上,全新的AWS机器学习服务可以提供众多帮助:

  • 对于未建立传感器网络的客户,Amazon Monitron提供由传感器、网关和机器学习服务组成的端到端机器监控系统,以检测异常并预测何时需要维护工业设备。Amazon Monitron帮助客户免去了从头开始构建先进的、由机器学习驱动的预测性维护系统的高成本需求和复杂性,使他们能够专注于其核心制造、供应链和运营功能。Amazon Monitron根据振动或温度的异常波动来检测机器是否正常运行,并在可能出现故障时通知客户检查机器以确定是否需要预测性维护。这一端到端的系统提供了用于捕获振动和温度数据的IoT传感器、用于将数据聚合和传输到AWS的网关、以及用于检测异常设备模式并在数分钟内提供结果的机器学习云服务,而无需客户具备任何机器学习或云经验。借助Amazon Monitron,机器维护人员无需任何开发工作或专业培训就可以在数小时内开始跟踪机器的运行状况。Amazon Monitron可在轴承、电机、泵、传送带各种工业和制造领域的旋转设备上使用,其典型应用场景包括数据中心冷却风扇或水泵等关键机器的监测,或者大量安装在具有生产和运输系统的制造工厂中。Amazon Monitron还提供一个移动应用程序,供客户的现场维护技术人员实时监控设备行为。技术人员可以通过这个移动应用程序收到不同机器上任何异常设备状况的警报,检查机器的运行状况,并决定是否需要安排维护。为了提高系统的准确性,技术人员还可以在移动应用程序中输入有关警报准确性的反馈,帮助进一步改善Amazon Monitron。Amazon Monitron已经正式推出。要了解有关Amazon Monitron的更多信息,请访问https://aws.amazon.com/monitron
  • 对于已经拥有传感器但不希望自己构建机器学习模型的客户,Amazon Lookout for Equipment让客户可以将传感器数据发送到AWS,由AWS为其构建模型并返回预测结果,从而检测异常设备行为。首先,客户将其传感器数据上传到Amazon Simple Storage Service (S3),并将S3位置提供给Amazon Lookout for Equipment。Amazon Lookout for Equipment也可以从AWS IoT SiteWise提取数据,并与OSIsoft等其他流行的机器操作系统无缝协作。 Amazon Lookout for Equipment分析数据,评估正常或健康的模式,再利用从所有训练数据中得到的洞察来构建为客户环境定制的模型。然后,Amazon Lookout for Equipment可以使用机器学习模型来分析传入的传感器数据并识别机器故障的预警信号。这也就使得客户可以进行预测性维护,从而通过防止工业系统生产线崩溃来节省成本并提高生产率。 Amazon Lookout for Equipment帮助客户从其现有传感器中获得更多价值,使得客户能够及时做出从根本上改善整个工业流程的决策。要了解有关Amazon Lookout for Equipment的更多信息,请访问https://aws.amazon.com/lookout-for-equipment

AWS Panorama通过计算机视觉改善工业运营和工作场所安全

许多工业和制造业客户希望在其设施和设备的实时视频中使用计算机视觉技术自动执行监测或视觉检查任务,并实时做出决策。例如,客户通常需要检查一些高速运转的流程(例如精细铣削或激光工具)以确定是否需要进行调整,或者监视工地上和工厂的活动以确保操作合规(例如,确保行人和叉车留在指定的工作区域内),或评估其设施内的工人安全(例如,保持适当的人员距离或使用PPE)。但是,当下普遍使用的监测手段是手动的,容易出错的,并且难以扩展。客户可以在云中构建计算机视觉模型来监视和分析他们的实时视频,但是工业设施和流程通常位于偏远和孤立的位置,网路连接很慢、昂贵或完全不存在。尤其对于那些涉及零件或安全监控视频审查等人工审核的工业流程,在云中构建计算机视觉模型更为困难。例如,如果某个高吞吐量的生产线上出现质量问题,客户希望立即得到预警,因为问题存在时间越长,解决问题的成本越高。这种类型的监控视频可以通过计算机视觉技术实现在云中自动处理,但是这些视频一般带宽高并且上载速度慢。因此,客户只能实时进行视频监控,但这一方式操作难度高、易出错并且成本高。有些客户希望使用具有足够处理能力的智能相机来运行实时监控模型,却很难达到高准确性、低延迟的性能。大多数客户最终会运行一些简单的模型,却无法编程为可以集成到工业机器中的自定义代码。针对这些问题,AWS现在可以提供以下帮助:

  • AWS Panorama Appliance提供了一种新的硬件设备,使组织可以将计算机视觉添加到客户可能已经部署在本地的摄像机中。客户首先将AWS Panorama Appliance连接到他们的网络,然后这一设备会自动识别摄像头数据流并开始与现有的工业摄像头进行交互。AWS Panorama Appliance可集成于那些用于构建自定义机器学习模型或获取视频以进行更精细分析的AWS机器学习服务和IoT服务中。AWS Panorama Appliance将AWS机器学习能力扩展到边缘,以帮助客户在没有网络连接的情况下在本地进行预测。每个AWS Panorama Appliance都可在多个摄像头数据流上并行运行计算机视觉模型,从而使诸如质量控制、零件识别和工作场所安全的用例成为可能。AWS Panorama Appliance还可与适用于零售、制造、建筑和其他行业的AWS和第三方经过预先培训的计算机视觉模型一起使用。此外,客户使用Amazon SageMaker自主开发的计算机视觉模型也可以部署在AWS Panorama Appliance上。
  • AWS Panorama软件开发套件(SDK帮助硬件供应商开发可在边缘有效运行计算机视觉模型的新型摄像头。使用AWS Panorama SDK构建的摄像头可在多种用例中运行计算机视觉模型,例如检测快速移动的传送带上的损坏部件或定位那些脱离指定工作区域的器械等。这些相机可以使用英伟达和安霸旗下用于计算机视觉的芯片。通过使用AWS Panorama SDK,制造商可以开发自带计算机视觉模型的相机,从而可以处理更高分辨率的高质量视频以发现问题。他们还可以在低成本设备上构建更复杂的模型,这些设备可以通过以太网供电并可以放置在站点周围。客户可在Amazon SageMaker中训练模型,并一键将其部署到使用AWS Panorama SDK构建的摄像机上。客户还可以将Lambda功能添加到使用AWS Panorama SDK构建的摄像头中,以通过文本或电子邮件提醒潜在问题。AWS还提供用于PPE检测和保持人员距离等任务的预构建模型,并且可以在几分钟内部署这些模型,而无需进行任何机器学习工作或特殊优化。

要了解更多关于AWS Panorama或其支持供应商和合作伙伴的信息,可访问https:// aws.amazon.com/panorama。

Amazon Lookout for Vision可以低成本自动、快速、准确地对图像和视频进行视觉异常检测

 AWS客户非常希望将计算机视觉部署到摄像头中以用于质量控制。工业企业必须保持不断的努力进行质量控制。仅在制造业中,由于忽略某些细微错误而导致的生产线停产每年导致数百万美元的成本超支和收入损失。工业流程中的外观检查通常需要人工操作,这可能非常乏味且标准不一。计算机视觉技术可以保证持续识别外观缺陷所需的速度和准确性,但实施过程却可能非常复杂,并需要数据科学家团队来构建、部署和管理机器学习模型。由于这些局限,由机器学习支持的视觉异常系统对绝大多数企业而言仍然遥不可及。现在, AWS可在以下领域帮助到这些企业:

  • Amazon Lookout for Vision为客户提供了一种高精度、低成本的异常检测解决方案,可以通过机器学习技术每小时处理数千张图像以发现缺陷和异常。客户将摄像头图像批量或实时发送到Amazon Lookout for Vision以识别异常,例如机器部件的裂纹、面板上的凹痕、不规则形状或产品上的颜色错误等。然后,Amazon Lookout for Vision报告与基线不同的图像,以便客户采取适当的措施。Amazon Lookout for Vision有强大的技术能力可以处理因工作环境变化而引起的相机角度、方位和照明方面的差异。客户可以通过至少提供30张“良好”状态的图像建立基线,准确、一致地评估机械零件或制成品。Amazon Lookout for Vision也可以在Amazon Panorama设备上运行。即日起客户可在AWS中运行Amazon Lookout for Vision。从明年开始,客户还将可以在AWS Panorama Appliances和其他AWS Panorama设备上运行Amazon Lookout for Vision,从而可以在网络连接受限或无网络连接的环境中使用Amazon Lookout for Vision。要了解有关Amazon Lookout for Vision的更多信息,请访问https://aws.amazon.com/lookout-for-vision

“工业和制造业客户需要持续应对来自股东、客户、政府和竞争对手的压力,要求他们降低成本,提高质量并保持合规性。这些组织希望利用云和机器学习来实现流程自动化并增强整个运营流程中的人员能力,但是构建这些系统可能出错率高、复杂、耗时且昂贵,”负责亚马逊机器学习的AWS副总裁Swami Sivasubramanian说,“我们很高兴为客户带来五项针对工业用途的全新机器学习服务。这些服务易于安装、部署、快速启动和运行,并将云和边缘相连,将助力工业客户打造未来智慧工厂。”

芬达乐器公司(Fender Musical Instruments Corporation)是吉他、贝斯、放大器和相关设备的全球领先制造商和标志性品牌。芬达基础设施全球总监Bill Holmes表示,“在过去的一年中,我们与AWS共同针对设备状态检查进行了很多努力,这是对成功的制造业务而言非常关键却容易被忽略的部分。对于全球制造商而言,维持设备正常运行时间是在全球市场上保持竞争力的唯一途径。由于设备故障的紧急性,计划外的停机会给生产和劳动力造成巨大的损失。Amazon Monitron让大型工业制造商以及小型家族企业都能具备设备故障预测的能力,有机会抢先安排设备维修。”

斗山工程机械是全球领先的重型设备和发动机制造商。斗山工程机械战略副总裁Jaeyeon Cho表示,“AI在推进斗山下一代设备开发方面至关重要,因此我们正与AWS合作开发可利用自动化和可扩展机器学习的用例。很高兴继续与AWS合作,在我们的下一代IoT平台中利用Amazon Lookout for Equipment。”

Amazon.com Middle Mile Production Technology副总裁Steve Armato表示,“每个月有数百万辆卡车进入亚马逊工厂,因此使用自动化拖车装卸和停车的技术非常重要。Amazon’s Middle Mile Products & Technology (MMPT) 已开始使用AWS Panorama来识别车牌,自动加快驾驶员的出入手续,从而使这些车辆可以安全、快速地进入亚马逊站点,确保为客户提供更快的配送速度。”

BP是一家全球性能源企业,为客户提供运输用燃料,热能和光能,润滑油以及用于制造油漆、服装、包装物等日常用品的石化产品。BP在全球拥有18,000个服务站和74,000多名员工。BP美国首席技术官Grant Matthews说:“我们位于bpx的工程团队正与AWS紧密合作,以构建一个物联网和云平台,助力BP持续提高运营效率。作为这项工作的一部分,我们也在探索通过计算机视觉辅助提高安全性和工作人员安全。我们希望利用计算机视觉实现卡车自动化进出工厂,确认它们已完成正确的订单。此外,我们还在监控人员距离、设置动态禁区和检测石油泄漏等方面看到了通过计算机视觉辅助保护工人安全的可能性。AWS Panorama创新地实现了在单一硬件平台上以直观的用户体验提供所有这些解决方案。我们的团队非常高兴与AWS一起使用这项新技术,并期望解决许多新的用例。”

西门子交通为市内、城市间运输和货运提供智能高效的移动解决方案。“在过去的160年中,西门子交通在无缝、可持续和安全的运输解决方案领域持续处于领导地位。西门子ITS数字实验室负责将最新的数字技术带入交通行业,并处于向公共机构提供数据分析和AI解决方案的独特位置。”西门子交通ITS数字实验室创新经理Laura Sanchez表示,“随着城市面临新的挑战,市政部门希望西门子交通帮助他们进行创新。城市想了解如何有效地管理资产并改善拥堵和直接交通。我们希望使用AWS Panorama将计算机视觉带入现有的安全摄像头中,以监控交通并智能分配路边空间,帮助城市优化停车和交通,改善居民的生活质量。”

GE 医疗是全球领先的医疗技术和数字解决方案的创新者,致力于开发、制造和分销诊断成像剂、放射性药物、CT和MRI机器等医疗诊断设备、以及由其Edison数字医疗智能平台支持的智能设备。 “今天,我们通过人工检验医疗设备的质量。为了提升我们的品牌并为医疗保健专业人员提供值得信任的一流产品,我们很高兴能够通过Amazon Lookout for Vision探索以编程方式提高GE医疗日本工厂产品缺陷检测的速度、一致性和准确性的可能性,短期内还可能应用于全球其他区域的工厂中。”GE医疗日本工厂经理、产线运营官和总经理Kozaburo Fujimoto说。

]]>
亚马逊云服务(AWS)加快云产品和服务落地中国的速度 //www.otias-ub.com/archives/1096162.html Tue, 04 Aug 2020 14:08:52 +0000 //www.otias-ub.com/?p=1096162 日前,AWS大中华区云服务产品管理总经理顾凡接受记者采访表示,伴随着中国云计算市场的高速发展,AWS正在加速新服务和功能落地中国区域。仅今年上半年,亚马逊就在中国区域落地了150多项AWS云服务和功能。

(图:AWS大中华区云服务产品管理总经理顾凡 来源:199IT)

中国信息通信研究院7月29日发布的《云计算发展白皮书》显示,从2017到2019年,中国公有云的市场规模从264.8亿元增长689.3亿元,2018年、2019年的增速分别达到65.2%、57.6%。预计到2023年,市场规模将达到2307.4亿元,是2019年的3倍多。

2020年7月31日,亚马逊发布2020年第二季度财报,其中AWS季度收入为108亿美元。在中国,面对未来的良好增长前景,AWS也充满了期待和信心。

顾凡说,AWS要为中国企业和机构的创新赋能,非常重要的一点是要加快AWS云服务产品和功能在中国落地。

AWS云服务落地中国有两种情况:大部分服务和功能只需要做一些简单的本地化开发就可以在中国区域部署落地,有一些服务需要做更多的工作。但无论哪一种,AWS都会根据中国客户的需求,尽快、尽早地将全球的服务和功能落地到中国区域。

中国企业数据量的爆炸式增长,对大数据处理和分析有着非常迫切的需求。针对这些企业客户的需求,今年上半年AWS在中国区域就推出和部署了交互式查询服务Amazon Athena,数据提取、转换和加载 (ETL) 服务AWS Glue,以及流式数据处理服务Amazon MSK。

在容器领域,AWS在中国区域落地部署了Amazon EKS,让管理、运维K8S容器变得简单方便。

7月刚刚发布的AWS Cost Management,是一组帮助客户省钱、精细化管理云资源的服务。让客户少花钱,这种事情在IT界可以说是前所未有的。AWS还经常主动降价,截至2020年6月23日,AWS已经公布了自2006年上线以来的第85次降价。

在今年新落地中国区域的云服务和产品中,特别值得一提的是机器学习服务Amazon SageMaker。

人工智能现在是非常热门的话题。亚马逊认为,人工智能的本质和核心是机器学习。人工智能、机器学习的概念早在50年前就出现了。之所以现在才热起来,是因为过去机器学习的门槛比较高,只有少数科技巨头和硬核的研究机构才有条件进行研究。一方面是机器学习需要的庞大算力不容易获得;另一方面,机器学习模型的训练过程特别复杂,要搭建训练环境、准备数据、寻找合适的算法、进行大量的运算、优化算法。

现在有了云计算,算力不再是问题。SageMaker则可以降低机器学习模型训练过程的复杂性。SageMaker是一项完全托管的服务,它可以化繁为简,帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习模型,大大降低了模型构建和训练的难度。

SageMaker是一个非常开放的产品,无论对于各类机器学习框架和算法的支持,模块化的设计方式,还是对于生态合作伙伴解决方案的支持,能够真正让各种类型、各种需求的客户都很方便地应用这个服务。此外,SageMaker Studio还是业界第一个面向机器学习的集成开发环境。

目前,Amazon SageMaker成为了全球上万家客户的选择。Gartner在2020年2月发布的《云上AI开发者服务魔力象限》,在技术执行力和对技术未来发展愿景的完整规划方面将AWS排名在领导者象限最高位置。

SageMaker一经推出就受到了中国客户和合作伙伴的欢迎。大宇无限、虎牙直播、嘉谊互娱、华来科技等公司已经在使用SageMaker解决机器学习技术的需求。中科创达、东软、伊克罗德分别将SageMaker运用到产品质检、企业安全网关、标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等多种解决方案和应用场景之中。

AWS在加快产品落地、为中国的企业创新赋能的同时,也担当了中国市场全球化桥梁的角色。

一方面,很多知名的中国公司,例如像美的集团、猎豹移动、小米、OPPO、虎牙直播、海信、德比软件、安克创新、TP-Link、一加、币安、晶泰科技、华大基因、传音控股、网易游戏、我爱我家、携程旅行、迈瑞医疗等等,都在利用AWS的全球基础设施和云服务。得益于AWS全球24大区域、77个可用区的广泛布局,这些公司不需要费力地,去异国他乡构建IT设施,在中国就可以做好海外业务。AWS还利用亚马逊的全球资源,例如全球开店、Prime会员、物流配送体系、生态合作伙伴资源等等,为他们提供销售、市场、产品交付、融资等帮助。

另一方面,还有很多跨国公司,例如博西家电、英孚教育、玫琳凯、太古可口可乐、先锋电子、英伟达、赛默飞世尔、西门子、飞利浦等等,他们在海外就使用AWS。进入中国后,他们可以使用AWS中国区域,快速部署应用,在运营上享受一致的体验。

顾凡说,在海外区域使用AWS的客户,也是AWS新服务落地中国区域的向导,他们给AWS提供反馈,希望哪些服务尽快落地中国区域。根据客户反馈制定服务落地中国区域的优先级,让AWS赋能中国客户的工作事半功倍,更加高效。

]]>
Gartner最新报告建议企业客户借鉴亚马逊的数字化模式 //www.otias-ub.com/archives/1096110.html Tue, 04 Aug 2020 14:02:54 +0000 //www.otias-ub.com/?p=1096110 日前,亚马逊发布2020年第二季度财报,季度收入889亿美元,同比增长40%。在当前的全球经济形势下,显得尤其亮眼。亚马逊这些年的成功,得益于该公司在业务上不断创新。以亚马逊云服务(AWS)为例,这项开始于2006年的业务,在2020年第二季度的收入达到108亿美元,过去12个月的收入超过400亿美元。这在企业IT市场已经是相当可观的规模。

知名研究和咨询机构Gartner最近发布了一个针对AWS的供应商评估报告。这一名为Gartner Vendor Rating 的评估报告,是Gartner面向企业用户所做的IT采购决策参考指南。它通过对一家IT供应商进行全面的评估,告诉最终用户,这家供应商作为战略性的供应商合作伙伴,在各方面技术实力如何,发展走势和长期定位怎样,从而帮助用户管控供应商风险,为用户的关键采购、投资及续约决策提供参考。Gartner在这项评估报告中,对AWS给予了有史以来的最高评分:28分(满分为30分)。记者了解到,Gartner还没有给过其它IT供应商27分以上的评分。

Gartner在评估报告中指出,亚马逊利用科技力量颠覆传统市场,缔造独树一帜的客户体验。而亚马逊云服务(AWS),充分展现了其颠覆性技术在市场上的强大影响力。Gartner建议企业应该充分借鉴亚马逊的数字化模式,将其作为技术驱动力的杰出范例,在业务中融入数字流程,模仿亚马逊,在寻找新市场机会和响应竞争威胁方面打造敏捷性。

这一评估报告可以Gartner官网下载,网址:https://www.gartner.com/doc/reprints?id=1-1ZFLWYKW&ct=200709&st=sb

借鉴亚马逊的数字化模式,AWS是最佳的入口。AWS大中华区云服务产品管理总经理顾凡告诉记者:“AWS为亚马逊的各种创新提供了技术支撑,其中云原生架构是关键。”

云原生架构有三大特征:微服务、自服务和开发运维一体化。微服务实现了应用模块化、应用模块之间接口的标准化,让应用更敏捷灵活;自服务可以让开发团队快速获得资源,不需要冗长的流程;开发运维一体化,可以让应用快速迭代和升级。AWS为客户的创新赋能,最重要的是提供广泛、全面、深入、功能强大的云服务。客户使用这些云服务,就能够构建云原生架构,实现敏捷创新,缩短新应用上线时间,加快应用升级迭代速度。通过丰富的云服务,客户可以借力最新技术,而不需要自己造轮子。

目前AWS提供的云服务超过175项,涵盖计算、存储、数据库、网络、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等诸多方面。其中很多服务是AWS在云上首创的,有些至今仍然是非常独特的。 例如,无服务器服务、云上庄闲网络娱乐平台进入 服务、云上卫星地面站数据服务、云上机器学习平台服务等等。

AWS Outposts、AWS Local Zone、AWS Wavelength、AWS Ground Station、Amazon Bracket是AWS在 2019 re: Invent全球大会上推出的创新服务,分别实现的功能包括:帮助用户从本地的数据中心无缝衔接公有云,在特定城市建设本地可用区让当地终端用户缩短延迟,5G网络边缘的电信运营商数据中心部署云服务让终端用户缩短延迟,让客户不需要高投入就可以使用卫星通信处理数据,让一般的企业也可以探索量子计算的用途和用法,等等。AWS可谓上天入地,竭尽云计算的各种可能。

AWS Snowcone是2020年6月推出的一个云服务,它是一个边缘计算设备,长宽相当于大半张A4纸,比最新iPad七代还小一点点。在AWS Snowcone上可以运行使用 AWS IoT Greengrass 或 Amazon EC2 实例,运行边缘计算应用,也可以用来收集、处理数据,将数据传输到AWS云。

AWS这些服务的推出,都引来业界人士一片叫好声。

在不断推出新服务的同时,现有的服务也会不断迭代新的功能。以最经典、最早的Amazon EC2弹性计算云(Elastic Compute Cloud)服务为例,AWS一直不断地更新升级底层物理服务器的体系架构、硬件配置、虚拟化软件,不断增加新的实例类型。

截止2019年12月,亚马逊提供超过270种实例类型,是两年前的4倍,这在行业中遥遥领先。所谓实例,通俗地说就是云主机。AWS通过创新的Nitro架构,推出新一代C5实例类型,让性价比提高了49%。通过自研ARM处理器推出新实例,基于AWS Graviton 2第二代自研芯片的第六代C6实例,比第五代的性价比再提高40%。此外,在芯片方面,AWS已经集齐了英特尔、AMD、英伟达、赛灵思等不同芯片厂商的处理器。各个芯片厂商发布最新的产品,往往意味着更高的性能,更高的效率,更高的性价比。芯片厂商只要有新处理器上市,AWS几乎都能第一时间放在云上供客户使用。

通过AWS提供的云服务,客户可以打造云原生的架构,提高敏捷性,快速试错,快速迭代,加速创新,缩短产品上市时间;同时还能降低一切技术门槛和资金门槛,减少资本开支,降低IT运维成本。

 

]]>
阿里云Quick BI和微软云Power BI实测比对 //www.otias-ub.com/archives/1090377.html Sun, 26 Jul 2020 05:15:04 +0000 //www.otias-ub.com/?p=1090377 本文作者:大涛学长

摘要:

Quick BI和Power BI分别是阿里云和微软云上的官方BI产品,两款产品都是比较好的自助式商业智能软件,都具备云BI的优势,既能够像SaaS运行在阿里云或者Azure云上,又能快速部署到本地的服务器中运行。但是,两款产品还是有非常大的区别的;比如Power BI微软主打的是组合策略,需要Power BI Desktop、Power Query、Excel等多个产品的各自使用;Quick BI崇尚“高效数据分析与展现”,是基于网页版能实现数据建模、可视化报表以及类Excel分析、数据门户分享等一站式数据分析链路。那么两款产品比较起来到底哪个更好用?下面我们对这两款商业智能软件做个对比评测。

一、Quick BI对比Power BI:数据源连接

从数据引擎的对接能力来看,两者差不多,比如Power BI支持连接文件、Azure、联机服务、SQL Server、MySQL、Oracle等多种关系数据库;Quick BI 支持连接文件、阿里云多种数据库、SQL Server等多种数据库。

不同点在于一是两个产品集中在于对各自的云数据库的支持,二是Quick BI在支持常见数据库的基础上,还支持跨数据源查询,以及对常见数据库支持上传本地文件。

Quick BI如下所示:

Power BI如下所示:

二、Quick BI对比Power BI:数据处理和建模

Quick BI支持自助式建模,和SQL建模两种方式,通过网页版连接到数据库,映射成逻辑表,可以直接对大数据量的数据表做数据集管理和处理,并支持对特定数据库的加速;Quick BI图示如下:

Power BI网页版无数据建模功能,需要安装Power BI Desktop版连接本地数据库,在本机上对数据表的行列进行灵活的处理和相关的数据集操作,但其中对于数据量会有限制和要求,而且Desktop版仅支持Windows系统,不支持Mac电脑;Power BI desktop版实例如下:

三、Quick BI对比Power BI:可视化展现和报表制作

Quick BI网页版支持可视化数据报表搭建和电子表格的两种数据分析分析方式,其中可视化报表支持40+种图表组件的展示,以及复杂的查询控件的设置来方便预览者动态查询数据,电子表格除包含本地Excel的基础功能以外,优势在于能直接联系加工好的数据集,并支持数据动态更新。Quick BI图示如下:

Power BI网页版支持可视化数据报表的搭建,并提供多种图表的配置和展现;同时本地支持Excel支持复杂的报表分析和制作,示例如下:

四、Quick BI对比Power BI:用户分享及数据

Power BI本地服务器用户能共享报表,但不能编辑仪表板,并缺少在Power BI SaaS上的机器学习功能。 用户还报告了不同数据支持方面的不一致之处。微软没有灵活性的提供对Azure以外的云服务器同样好的性能支持。

Quick BI 为网页版,网页版可以编辑和通过URL分享给企业小伙伴,开发者并一键发布即访问者可实时观测到报表的变化,同时Quick BI的本地服务器版(豪华版)支持的功能为云上SaaS版的功能集合;同时从Quick BI的权限架构体系中可以看出Quick BI更适合中国国情,是面向企业IT部门、业务人员,提供企业级管控下的业务人员自助式数据分析,从而实现上游IT部分做好数据管控,下游业务部分充分利用加工好的底层数据来自助式分析,支撑前台业务的快速发展。

五、Quick BI对比Power BI:移动端

Quick BI以HTML5形式集成钉钉微应用中,还支持对接企业的账号系统,嵌入到自有的APP系统中。Quick BI用移动端打造了以访问者为中心的报表搜索、查看、收藏、分享等一站式移动端服务;提供企业级的数据报表目录以方便用户快速找到相应的报表,支持快捷查看报表、权限审批流等,并支持通过应用内消息、钉钉、微信等渠道将报表分享给其他同事。

Power BI移动端为安装独立的APP,其中可视化图表是PC端做的简单适配,但和PC端相比,和其它系统无法进行互动和分享联系;

总体看来,两款产品各有优势,Quick BI在数据处理和建模、移动端及用户数据分享方面更胜一筹,大家可以根据自己的需要选择使用哪款产品哦~

阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!

阿里巴巴数据中台解决方案,核心产品:

• Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;

• Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;

• Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。

查看更多:https://yq.aliyun.com/articles/745039?utm_content=g_1000104749

]]>
阿里云零售数据中台:全域GROW解决方案 //www.otias-ub.com/archives/1089793.html Fri, 24 Jul 2020 03:56:36 +0000 //www.otias-ub.com/?p=1089793 本文来源: 阿里云数据中台 数智化转型俱乐部

摘要
7月22日,俱乐部开启了618回顾直播活动,细致介绍了阿里云零售数据中台如何帮助品牌实现消费者极速增长。今日推荐——课程2《全域GROW解决方案 赋能企业运营落地 》今年6月,阿里云数据中台正式对外发布了零售、金融、政务、互联网企业等行业数据中台。其中,零售行业数据中台主要提供多维的全方位洞察、全域自动化营销等服务,并通过与阿里巴巴生态联动,帮助更多零售企业实现数智化增长。在今年的618中,阿里云零售数据中台通过帮助企业建设一方数据中台,联动阿里生态,为百家品牌实现了全域赋能。昨天我们推送了618直播课程课《阿里云零售数据中台创新场景介绍》欢迎点击回看今天我们来深度介绍一个通过全域GROW解决方案帮助品牌实现品类增长的干货。

01

GROW品类增长方法论介绍

品牌营销已从流量至上,转变为以人群运营为核心的数字化增长阶段:

过去: GMV = 流量 * 转化率 * 客单价

现在: 以人群运营为核心,驱动数字化增长

02

全域GROW解决方案-场景案例-G

跨品类渗透

基于品牌一方人群+淘系数据, 寻找高相关品类,精准挖解决跨品类消费活跃人群

特色货品供给提升

一方IP人群上传算法放大,精准引流引爆IP货品

价格分层渗透

基于一方人群及价格带偏好/折扣敏感偏好,实现人群 分层运营,提升有效行动转化率

多渠道联动渗透

基于品牌一方用户及其行为,打通多端潜在受众资源池, 并 通过全域媒体矩阵进行全域触达和引流。

营销活动渗透

一方沉淀营销人群持续运营,提升品牌营销效率。

平台能力加速渗透

联动一方人群,探索平台直播趋势场景,精准渗透, 全面放大平台能力价值

03

全域GROW解决方案-场景案例-R

 

类目老客召回

品牌线下流失会员上翻,线上精准触达, 增强品牌黏着度

老客消费场景拓展

基于一方老客,通过挖掘细分场景需求以及培养新的消 费习惯,促进购买。

 

04

全域GROW解决方案-场景案例-O

 

商品溢价挖掘

基于品牌一方粉丝人群,挖掘偏好趋势,构建专属商品 孵化方案,提升品牌价值

未来:联动品牌一方数据资产,共建全域GROW由“人”及“品”场 景落地,加速品牌生意新增量

直播视频,扫码下方二维码,申请入群收看

 


如您想加入199IT数智化群或对199IT有任何建议,请加微信:wendy199it

 

 

]]>
合合信息联创、启信宝CEO陈青山:打造全景商业数据智能世界 //www.otias-ub.com/archives/1082285.html Mon, 13 Jul 2020 01:53:57 +0000 //www.otias-ub.com/?p=1082285 199IT讯 2020年注定是不平凡的一年,疫情给全球商业带来了诸多不确定性。但面对危机,有人看到了“危”,有人看到了“机”。

全球知名咨询机构埃森哲认为,除了政府的有效管控,数字化技术和新兴商业模式在中国的疫情发挥了关键的赋能作用。企业纷纷利用线上线下O2O服务和平台、虚拟现实和增强现实(VR/AR)技术,不仅满足了民众在隔离期间的基本生活需求,还可以帮助他们打发时间,缓解了长期居家的苦闷和情绪消沉。全国各地企业已普遍开始应用数字技术恢复运营。无论是通过直播与消费者互动、利用物联网和机器人技术实现智能制造,还是通过应用远程弹性办公方案帮助员工复工,均使得生产和运营逐步恢复常态。

本土咨询机构艾瑞咨询认为,疫情对中小微企业带来冲击的同时也带来了新的机遇,一些原本数字化程度高的企业,诸如电商平台、线上教育,知识付费等线上项目迎来了空前热潮,但平日线上业务空白、主要以线下业务为主的企业首当其冲,暴露出获客能力弱、经营模式单一、供应链运转难等短板,陷入停滞、亏损困境。能否实现线上-线下一体化服务模式转变成为疫情期间许多中小微企业生死存亡的关键点之一。且从长远来看,突破单一线下经营模式有助于提升企业抵御风险、多渠道获客、精准营销等综合经营能力,数字化改造下的企业商业模式进阶势在必行。中小微企业数字化升级并非简单的将线下内容转移至线上,而是可通过互联网线上手段,进行业务拓展、客户价值提升、订单、物流和配送综合管理等一系列经营环节,打造人、货、场、资全链接O2O模式,真正实现企业品牌和服务升级。

持相同观点还有合合信息联合创始人、启信宝CEO陈青山。 在接受199IT线上专访时,陈青山表示,金融企业特别是有一些本身基础比较好的金融企业,例如四大行,他们的技术的积累以及对于大数据、AI技术的使用,至始至终是走在全社会相对靠前的位置。所以,疫情对他们来说是最多是加速放缓的一个过程,如何更多、更快地利用AI的技术、数字化的技术来提高效率、降低成本、降低风险。

(图:合合信息联合创始人、启信宝CEO陈青山 来源:199IT)

而对于传统的制造业在这个过程中,如果要更多利用AI技术,首先把这些业务或者流程数字化,然后搬到线上,这是对传统企业是比较大的挑战。

合合信息是一家一直从事AI大数据的公司,始于2009年。从最开始的AI感知技术,包括图像处理、模式识别、文本识别、场景识别,一直到高阶层的认知智能,包括自然语言处理、知识图谱,在这个领域深耕了十几年。

基于企业大数据,合合信息创建发布了4款C端的产品。包括名片全能王、扫描全能王,这两款产品都面向全球发布,并且都已经超过了3亿以上的下载用户。另外一款商业调查类的产品启信宝,汇集了来自中国2.3亿家企业和社会组织机构,还有来自海外的2.2亿家企业,刻画了一个全景的商业大数据世界。同时合合信息还发布了另外一款产品“找到”,汇聚了全中国2亿以上的商业人士,服务于商业的营销、BD的产品。在后疫情的环境下为远程的办公、远程商务拜访,提供基于合合信息技术和产品的价值。

AI数字化技术转化物理世界

在世界人工智能大会2020云端峰会中合合信息主办的未来金融论坛上,陈青山做了主题为AI大数据创建智能金融新生态的演讲。在他看来,数字化的技术,特别是以AI为基础的数字化的技术,它是会将物理世界转化为虚拟世界中的数字。

金融环境下物理世界实体包括企业、人,还有金融业务中间场景中间的一些要素,比如单据、合同、财务报表、图像、声音、视频等。而以AI为基础的数字化的技术,会有文本识别、语音识别、视频识别、产品识别的技术以及LoT物联网等一些更加深入广泛的一些数字化的技术,它都是将我们的物理世界转化为另外一个孪生的虚拟世界,那个世界都是有数据构成的。合合信息在这个领域里面构建了自己的文本AI平台。

通过大数据和AI技术,能够极大解决金融、保险等领域的准确率和效率问题。陈青山举例称人工录入一份文件上的文字,它一般的准确率会在90%,但如果是以合合平台的平台文本机器人来做这样的录入工作,那么它的准确率可以超过99%。

对效率而言,譬如合合信息旗下扫描全能王,每年所扫描识别的文档的页数超过120亿份。如果用人工处理需要9亿个小时。如果按每个人每天工作8小时,一年工作250天来算的话,扫描全能王大概节约了45万人/年的工作量。这就是AI技术所创造的社会价值。合合信息把这些技术不断用在C端以及B端企业产品中。

STR+DATA+AI+SERVICES模式为客户创造价值

 要实现AI,需要三个要素,算力、算法、数据。

 企业内部业务数据资产建立好后,数据还是异构状态,要把这些数据经过清洗结构化、挖掘融合汇聚,变成一个知识库这样才能进行计算、关系挖掘,属性归类。把数据变成知识,要利用相关的自然语言处理,把数据信息转化为知识,这就包括实体提取、属性提取、关系挖掘。企业内部需要建立这样知识库,所有的建设的工作都是为了最终的使用数据。这些数据如果不用起来,它就是死的,没有价值。

企业数据需要以场景为指导,结合数据评分、报告、事件监控,能够指导业务决策,比如以金融业务为例,能够指导金融业务场景下面的智能化获客、智能风控,这才是整个数据的建设,AI技术的应用,最终要实现产品、业务的智能化。

目前合合信息已经形成“STR+DATA+AI+Service”的商业矩阵,比如在保险行业场景,对于保险业务前端的证件识别/分类;业务中端医疗票据、理赔单据识别;以及企业数据清洗、精准获客等,通过数据驱动为保险数字化提供全球领先的解决方案。

技术和商业需求是动态匹配

作为技术专家背景的企业负责人,陈青山坦言自己已经淡出一线技术多年。但作为业务的负责人,首先要从商业上、用户、客户的产品层面出发,结合公司本身的技术优势,以及产品上面的一些积累和布局,然后再去考虑以什么样的形式、渠道、方式,将产品和服务提供给客户。

从企业负责人角色,更多需要考虑客户的需求、场景、需求的本质以及技术和产品的边界,这两者的结合,的确是一个非常动态的过程。客户场景、客户需求形式上面可能会在不断的变化,但是有一些本质的东西可能是不变的。对于合合信息而言,技术上面需要不断的去创新,不断的去突破,不断满足用户和客户的需求。

在谈到合合信息未来资本层面的发展路径。陈青山认为目前国家的资本市场的一些变化,对人工智能类型的公司来说非常利好。包括人工智能、大数据以及产业创新、顺应科技发展趋势。创业板注册制、科创板的资本市场的变化,对AI企业来说都是比较积极的外部环境。

陈青山坚信,合合信息因为本身就是在AI和大数据领域在不断的深耕、实践,所以随着行业的发展也将不断发展壮大,实现资本共赢。(199IT Ralf)


199IT致力于TMT、大数据、人工智能等行业发展观察,如您有好的企业动态、行业趋势等故事,请与我们联系。微信:7281670


 

]]>
亚马逊云服务(AWS)全面推动机器学习创新应用 //www.otias-ub.com/archives/1080551.html Thu, 09 Jul 2020 12:01:57 +0000 //www.otias-ub.com/?p=1080551 AWS上海人工智能研究院联合AWS全球AI 研究团队、明尼苏达大学、俄亥俄州立大学和湖南大学的专家学者共同构建药物重定位知识图谱抗击新冠

在2020年7月9日下午举办的世界人工智能大会2020云端峰会产业发展高峰论坛全体会议上,AWS人工智能副总裁Swami Sivasubramanian发表了题为《突破常规:机器学习无处不在》的主题演讲。他表示,我们正在开启一个机器学习的黄金时代,机器学习已经在汽车自动驾驶、欺诈检测、呼叫中心、生产制造、语音转录、机器人技术、金融、零售、医疗等多个领域发挥重要作用。Swami还就企业如何使用机器学习技术及培养机器学习能力等方面提出建议,希望机器学习为各类企业和机构的发展注入强大动能,助力整个社会加速迈入人工智能时代的美好未来。

在“智联世界,共同家园”这一主题的号召下,今年的世界人工智能大会正在紧密推进使用 AI 对新冠肺炎的诊断、康复和复工复产等方面进行研究的工作。自新冠肺炎疫情爆发以来,AWS一直在大力推动机器学习在全球抗疫中发挥作用。本届世界人工智能大会期间,“AWS面向药物发现的深度图学习”成功入选2020卓越人工智能引领奖(Super AI Leader,简称SAIL)年度榜单,体现了AWS在深度图学习方面的领先技术和在医疗领域的前瞻应用。

这一入选项目包含了AWS所构建的一个生物医药知识图谱,以及研发的一系列面向新药研发的深度图学习工具。其中最为引人注目的是AWS近期公开发布的一个用于大规模药物重定位(老药新用)的知识图谱 DRKG (Drug Repurposing Knowledge Graph),以及一套完整的用于药物重定位研究的机器学习工具,目前已经在 github 上开源给全世界研究机构。DRKG是AWS上海人工智能研究院联合AWS全球AI 研究团队、明尼苏达大学、俄亥俄州立大学和湖南大学的专家学者共同构建的,其目的是帮助研究人员更有效地对新冠病毒及其它疾病(如阿尔茨海默病)进行药物重定位研究。相比较传统的新药开发,药物重定位可以缩短药物研发周期,降低成本,规避风险,因此是一种比较有前景的新冠肺炎治疗策略。DRKG是一个综合型生物医药知识图谱,它从六个公开的大型医药数据库以及近期新冠肺炎的相关医学文献中挖掘数据并进行整理和规范,包含了人类基因、化合物、生物过程、药物副作用、疾病和症状等六个主要方面的数据。

此外,入选项目还包含两个由AWS上海人工智能研究院研发并开源的深度图学习工具,包括专门针对大规模知识图谱嵌入表示的训练和推理工具DGL-KE及支持分子性质预测、药物设计、先导化合物优化、化学反应预测等的DGL-LifeSci。测试表明,DGL-KE相比同类型其他开源工具在标准测试集上有2到5倍加速,DGL-LifeSci使研究人员可以只用一行代码完成分子性质预测建模,较现有的实现最高能提速13倍。

AWS一直以来致力于将其在机器学习和人工智能方面深厚的技术积累,以云服务的方式,赋能给全球几百万客户。除了抗击新冠疫情之外,机器学习在各行各业都有着非常广泛的应用前景。本届世界人工智能大会期间,AWS专门举办了主题为“当AI在云端生长”的在线论坛,从前沿技术、行业应用场景和技术实现的角度,分享如何借助 AWS 机器学习和人工智能服务进行创新,提高效率和节约成本,推动AI实际落地及各行业应用场景的实现。AWS机器学习副总裁和杰出科学家Alex Smola、AWS机器学习副总裁Bratin Saha、AWS首席科学家李沐、AWS上海人工智能研究院院长张峥、AWS中国机器学习业务拓展和产品技术架构总监代闻、AWS首席开发者布道师费良宏、AWS 高级开发者顾问王宇博、天津华来科技有限公司 CTO季宝平、Freewheel 机器学习团队负责人吴磊、中科创达软件股份有限公司首席技术官邹鹏程等出席了这一论坛。

作为2020世界人工智能大会的战略合作伙伴,AWS连续三年鼎力支持大会。今年,AWS也将通过深度参与各类全体会议、主题论坛、行业论坛以及通过云端峰会AI家园展示区等,多方式诠释“当AI在云端生长”的无限可能!

 

]]>
中科创达携手亚马逊云服务(AWS) 加速智慧工业AI部署 ADC系统全面集成Amazon SageMaker //www.otias-ub.com/archives/1060802.html Thu, 04 Jun 2020 04:47:59 +0000 //www.otias-ub.com/?p=1060802 2020年6月4日,在亚马逊云服务(AWS)中国区域推出Amazon SageMaker机器学习服务之际,中科创达(ThunderSoft)率先宣布,已经将Amazon SageMaker集成到了中科创达智慧工业ADC (Automatic Defect Classification) 系统,让制造业客户可以在工业生产中轻松获得AI质检能力,通过Amazon SageMaker的弹性Notebook、实验管理、自动模型创建、模型调试分析,以及模型概念漂移检测等强大特性,中科创达将加速智能制造的落地进程,帮助企业以更少的工作量和更低的成本更快地投入生产,在节约人力的同时,提升产品良率,释放产能,提高竞争能力。

当前,以人工智能、大数据、物联网为标志的第四次工业革命方兴未艾,世界已步入智能化时代。今年以来,国家出台了多项加快新基建发展的政策和措施,进一步带动了5G、人工智能与工业领域的融合创新。劳动密集型的传统制造业越来越多地在生产环节主动引入人工智能等新型技术,解决生产效率低下和人力成本逐年增长的问题,提高行业竞争力。

作为全球知名的智能操作系统产品和技术提供商,中科创达深入了解传统制造业发展需求和趋势,基于在智能操作系统、图形图像处理和人工智能领域的深厚技术积累,在2018年推出了工业视觉检测一站式解决方案——智慧工业ADC系统。该系统包含缺陷自动化分类、新产品迭代数据清洗、业务作业员认证三个子系统,从作业员技能认证、数据集更新到新产品导入,贯穿工业检测的整个生命周期,有效帮助制造企业减少75%的工作量,产能提升35倍。相比人工检测,漏检率下降3%,准确率提升99%。目前,中科创达已经拓展到液晶面板、汽车制造、电子产品、化妆品制造、橡胶制造等行业,帮助众多客户提升工业自动化和智能化水平。

任何客户应用智慧工业ADC系统都需要实施机器学习工作。机器学习的实施是一项复杂的工作,涉及大量试错,需要大量专业技能,并消耗庞大的算力、数据存储和时间成本。Amazon SageMaker可以让这一过程变得更加简单高效,帮助客户去除机器学习涉及的混乱和复杂性,让客户能够迅速构建、训练和部署模型,来应对新的挑战。尤其是Amazon SageMaker Studio集成开发环境(IDE),为整个机器学习工作流提供了一个统一界面,使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

在智慧工业领域普遍涉及的边缘端,因为边缘设备内存和处理能力往往高度受限,但对延迟又非常敏感,还存在各种不同的硬件平台和处理器架构,开发者需要花费数周或数月的时间手工调优每个模型。同时,由于复杂的调优流程,模型部署到边缘后很少进行更新,开发者可能因此错失根据边缘设备所收集的数据来重新训练和改进模型的机会。借助 Amazon SageMaker Neo,开发者只需训练一次机器学习模型,便可在云端和边缘的任何位置运行。Amazon SageMaker Neo 可将模型的运行速度优化到两倍,同时仅占用 1/10 的内存,也不会对准确性造成任何影响。Amazon SageMaker Neo可以优化部署在Amazon EC2实例、Amazon SageMaker端点和AWS Greengrass管理的设备上的模型,实现工业视觉检测应用与其它应用无缝连接。

Amazon SageMaker可以有效贴近工业的实际需求,降低了算法实施过程中开发、环境、运维对工程师的依赖。例如,在电气行业ADC系统的实施中,通过集成Amazon SageMaker,最终用户的一次性投入成本降低了42%,软件开发的工作量降低了39%,系统的上线时间缩短了50%,系统运行效率是传统检测的35倍,解决了ADC系统落地工业场景的障碍。中科创达CTO邹鹏程表示:“中科创达智慧工业ADC系统汇集了我们在操作系统、人工智能和工程化建设等多方面优秀的能力,并已成功在液晶面板行业落地,具有非常完整的工业检测系统体系。近年来,中科创达提出‘服务上云’战略,打通前端和后端的产业链条,助推智能产业加速实现数字化。我们非常荣幸与AWS携手,通过集成Amazon SageMaker,大幅提升智慧工业ADC系统在工业制造领域落地、部署的效率。同时,依托AWS实现业务发展和持续创新,加速全球智慧行业的智能化、自动化和数字化升级。”

AWS中国区生态系统及合作伙伴部总经理汪湧表示:“中科创达是非常优秀的APN(AWS合作伙伴网络)合作伙伴,在IoT、人工智能方面的实力尤其突出。Amazon SageMaker一个重要的特点在于能够与各类行业应用进行集成,来进一步赋能各行业的应用场景。我们非常高兴中科创达能够成为首批在AWS中国区域利用Amazon SageMaker的APN合作伙伴。基于Amazon SageMaker,中科创达能够打造更加优秀的智慧工业视觉检测AI系统,满足更多客户的需求,助力他们实现智能化转型。”

关于中科创达

中科创达软件股份有限公司(股票代码300496)成立于2008年,是全球知名的智能操作系统产品和技术提供商。公司致力于提供智能操作系统产品、技术及解决方案。公司立足操作系统,聚焦人工智能技术,助力并加速智能手机、智能物联网、智能网联汽车、智能行业等领域的产品化与技术创新。中科创达拥有一支对操作系统技术有深入理解的国际化团队,总部位于北京,分子公司及研发中心分布于全球20+个地区,可以为全球客户提供便捷、高效的技术服务和本地支持。同时,中科创达与产业链中的芯片、元器件、终端、软件、互联网厂商、运营商以及云厂商等都拥有紧密的合作关系,具有独特的垂直整合优势。欲了解中科创达的更多信息,请访问www.thundersoft.com

关于AWS

14年来,Amazon Web Services(AWS)一直是世界上服务丰富、应用广泛的云服务平台。AWS提供超过175项全功能的服务,涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面,遍及24 个地理区域的76个可用区(AZ),并已公布计划在印度尼西亚、日本和西班牙新建3个AWS区域、9个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构都信赖AWS,通过AWS的服务强化其基础设施,提高敏捷性,降低成本。欲了解AWS的更多信息,请访问:http://aws.amazon.com

 

]]>
AWS张侠:TensorFlow全球85%负载都在AWS平台上 开发成本可降低54% //www.otias-ub.com/archives/1048701.html Wed, 13 May 2020 09:08:25 +0000 //www.otias-ub.com/?p=1048701 199IT讯 随着5月12日AWS宣布Amazon SageMake 在宁夏区和北京区正式上线,中国机器学习产业链迎来重要一极。

其重要程度如果要用数据来衡量,AWS首席云计算企业战略顾问张侠博士披露的一个数据足以让同行不可小觑。张侠博士表示,全球使用最主流TensorFlow框架做机器学习,大概85%的负载都在AWS平台上。

(图:AWS首席云计算企业战略顾问张侠博士)

作为全球机器学习最主流框架,TensorFlow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护,自2015年11月9日起,TensorFlow依据阿帕奇授权协议(Apache 2.0 open source license)开放源代码。据2019年9月TensorFlow 产品总监Kemal El Moujahid 披露的数据,TensorFlow在全球的下载量已经超过了 4000 万次。

同样让人惊艳的数据是,在AWS平台上有一个使用SageMaker+TensorFlow的具体案例,可以把效率从65%提高到90%,训练时间从30分钟缩短到14分钟。另一个角度,从全球目前看到的统计数字,整套Amazon SageMaker把总体拥有成本降低54%,开发效率提升10倍。而在中国AWS也在评估一些类似的数据。

为什么选择AWS的机器学习呢?张侠博士认为,AWS提供了非常广泛、深入的机器学习服务,其中它的一个重要产品就是Amazon SageMaker。它使得企业能够加速对机器学习的整个学习、建模、发展、实验的整个过程。AWS云平台其他所有的手段,包括数据存储、数据仓库,物联网和机器学习一起形成所谓的AIoT,智能的物联网。再包括使用一些容器的方法,快速的来部署,把机器学习的应用做成一个容器化的服务,在容器里可以快速部署。所以云计算和机器学习在一体化之后,AWS可以提供最广泛、最深入的解决方案。

而大宇无限机器学习技术总监苏映滨则认为性能、成本、算法、丰富度、便捷性都是企业决定使用Amazon SageMaker的考量范围,除此之外,还有一个重点是服务能力,或者说用户体验,就是可用率以及能够提供支持包括额外提供一些AI的支持。

十分重视中国市场  将改变企业服务、金融、教育、健康、卫生等创新场景

从2019年12月re:Invent上发布的Amazon SageMaker Studio等六大主要的功能开始,不到5个月时间,AWS在中国发布Amazon SageMake,包括SageMakerStudio等最新的功能。北京区、宁夏区作为AWS全球24个大区的第五个区和第六个区对产品的上线,表明了AWS对中国市场的重视程度。张侠博士表示,“我们非常清醒地意识到随着中国的经济发展,这个市场无疑是经济发展的最重要的市场之一,也是我们最重要的市场之一。”

而对于Amazon SageMaker的落地场景,张侠博士认为,中国是一个接受创新非常快的地方,如使用的人脸识别、使用汽车的牌照识别进入停车场等等类似的大量场景,不光开始的快,并把它落实变成一个真正的应用,在全球范围内很多还是处在非常领先的地位的。因为中国的文化现在是非常开放,也非常愿意去接受这些创新的东西的阶段。

“场景其实也是非常多方面的。比如说客户服务,这是一个比较独特的场景,这个场景里面现在很多进展,包括Amazon Connect的Contact Lens,在客服里面通过机器学习的方法、语义的理解,去强化这方面的内容。在金融里面,比如说交易里面越来越自动化,包括最近一些新的客户投资的产品,智能投顾,一直是比较热门的话题,很多券商、投资公司都在这方面去做一些事情。这个方面如果要建一些模型,然后再推荐一些股票、基金什么的,可能可以摆脱一些人为的因素,相对有一些比较独立的效果。从教育、健康、卫生等场景非常多。几乎想象力就是边界,我们在很多地方随着时间都能够往前推进。”

AWS机器学习方案包括SageMaker在内的三层服务堆栈

实际上,Amazon SageMaker只是AWS机器学习解决方案的一个层面。AWS提供的机器学习解决方案是一个包括三层的服务堆栈。如下图所示,Amazon SageMaker是其中间层。在这一层,主要通过Amazon SageMaker这一完全托管的服务,完全消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。

AWS也根据不同类型客户的需求,提供了全面的机器学习解决方案。三层服务堆栈的底层,为想要自己构建算法或开发新框架的客户提供灵活选择,客户可以选择使用TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras等机器学习框架和基础架构。在这一层,AWS 专注于性能、灵活性,降低成本,以便任何用户都可以使用最新的基础设施,对多种框架进行试验。借助AWS,客户可以访问针对机器学习的、最强大的 GPU 实例,应对最苛刻的应用场景。

在三层服务堆栈的顶层,AWS提供了训练好的人工智能服务,这些服务主要解决与人类认知相关的典型问题。例如,计算机视觉方面的服务,可以识别图像或视频中的对象、人员、文本、场景、活动和不安全或不适宜的内容。个性化推荐服务可以从库存中向消费者推荐多种产品和服务。客户可以直接在其应用中调用AWS提供的这些人工智能服务,而无需关注服务背后的机器学习模型。

开源产品随时推出 融合全球主流开源内容

AWS对开源比较重视,早在2019年1月25日,亚马逊AWS发布开源服务Amazon SageMaker Neo,它可以帮助使用者在多个操作环境中运行机器学习训练模型。

Amazon SageMaker Neo 让客户只需训练一次模型,即可以高达 2 倍的性能在任意场景运行。在连接的端点设备上运行的应用程序对于机器学习模型的性能尤其敏感。它们需要低延迟决策,通常部署在多种不同的硬件平台上。Amazon SageMaker Neo 针对特定硬件平台编译模型,自动优化模型性能,使它们能够以高达两倍的性能运行,而又确保精确性丝毫不打折扣。因此,开发者不再需要花费时间,根据每一个硬件平台手动调整他们已经训练过的模型(节约时间和成本)。SageMaker Neo 支持英伟达、英特尔、Xilinx、Cadence 和 Arm 硬件平台以及一些主流框架,如 Tensorflow、Apache MXNet 和 PyTorch。

对于未来AWS在开源方面的考量,张侠博士回答199IT提问时表示“实际上我们在整个Amazon SageMaker人工智能平台里面,多个方位、多个角度,从框架到算法,都经常会融进一些开源的内容。两周之前,在PyTorch方面,我们刚宣布了一个Torch Serve的开源模型,是PyTorch框架下的,所以开源产品是随时都会推出的。”

中国各行业如何Amazon SageMaker应用机器学习

据张侠博士了解,中国有各种各样的企业都有在使用Amazon SageMaker,一些大的传统企业,比如做家用电器的企业,智能冰箱是可以用语音对话的。

创新类的,比如在线教育、做自动驾驶的公司,还有一些新创的公司,集中在一些新的领域,像叽里呱啦、流利说,还有其他很多的教育相关的应用,比如判卷子、判分等等,所以在线教育有很多案例。

在医疗卫生行业,从基因到一些智能的新的应用技术,比如说用机器学习的方法来读一些脑部供血的状况、癌症发展的状况,有很多公司在做类似的内容,也是一个比较典型的应用场景。

张侠博士强调,“企业可以说从大到小,几乎各种各样行业都会有一些突破。他们真正的共同点是这些企业都处在一个创新的很好的状态,是一个在走上坡、积极努力进取状态,去找一些新的市场、新的服务和突破点,更好的提供更新的价值,我觉得这是他们真正的共同点。”

对数据分析行业和数字化的影响

Amazon SageMaker对未来数据分析行业有何影响,张侠博士认为,SageMaker对数据分析行业影响较大,云时代更多的海量的实时的数据,需要的不是像以前传统批量的分析,而更多是前瞻性的、预测性的、实时的分析。使用人工智能机器学习的这些方法做数据分析,无疑是一个大数据发展的非常重要的趋势。在这里如果能够使用SageMaker来加速数据分析模型、建模的过程,是能够很有效的推进这个工作的。“在实际工作中,我们也看到确实是这么个情况,比如今天我在准备一些材料,跟我们客户要分享,这个材料里面其中就有关于零售类客户的一些数据分析,数据怎么样通过SageMaker做一些机器学习类的分析,能更好的进行预测的内容。所以这个事情是真实发生的。”

随着疫情的过去,很多企业准备在数字化转型过程当中重新大显身手,通过这次疫情,整个企业的发展加速了。因为在疫情当中好的数字化的原生企业,在疫情过程中表现都非常优秀。张侠博士坦言道:“数字化转型实际上包括很多方面,从客户体验、整个运营、决策、创新、竞争多个方面都是下一步经济发展、企业发展的关键,而这里面大数据分析和机器学习可以说是其中的两个重要的支撑点。一个企业如果抓好这些,可以更好的准备好,在下一阶段的发展中处在一个非常有利的地位。”(Ralf)

 

]]>
亚马逊云服务(AWS)中国宁夏及北京区域正式上线Amazon SageMaker //www.otias-ub.com/archives/1047088.html Tue, 12 May 2020 02:57:35 +0000 //www.otias-ub.com/?p=1047088 Amazon SageMaker 是一项完全托管的服务,使开发者和数据科学家能够更广泛、更成功地使用机器学习

[2020年5月12日,北京] 亚马逊云服务Amazon Web Services, Inc. (AWS) 今天宣布,Amazon SageMaker在由西云数据运营的AWS中国 (宁夏) 区域和光环新网运营的AWS中国(北京)区域正式上线。Amazon SageMaker 是一项完全托管的服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。Amazon SageMaker在中国的上线还使中国客户获得一系列新发布的工具,例如弹性Notebook、实验管理、模型自动创建、模型调试分析,以及模型概念漂移检测等强大功能,所有这些工具都封装在首个面向机器学习的集成开发环境(IDE) Amazon SageMaker Studio中。进一步了解Amazon SageMaker,请访问: https://www.amazonaws.cn/sagemaker/

机器学习的实施是一项非常复杂的工作,涉及大量试错,并且需要专业技能。开发者和数据科学家首先必须对数据进行可视化、转换和预处理,这些数据才能变成算法可以使用的格式,用以训练模型。即使是简单的模型,企业也需要花费庞大的算力和大量的训练时间,并可能需要招聘专门的团队来管理包含多台GPU服务器的训练环境。从选择和优化算法,到调节影响模型准确性的数百万个参数,训练模型的所有阶段都需要大量的人力和猜测。然后,在应用程序中部署训练好的模型时,客户又需要另一套应用设计和分布式系统方面的专业技能。并且,随着数据集和变量数的增加,模型会过时,客户又必须一次又一次地重新训练模型,让模型从新的信息中学习和进化。所有这些工作都需要大量的专业知识,并耗费庞大的算力、数据存储和时间成本。而且,由于没有集成化的工具用于整个机器学习的工作流,机器学习模型的传统开发方式是复杂、繁复和昂贵的。

Amazon SageMaker消除了机器学习过程中各个步骤的繁重工作。通过预置的Notebook、针对PB级数据集优化的常用算法,以及自动模型调优,Amazon SageMaker大大降低了模型构建和训练的难度。并且,Amazon SageMaker显著简化和加快了模型训练过程,可以通过自动提供和管理基础设施来训练模型和运行推理。同时,AWS 最近宣布了多项重要功能和高级特性,让客户能够更轻松地构建、训练、调优和部署机器学习模型。这些功能包括:

  • 面向机器学习的集成开发环境(IDE):Amazon SageMaker Studio将所有用于机器学习的组件集中在一个地方。跟使用集成开发环境(IDE)做软件开发一样,开发者现在可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其它应用程序资产,例如用于移动应用程序的图像。当前,机器学习工作流有大量组件,其中许多组件都带有它们自己的一组各自独立的工具。Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面。Amazon SageMaker Studio为开发者提供了创建项目文件夹、组织Notebook和数据集,以及协作讨论Notebook和结果的功能。Amazon SageMaker Studio使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

 

  • 弹性笔记本:Amazon SageMaker Notebooks提供了一键启用的Jupyter Notebook,具有秒级的弹性计算提升能力。Notebooks包含了运行或重新创建机器学习工作流所需的一切要素。在此之前,要查看或运行Notebook,开发者需要在Amazon SageMaker中启动计算实例。如果他们发现需要更多的算力,必须启动一个新实例,转移Notebook,关闭旧实例。而且,由于Notebook与计算实例是耦合的,通常存在于开发者的工作站上,其共享和迭代协作很不容易。Amazon SageMaker Notebooks提供了弹性的JupyterNotebook,让开发者可以轻松地调高或降低Notebook需要的算力(包括GPU加速)。这些调整在后台自动发生,不会打断开发者的工作。开发者不再需要浪费时间来关闭旧实例、在新实例中重新创建所有工作,从而可以更快地开始构建模型。Amazon SageMaker Notebook还可以自动复制特定环境和库依赖项,实现Notebook一键共享。这将使构建模型的协作变得更容易,比如,一个工程师可以很容易地将手头工作共享给其他工程师,让他们在现有工作的基础上构建模型。

 

  • 实验管理:Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代,目的是隔离和衡量更改特定输入时的增量影响。这些迭代过程可能会生成数百个实验构件,如模型、训练数据和参数设置。但是,开发者目前缺乏一个便利的实验管理机制,甚至不得不依赖电子表格来跟踪实验,手动对这些构件进行排序,以了解对应的影响。Amazon SageMaker Experiments自动捕获输入参数、配置和结果,并将它们存储为“实验”,帮助开发者管理这些迭代。开发者可以浏览活跃的实验,根据特征搜索以前的实验,回顾以前的实验结果,还能用可视化的方式比较实验结果。Amazon SageMaker Experiments也保留了实验的完整谱系,如果一个模型开始偏离其预期结果,开发者可以及时回溯和检查。因此,Amazon SageMaker Experiments使开发者更容易快速迭代和开发高质量的模型。

 

  • 调试与分析:Amazon SageMaker Debugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型。当前,机器学习训练过程基本上是不透明的,训练时间可能很长、很难优化;而且,往往就像一个“黑箱”,解读和解释模型都很困难。使用Amazon SageMaker Debugger,在Amazon SageMaker中训练的模型将自动发出收集到的关键指标,这些指标可以在Amazon SageMaker Studio中查看,也可以通过Amazon SageMaker Debugger的API查看,为训练的准确性和性能提供实时反馈。当检测到训练问题时,Amazon SageMaker Debugger会提供警告和补救建议。Amazon SageMaker Debugger也可帮助开发者解读模型是如何工作的,向神经网络的可解释性迈出了第一步。

 

  • 自动构建模型:Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。当前的机器学习自动化方法,在创建初始模型方面做得不错,但是对于如何创建模型、模型中包含什么内容,并没有数据提供给开发者。因此,如果模型达不到期望,开发者想要改进它,就没有什么办法了。此外,当前的机器学习自动化服务只给客户一个简单的模型。有时客户希望做出一些取舍,例如以某个版本的模型牺牲一点准确性,以换取更低延迟的预测。但是如果客户只有一个模型可用,就没有这样的可选项。Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优,跟踪其性能,然后根据性能对模型进行排名。点击几下鼠标,用户可以得到用于部署的、性能最佳的模型推荐,而这只需很少一点时间和精力用于训练。并且,用户可以清楚地看到模型是如何创建的,以及模型中包含什么内容。缺乏机器学习经验的人可以使用Amazon SageMaker Autopilot轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型,团队可以在此基础上进行进一步迭代。Amazon SageMaker Autopilot为开发者提供了多达50种不同的模型,可以在Amazon SageMaker Studio中查看。因此,开发者能够针对应用场景选择最佳模型,并且可以结合不同的优化因子考虑多个候选模型。

 

  • 概念漂移检测:Amazon SageMaker Model Monitor允许开发者检测和纠正概念漂移(conceptdrift)。影响部署到生产环境后的模型的准确性的一大因素就是生产环境中的输入数据开始不同于模型训练所使用的数据集,从而影响预测结果,例如经济状况改变导致的新利率会影响国内采购预测,季节变化带来不同的温度、湿度和空气压力会影响设备维护时间表的预测,等等。如果输入数据开始出现这样的差异,就会导致所谓的“概念漂移”,即模型用于预测的模式不再适用。Amazon SageMaker Model Monitor自动检测模型部署中的概念漂移。Amazon SageMaker Model Monitor在训练期间创建一组关于模型的基线统计数据,将用于预测的数据与训练基线进行比较。当检测到漂移时,Amazon SageMaker Model Monitor会向开发者发出告警,并帮助他们直观地确定原因。开发者可以使用Amazon SageMaker Model Monitor的开箱即用功能立即检测漂移,也可以为Amazon SageMaker Model Monitor编写自己的规则用于监测。Amazon SageMaker Model Monitor让开发者更容易调整训练数据或算法以解决概念漂移问题。

“国内越来越多的企业正在探讨机器学习和人工智能技术带来的巨大潜力,探索如何把这些技术融入到日常应用当中。但实际上,除了少数具有专家人才和数据科学家的企业外,大部分公司还是很难应用机器学习这项技术,因此客户希望我们可以让这项技术变得更方便、更易用。”AWS全球副总裁及大中华区执行董事张文翊表示,“AWS提供了广泛、深入的机器学习和人工智能服务。Amazon SageMaker在AWS中国(宁夏)区域和AWS中国(北京)区域上线,将帮助更多中国客户去除机器学习涉及的混乱和复杂性,让他们能够胜任构建、训练和部署模型的工作,以应对新的挑战。”

全球已有数以万计的客户利用Amazon SageMaker加快机器学习部署, Autodesk、Change Healthcare、拜耳、英国航空、盖洛普、洛杉矶快船队、松下航空电子(Panasonic Avionics)、环球邮报和T-Mobile等等。中国客户如虎牙、大宇无限、嘉谊互娱、华来科技等也已选择Amazon SageMaker大规模地构建、训练和部署机器学习模型。

大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供移动短视频服务。大宇无限技术副总裁刘克东表示:“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整个流程极为复杂,需要大量的开发者耗费很长的时间才有可能完成。Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程,使我们无需构建基础设施,我们的算法工程师只需为Amazon SageMaker准备数据,仅用了三个月的时间就从零完成了整个系统的建设并承受了实际用户访问的压力。”

借助AWS提供的Amazon EC2 GPU实例和Amazon SageMaker,华来科技以优化的成本将机器学习创新融合到其智能家居、智慧安防设备和服务中。天津华来科技有限公司云业务部总监季宝平说:“在AWS上,我们可以完成算法的构建和模型训练,并且该过程完全不需要我们在本地投资昂贵的计算硬件,一切都是在云端以按需使用的方式完成。与行业通用的公开算法不同,更重要的是我们自己训练的模型在应用场景中具有更多个性化空间,并且我们对自己训练出的模型具有知识产权,这将是我们未来的核心竞争力。”

AWS合作伙伴网络 (APN) 成员对Amazon SageMaker在中国区域的上线也表示欢迎。

德勤D.Data是一个基于AWS的 PaaS (平台即服务) 平台,为企业客户提供数据分析和业务洞察。它为不同的行业和业务场景提供了各种数据建模和预测服务。德勤创新、数字化研发中心主管合伙人賴有猷评价道:“通过Amazon SageMaker,我们大大提高了算法和机器学习建模能力,提高了分析效率。Amazon SageMaker的IDE平台也帮助我们加快了开发进程。”

伊克罗德是AWS的核心级咨询合作伙伴 (APN Premier Consulting Partner),其基于AWS的解决方案极大地减少了用户的开发时间与运营费用。伊克罗德中国区副总裁桂梓捷表示:“我们运用Amazon SageMaker平台加速企业导入行业AI解决方案,如标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等,针对客户实际遇到的商业问题,量身打造真正解决问题的端到端AI应用。随着Amazon SageMaker在中国区域落地,我们将会以SageMaker平台作为企业MLOps(机器学习运营)核心,协助企业构建MLOps流程,尤其在金融行业领域,帮助企业内部数据科学家与AI工程师建立、训练与部署机器学习模型。”

###

]]>
房地产科技2020:房地产的未来 //www.otias-ub.com/archives/1025484.html Tue, 31 Mar 2020 22:50:00 +0000 //www.otias-ub.com/?p=1025484 牛津大学发布了新报告“房地产科技2020——房地产的未来”。Proptech(房地产科技)描述了目前房地产行业正在发生的数字化转型。Proptech 1.0浪潮起源于20世纪80年代的PC和90年代的互联网兴起,以2001年的互联网泡沫破裂告终。Proptech 2.0是由GFC和技术发展刺激的,最终在App Store中达到顶峰,有迹象表明它现在正在成熟。Proptech 3.0将由全球气候变化和快速城市化的压力推动,并通过物联网、机器学习和人工智能以及庄闲网络娱乐平台进入 等外生技术的成熟来实现。

牛津大学分析了房地产科技的五个驱动因素和主要活动领域:

五个驱动因素:

  • 建筑技术
  • 法律技术
  • 庄闲游戏app官网 运动
  • 金融科技
  • 外生技术

四个关键领域:

  • 智能房地产
  • 房地产金融科技
  • 房地产庄闲游戏app官网
  • 数据数字化/分析

报告认为还应该增加大规模外生技术(通常与交通相关)作为智能房地产行业的延伸。

在过去的4-5年里,至少有200亿美元投资于房地产科技行业,为7000家采用各种技术的房地产科技初创公司提供了资金,包括:

  • 网站和智能手机应用
  • API
  • 数据分析和可视化
  • 物联网(IoT)
  • 人工智能和机器学习
  • 庄闲网络娱乐平台进入 和分布式分类帐技术
  • 传感器
  • 虚拟现实和增强现实
  • 地理空间和5G技术
  • 云计算
  • 交通技术:无人机、自动驾驶车辆和超环路。
  • 其他技术,包括3D打印、可穿戴设备和环保建筑材料。

到2050年,世界人口预计将翻一番,预计其中90%的增长将在非洲和亚洲。在我们的历史上,首次有超过50%的世界人口居住在城市地区,预计到2050年,这一数字将增长到68%。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
Gartner:IT部门对AI人才的需求在过去四年增长两倍 //www.otias-ub.com/archives/1024390.html Fri, 27 Mar 2020 18:32:57 +0000 //www.otias-ub.com/?p=1024390 Gartner数据显示,尽管2015-2019年IT部门对AI人才的需求增加了两倍,但IT发布的AI职位数量仍不到来自其他业务部门的一半(见图1)。

Gartner研究总监Peter Krensky表示:“高需求和紧张的劳动力市场使得拥有人工智能技能的应聘者具有很强的竞争力,但招聘技术和战略没有跟上。”在最近的研究中,受访者将“员工技能”列为采用AI和机器学习(ML)的头号挑战或障碍。

招聘大量人工智能人才的部门包括市场营销、销售、客服、财务和研发。这些业务部门正在通过人工智能人才进行客户流失建模、客户盈利能力分析、客户细分、交叉销售和追加销售建议、需求规划和风险管理。

很大一部分人工智能用例报告了来自以资产为中心的行业,支持预测性维护、工作流和生产优化、质量控制和供应链优化等项目。人工智能人才通常被直接聘用到这些部门,心中有明确的用例,数据科学家和其他人就可以了解特定业务领域的复杂性,并密切关注工作的部署和使用。

Peter Krensky补充说:“考虑到人工智能的复杂性、新颖性、多学科性质和潜在的深远影响,首席信息官在帮助人力资源部在所有业务部门招聘人工智能人才方面处于有利地位。首席信息官和人力资源领导应该一起重新思考,专注于人工智能的员工真正需要具备哪些技能,并探索与招聘规范相邻的候选人标准。首席信息官还应该创造性地思考IT在管理和支持不同的人工智能计划以及推动这一活动的不断发展的团队方面的作用。”

199IT.com原创编译自:Gartner 非授权请勿转载

]]>
Sojern:2020年北美旅游广告报告 //www.otias-ub.com/archives/1022754.html Wed, 25 Mar 2020 22:24:05 +0000 //www.otias-ub.com/?p=1022754 Sojern发布了“2020年北美旅游广告报告”。旅游营销人员可以利用从整个行业其他品牌那里学到的东西,更有效地分配预算,并保持不断发展的领先地位。

以下是一些重要发现:

营销人员对“永远在线的游客”的回应

营销人员表示,始终在线的方法的最显著好处是,当旅客开始计划和研究他们的下一次旅行时不会错过任何时刻(44%);可以持续测试、学习并更准确地优化数字营销策略(41%);可以看到逐月逐年的持续绩效视图(41%)。

旅游品牌热衷于将持续不断的活动与季节性活动和促销活动相结合,以提升他们的营销策略。这种方法将给他们更好的消费者洞察,可以利用这些洞察来微调他们的营销活动。

新兴技术将在2020年实现巨大增长

展望未来,旅游营销人员计划在未来五年内使用互动视频(50%)、机器学习(44%)和即时通讯应用或短信(41%)。互动视频可能会出现最大的同比增长,因为它为社交媒体和有线电视(CTV)的营销策略添加了动态元素,从而改善了客户互动和品牌保留率。

旅游营销人员正在将预算转移到CTV

2020年11%的视频广告预算分配给了CTV。旅游营销人员发现,它是接触和吸引观众的一个非常有效的渠道。主要动机包括:通过多个流媒体设备、应用或渠道定向观众(65%)、精确定位(36%),以及轻松制作低成本的专业视频内容(34%)。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
Cognizant:聊天机器人在保险业的未来 //www.otias-ub.com/archives/1020953.html Tue, 17 Mar 2020 20:46:46 +0000 //www.otias-ub.com/?p=1020953 随着消息平台的日益流行,以及人工智能(AI)和机器学习(ML)的发展,2018年针对一系列商业需求的聊天机器人开发激增。现在,聊天机器人是许多专注于业务现代化和网络客户体验的企业计划不可或缺的一部分。

据估计,到2022年聊天机器人预计将在全球范围内节省超过80亿美元的成本,同时还提供全天候客户服务、更短的处理时间、更快的分辨率和直通处理,从而提高客户满意度。但是,当聊天机器人的交互是机械的、非对话的或不如基于人类的对话时,该主动性可能会导致业务损失。因此,企业需要仔细规划和执行这些系统,以克服战略和战术挑战。

在保险流程中有许多可服务的领域,聊天机器人将在保险价值链上发挥重要作用,包括预购、购买、客户服务和后端运营。这样做可以减轻保险交易的复杂性。传统保险交易的特点是手工填写表格、复杂的问卷、耗时的背景调查、人员短缺和繁琐的客户服务。通过拥抱人工智能为创新提供可能性,保险公司可以赢得客户的心、头脑和钱包。

调查发现三个因素可以将有效的聊天机器人与不合格的区分开:

  1. 与客户有效交流的能力
  2. 理解人类交流方式
  3. 与其他机器、设备和数据源协作

Cognizant将聊天机器人分为三个等级:基础、中间,和先进的聊天机器人。要想成为最高等级的聊天机器人,它必须不断地从经验中学习。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
Adobe:2020年网络客户体验趋势报告 //www.otias-ub.com/archives/994560.html Fri, 14 Feb 2020 22:24:26 +0000 //www.otias-ub.com/?p=994560 Adobe发布了“2020年网络客户体验趋势报告”。2019年,配备了先进客户管理的专业人员完成企业目标的可能性是那些没有配备先进客户管理的4倍。

当被要求选择三个与网络相关的领域时,最常被引用的首要任务是社交媒体参与和分析(28%)。紧随其后的是内容管理(25%)和目标定向和个性化(25%)。

超过1/3的CX(客户体验)领导者(36%)正在实时提供个性化体验。CX领导者在2020年的另一个共同优先事项是视频内容(23%)。

2020年人才和隐私引发关注

在关注主要问题时,对经济气候的担忧方面CX领导者和其他人存在很大差距。当被要求选择2020年最令人担忧的领域时,选择经济衰退担忧的CX领导者(19%)明显少于主流(29%)。

相反,CX领导者似乎最关心的是吸引和留住人才(23%),其他人(18%)不是那么优先考虑这个问题。考虑到去年约有70%的营销团队预计会扩大,对技能人才的竞争不太可能消失,特别是在营销人员定期将新技术添加到他们的流程中的情况下。为了应对人才问题,约39%的CX领导者提供面对面的专业培训。

CX领袖似乎担心的另一个领域是数据和隐私的担忧(19% vs, 16%)。

人工智能与机器学习

尽管存在对数据的担忧,但就CX领导者正在使用的先进技术而言,数据是显而易见的。简单地说,CX的领导者在人工智能和机器学习方面走在了前面。超过1/3(36%)目前正在使用这种技术,还有28%的受访者计划在2020年投资于这一领域。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
斯坦福大学:2019年人工智能指数报告 //www.otias-ub.com/archives/989259.html Mon, 30 Dec 2019 22:36:40 +0000 //www.otias-ub.com/?p=989259 斯坦福大学发布了“2019年人工智能指数报告”。欧洲一直是最大的AI论文出版源,2018年Scopus追踪的人工智能出版物中,欧洲的论文比例上升到27%以上。中国发表的论文占全球人工智能文章的比例从2000年的10%增长到2018年的28%。

不包括学术界,在中国和欧洲,政府附属机构贡献的人工智能出版物数量最多;而在美国,企业则是人工智能论文发布的主要主体。

2018年,中国政府机构发表的人工智能论文几乎是中国企业的三倍。自1998年以来,中国政府发布的人工智能论文也增长了300倍,而同期企业人工智能论文增长了66倍。

2018年,美国企业发布的人工智能论文的数量是中国企业人的7倍多,几乎是欧洲的两倍。在所有三个地区,学术论文远远超过政府、企业和医学论文,占中国人工智能论文的92%,欧洲为90%,美国为85%。

近年来,专注于人工智能的公司与学术界合作进行研究的情况越来越常见。

机器学习(ML)是人工智能领域最活跃的研究领域之一。其中,深度学习(DL)方法近年来变得越来越流行。在arxiv上发表的深度学习(DL)论文的数量在所有地区都在增加。调查发现,2018年北美发表的DL论文数量最多,其次是欧洲。来自东亚的DL论文数量在2018年达到了与欧洲相同的水平。

新加坡、瑞士、澳大利亚、以色列、荷兰和卢森堡在arxiv上发表的人均DL论文相对较高。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
Crunchbase:2019年人工智能和机器学习初创企业已融资66.2亿美元 //www.otias-ub.com/archives/938262.html Wed, 18 Sep 2019 19:26:25 +0000 //www.otias-ub.com/?p=938262 Crunchbase对与人工智能和机器学习相关的公司的风险投资进行的分析发现,对美国初创企业的投资继续增长。2019年(到目前为止),该领域的公司共筹集了66.2亿美元,这可能推动该行业年投资高于2018年(86.7亿美元)。

在过去的几年里,将人工智能或机器学习作为关键技术的美国初创企业中获得投资的数量并没有增长。但是,这些公司募集的金额仍在继续增长。

下图显示了2014年至今年的资金水平:

对于美国和全球AI和ML初创企业而言,真正的资金跃升发生在2016-2018年之间。就在那时,风险投资者将AI视为一个时髦词汇,达到了人们对AI的需求顶峰。

下图显示了交易量:

到目前为止, 2019年人工智能初创企业的资金没有大幅增长。也就是说, 2019年大约2/3的时间里无论是对美国还是对全球来说,该行业的投资额只会略微超过2018年。

最大的投资

没有一个单独的交易能主导人工智能投资。下图列出了2019年五家获得最多投资的美国AI和ML企业。

投资退出

专注于AI的初创公司的投资在四年前开始大幅提升,预计现在出现大量投资退出还为时尚早。

199IT.com原创编译自:Crunchbase 非授权请勿转载

]]>
Dun&Bradstreet:2/3的商业领袖认为数据对他们发展业务有帮助 //www.otias-ub.com/archives/915227.html Thu, 22 Aug 2019 20:00:30 +0000 //www.otias-ub.com/?p=915227 Dun&Bradstreet的一项新研究调查了美国和英国的500多名商业决策者,结果显示这些高管中有一半(50%)认为,如果没有高质量的数据,他们的公司将无法生存。商业领袖仍然对数据充满热情,2/3的受访者(67%)认识到数据在帮助他们发展业务方面的潜力。

那么,商业领袖目前使用哪些技术来收集和分析数据,以及他们计划在未来12个月内添加哪些技术?目前,超过2/5的企业(43%)正在使用数据管理软件,另有1/4(25%)计划明年使用。

只有22%的企业使用机器学习进行数据收集和分析,尽管26%的企业将在未来12个月内转向此类解决方案。

3/10的受访者(31%)计划在明年使用人工智能(AI),21%的受访者已经在使用这项技术。虽然AI的采用速度比它的炒作要慢,但许多使用这种先进技术的B2B营销人员已经看到效果。

庄闲网络娱乐平台进入 和边缘计算技术预计也将在不久的将来得到更多的使用,1/4的受访者(25%)表示他们将使用这两种技术,而目前分别有19%和17%的企业在使用这两种技术。

数据挑战继续存在

近3/10的受访者(28%)认为,有效的数据管理是他们在未来10年将面临的最大数据挑战。这也是他们面临的以数据为主导的最大挑战。

人才仍然很重要

无论数据为企业带来的价值如何,如果没有人来管理它,其价值可能难以实现:受访者中有相当一部分人认为,人才是实现数据价值最大化的关键。

一些高管还承认,现有的技能差距阻碍了他们最大限度地利用数据。但是,拥有正确数据和分析技能的员工越来越难找到。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
Gartner:2019年企业平均部署4个AI/ML项目 //www.otias-ub.com/archives/907788.html Sun, 11 Aug 2019 17:37:13 +0000 //www.otias-ub.com/?p=907788 根据Gartner最近的一项调查,从事人工智能(AI)或机器学习(ML)工作的企业平均有四个AI/ML项目到位。59%的受访者表示他们已经部署了人工智能。

Gartner“AI和ML发展战略”研究于2018年12月通过在线调查进行,共有106名Gartner Research Circle成员参与,这是一个由Gartner管理的小组,由IT和IT/业务专业人士组成。

AI项目的平均数量是4个,但受访者希望在未来12个月内再增加6个项目,在未来3年内再增加15个项目(参见图1)。这意味着在2022年,这些机构预计平均有35个AI或ML项目就位。

客户体验(CX)和任务自动化是关键的激励因素

40%的组织认为CX是他们使用AI技术的最高激励因素。大多数企业(56%)在内部使用AI来支持决策制定并向员工提供建议。

自动化任务是第二个最重要的项目类型,20%的受访者将其列为最重要的激励因素。自动化的例子包括财务中的发票和合同验证,或者人力资源中的自动筛选和机器人面试。

受访者采用AI的最大挑战是缺乏技能(56%),理解AI用例(42%),以及对数据范围或质量的担忧(34%)。

衡量AI项目的成功程度

调查显示,许多机构在衡量项目的价值时使用效率作为成功的标准。Gartner著名副总裁兼分析师Whit Andrews表示:“使用效率作为显示价值的一种方式,在那些声称自己在采用配置文件方面比较保守的机构中更为普遍。那些声称积极进取的公司更有可能说他们正在寻求改善客户参与度。”

199IT.com原创编译自:Gartner 非授权请勿转载

]]>
Stateof.ai:2019年AI报告 //www.otias-ub.com/archives/905821.html Wed, 07 Aug 2019 21:54:50 +0000 //www.otias-ub.com/?p=905821 Stateof.ai发布了“2019年AI报告”。

面部识别用户体验:减少日常消费者用例的摩擦

在中国,人脸识别技术已经开始应用。人们在店内刷脸支付,在机场获得航班详情等。

中国网络巨头扩展到农牧业

阿里巴巴和京东都进入了畜牧业和昆虫养殖业,包括养鸡、养猪和蟑螂养殖。并在养殖过程中利用人工智能收集和分析数据。

中国企业AI研发支出快速增长,但总额仍然落后。中国企业的研发支出同比增长34%,但美国企业仍占全球科研支出的61%。

从数据来看,中国芯片销售和采购在快速增长,但是购买远高于销售。

在过去的3年里,一些中国工业企业40%的劳动力已经实现自动化。这在一定程度上是因为中国的机器人年装机量自2012年以来增长了500%(欧洲为112%)。但是,目前还不清楚这些安装的机器人在多大程度上运行AI软件,或者对AI的普及做出了贡献。

京东的上海配送中心使用自动化仓库机器人,每天组织、拣选和发货20万份订单,该设施仅由4名工人管理。京东的仓库数量和面积同比增长45%。

2018年有33家中国公司在美国交易所进行IPO,(比去年同期增长2倍),接近2010年的历史最高水平。2018年,美国共有190宗IPO。

中国团体拥有最多的AI专利,但2017年只有23%是“发明专利”。

91%的5年设计专利和61%的5年实用新型专利被放弃。相比之下,维护费用按照5年的美国专利的85.6%支付。

中国已经发布了比美国更多的机器学习方面的研究。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
大数据文摘:细数机器学习在金融领域的七大应用 //www.otias-ub.com/archives/902066.html Thu, 04 Jul 2019 02:54:35 +0000 //www.otias-ub.com/?p=902066 本文来源:大数据文摘出品    编译:刘兆娜

机器学习是市场的新趋势,新油田,新黄金!从概念价值的角度来看,把机器学习与任何创新相比都不为过。但是它在金融领域如何发挥呢,应用的现状又到了什么阶段呢?

我们都知道,银行存储了全部的信息,包括客户的交易记录,与客户的沟通信息,内部信息,这些信息占用的存储空间已经达到了Tera级,有些甚至到了PB级。现在,大数据技术可以解决像这样的大规模数据存储和处理的问题:数据量越大,就越能够探查到客户的需求和行为模式。在大数据的基础之上,通过人工智能和机器学习算法,利用相关软件学习客户的行为并做出自主决策。

是不是感觉很厉害?接下来我们就看一下,看看机器学习和大数据能够为金融带来什么样的力量。

机器学习在金融行业的应用案例

确定银行最佳选址

信息是21世纪的黄金,机器学习和大数据技术利用信息来呈现客户的重要信息。在融资方面,收集每个客户的信息是必须要做的事情。最常见的例子是在ATM上进行的常规操作。银行通过采集并处理客户的所有操作信息来预测客户的行为,在下次访问时,客户无需再进行搜索和输入号码,点击一个按钮就能够立即进行常规操作。

使用大数据获得的信息可用于创建和操作引擎,从而用来确定开办实体银行的最佳位置。金融机构收集一个城市中客流量最大的一些区域,访问这些区域的时间,客户所在的商店,最大和最小客户数量的信息。通过对这些信息的处理预测,选择获益最大的位置来开办实体银行(顺便说一句,不只是银行可以采用这种方式选址)。选址对企业或商户的收益如此重要,你肯定也会觉得这是一个非常好的应用场景。

通过机器人投资顾问为客户寻找最佳解决方案

机器人投资顾问就像没有自我意识的虚拟助手。机器人投资顾问本质上是在考虑客户盈利目标和风险承受能力的前提下,为客户选定和调整金融投资组合的一系列算法。

以下是机器人投资顾问如何运作的一个示例:客户输入其目标(例如,在60岁时退休,节省300,000.00美元),年龄,收入和当前金融资产情况。机器人投资顾问为了实现客户的目标,通过机器学习算法在不同的资产类别和金融工具之间进行投资的配比。

目前,提供这类服务的公司有:Betterment、Schwab Intelligent Portfolios。

将算法交易转变为智能交易

算法交易是这样一种交易,它可以利用软件根据预先设定的交易标准(如时间,价格,交易量等),下达交易订单。算法交易允许在没有人为干预的情况下进行交易。

机器学习技术提供了一套新的多样化工具,使算法交易不仅仅能够自动化执行。在机器学习(ML)的情况下,算法可以通过学习其他算法(即规则)的目标,并基于数据实现目标,例如最小化预测误差。机器学习算法的设计能够通过分析历史市场行为,确定最佳市场策略,使交易预测更准确。

目前,提供这类服务的公司有:Renaissance Technologies、Walnut Algorithms。

风险管理和反欺诈

风险管理和反欺诈是目前银行最热门的2个主题,这类项目首先应用机器学习和大数据等创新技术来解决。银行通过机器学习和大数据技术,计算所有可能的风险和欺诈者,并在第一次怀疑时丢弃它们。

机器学习驱动的欺诈检测系统的主要优点是它不只是遵循风险因素清单 – 还能够积极地学习和校准新的潜在(或真实的)安全威胁。

应用机器学习技术,系统可以检测特殊或异常的行为,并为安全团队标记它们。欺诈检测系统面临的挑战是避免误报, 被标记为“风险”的风险不是真正的风险。

目前,提供这类服务的公司有:Kount、APEX Analytics。

延长客户对银行服务的依赖

除了访问用户经济活动数据之外,银行还通过获取外部数据,如来自社交网站的数据或客户在线行为的分析,并将这些信息添加到客户的行为体系中。通过这些大数据信息的分析,银行能够挖掘大量新的机会。例如,如果客户在评论中讨论到可能购买新车,银行就可以提供客户想要的贷款优惠策略,并立即通过电子邮件发送给他。

决定与客户的最佳沟通方式

不同客户偏好使用的沟通方式是不同的,例如社交媒体,电子邮件或即时消息。银行必须选择与不同客户沟通的最佳方式,并通过客户偏好的方式发送提醒,新的产品推送以及联系客户。这样,不光客户能够及时了解到银行的消息, 银行也能减少通过其他方式联系客户的费用。

客户流失预警

通过分析关于客户的内外部数据,可以预测客户是否有流失风险。例如,如果客户长时间没有访问银行的分支机构,不登录网站,也没有订阅社交网站中银行的其他更新,则可以预测客户可能会流失。这种情况下,银行通过推荐客户想要的产品或优惠来留住客户是非常重要的。

]]>
Indeed发布了AI 人才就业报告:机器学习工程师年薪 98 万,但 AI 就业增幅正在下降! //www.otias-ub.com/archives/902061.html Thu, 04 Jul 2019 02:46:14 +0000 //www.otias-ub.com/?p=902061 来源:CSDN  作者 | 唐小引

人工智能这股技术热潮风起两年,国内外众多企业纷纷「AI First」,随处可见百万年薪、人才巨大缺口,无论国内外,AI 人才招聘需求都可以用「疯涨」来形容。据猎聘此前统计,「2017 年 AI 技术类工程师的招聘量是 2014 年的 8.8 倍,数据类工程师的招聘量则是 2014 年的 5.9 倍,人工智能相关岗位在技术人才招聘中的总比例从 10.83% 涨到 27.45%,是技术岗位中增幅最大的领域。」

到了 2019 年,人工智能人才就业情况发生了明显的变化,国际知名招聘平台 Indeed 于日前发布了 AI 人才就业报告,显著地指出了从 2018 年下半年到今年上半年 AI 类就业情况,接下来,我们一起来看。

人工智能就业增长放缓,就业兴趣下降

截止目前,人工智能的工作岗位依然在增加,相比去年,AI 类岗位增长了 29.1%。不过,这一增幅却大大低于了前两年:

2017 年 5 月至 2018 年 5 月期间,人工智能的工作岗位上升了 57.9%;2016 年 5 月至 2017 年 5 月期间,上升高达 136.3%。与此同时,对于 AI 类岗位,求职者的兴趣也有所下降,据 Indeed 统计,在过去的一年里,人工智能相关工作的搜索量减少了 14.5%。

2016 年 5 月至 2017 年 5 月,搜索量增长 49.1%;2017 年 5 月至 2018 年 5 月,搜索量增加了 32%。

AI 工作热榜:机器学习工程师稳居第一!

同时,Indeed 还分析了过去一年里人工智能和机器学习比例最高的相关职位,结果显示,机器学习工程师以 75% 稳居第一,深度学习工程师 60.9% 紧随其后,第三名则被资深数据科学家以 58.1% 拿下。

尽管机器学习工程师毫无疑义地居于第一,但和去年相比却也是大幅下降,在 2018 年,机器学习工程师占比高达 94.2%,也直接对应了前文所说的「人工智能就业增长放缓」现状。

并且值得注意的是,深度学习工程师是第一次出现在第二的位置,Indeed 如此说道:「深度学习工程师开发可以模拟大脑功能的编程系统以及其他任务,这些工程师是自动驾驶、人脸识别和机器人这三项正在快速发展的领域的重要参与者。据 Marketsandmarkets 的研究显示,全球面部识别市场将有望从 2019 年的 32 亿美元增长至 2024 年的 70 亿美元。」

哪类 AI 工作最赚钱?机器学习工程师高居榜首!

薪资可以说是程序员最关注的话题,而人工智能之所以能够实现奇货可居很大程度上也是高薪资使然。

据 Indeed 数据显示,机器学习工程师不仅是所有 AI 类招聘中数量最多的,还是薪资最高的,以 142,858.57 美元(约合人民币 98 万)高居榜首。并且,与去年相比,机器学习的平均年薪还增长了 8409 美元(约合人民币 5.7 万元)。

 

平均年薪同样上涨了的还有算法工程师,以 109,313.51 美元(约合人民币 75 万元)居于第 5,比去年增长了 5201 美元(3.5 万元人民币)。

AI 威胁论:AI 能创造出比它取代的更多的工作机会吗?

从人工智能风起开始,关于它的威胁论便一直不绝于耳。AI 是否能够创造出比它取代的更多的工作?Indeed 对这个问题予以了肯定的回答。

同时,据 Gartner 预测,到 2020 年,人工智能将减少 180 万个岗位,但将创造出 230 个新的工作岗位,而据邓白氏(Dun&Bradstreet)报告,40% 的组织由于采用了人工智能反而增加了更多的工作岗位,只有 8% 的组织因为新技术而裁员。

Indeed 报告:

http://blog.indeed.com/2019/06/28/top-10-ai-jobs-salaries-cities/

]]>
Cognilytica:到2023年AI和机器学习数据准备解决方案市场达12亿美元 //www.otias-ub.com/archives/857867.html Fri, 19 Apr 2019 16:36:23 +0000 //www.otias-ub.com/?p=857867 Cognilytica在最新的调查中评估了数据准备解决方案、数据工程解决方案和的数据标签解决方案需求。数据准备解决方案旨在清理、增强和以其他方式增强用于机器学习的数据。数据工程解决方案旨在为企业提供移动的和处理大量数据的方法。数据标签解决方案旨在使用机器学习培训模型中所需的注释来增强数据。

主要调查结果:

2018年,人工智能和机器学习数据准备解决方案的市场价值超过5亿美元,到2023年底将增长到12亿美元。

数据准备和工程任务占大多数人工智能和机器学习项目时间的80%以上。

2018年第三方数据标签解决方案的市场价值为1.5亿美元,到2023年将增长到10多亿美元。

每1美元用于第三方数据标签,就有5美元用于内部数据标签。2018年支出超过7.5亿美元,到2023年底将增加到20多亿美元。

每1美元用于第三方数据标签解决方案,就有2美元用于内部数据工作,以支持或加强这些标签工作。

与物体/图像识别、自动驾驶以及文本和图像注释有关的人工智能项目是数据标签工作中最常见的。

在未来两年内,所有竞争对手的数据准备工具都将以机器学习增强智能作为核心。

数据标记和AI质量控制在短时间里不会消失。

199IT.com原创编译自:Cognilytica 非授权请勿转载

]]>
机器学习的数学焦虑 //www.otias-ub.com/archives/795985.html Wed, 14 Nov 2018 09:25:13 +0000 //www.otias-ub.com/?p=795985
开始机器学习之旅,需要什么层次的数学功底? 尤其是对于那些没有学过数学和统计学的同学们来说,这个问题当前不甚清楚,在这篇文章中,我将要为那些使用机器学习技术来开发产品或做学术研究的人们提供一些数学背景方面的建议。这些建议源于我与机器学习工程师、研究人员和教育工作者的对话,以及我在机器学习研究和产业方面的独到经验。

为了构造(机器学习中)数学的背景,我会先讲一些与传统课堂不同的思维模式和策略。然后,我会概述不同类型机器学习工作所需的具体背景,毕竟机器学习涉及的学科范围太广泛了(它涵盖了高中级别的统计和微积分,也涵盖了概率图形模型(PGM)的最新进展)。

我希望读者们在读到文章的最后时,能够知道自己有效使用机器学习所必需的数学知识。

作为这篇文章的前言,我想说:对于不同学习者的个人需求或目标来说,学习的风格、架构和资源都应该是独一无二的!

数学焦虑症的小贴士

    事实证明,很多人——包括工程师——都害怕数学。首先,我想谈谈“擅长数学”这类传说。

事实是,擅长数学的人都做过大量的数学练习。因此,在研究数学问题被卡住时,他们依然能够“风雨不动安如山”。如最近的研究所示,学生的心态,而非先天才能,才是预测一个人学习数学的能力的主要因素。

要清楚的是,要达到这种境界,需要时间和精力。这显然不是你天生就有的能力。本文的剩余部分将帮助您确定所需的数学功底,并概述构建它的策略。

万事开头难

    作为软性先修数学条件,我们假设你对线性代数/矩阵微积分都有了解,这样你就不会为奇怪的符号苦恼。同时我们还假设你有基础的概率知识。我们鼓励你拥有基本的编程能力,这是领悟机器学习中的数学的有力工具。之后,你可以根据你感兴趣的内容调整你的学习重点。

如何在课外学习数学?

    我相信学习数学的最佳方式是以学生的身份全职学习。脱离了学校的环境,你可能不太容易获得系统的知识结构、正能量的同学压力和其他可用资源。

为了在课外学习数学,我建议大家将学习小组或午餐研讨会作为学习的重要途径。在研究型的实验室中,这可能以阅读小组的形式呈现。在构建知识结构方面,你的小组可以把教科书各章节过一遍,并定期对课程进行讨论,同时通过Slack平台的途径参与远程问答。

这里,企业文化发挥着重要的作用——这种“额外”的研究学习应该受到管理层的鼓励和激励,而不是被视为影响产品交付的消极怠工行为。事实上,虽然短期内会花费一些成本,但是构建同伴驱动的学习环境可以使你在长期的工作中更有效率。

数学与代码

    在机器学习工作流程中,数学和代码紧密结合。代码通常直接由数学直觉构建,有时它甚至会和数学符号使用相同的句法。事实上,现代数据科学框架应用(例如NumPy)使得数学运算(例如矩阵/矢量积)与可读代码之间的转换变得直观和有效。

我鼓励你将编写代码作为巩固学习的一种方式。学习数学和编写代码都依赖于你对问题理解和表述的精准程度。例如,手动编写损失函数或优化算法,就是真正理解这些基础概念的好方法。

让我们来探索一个实际的问题:在你的神经网络中实现ReLU函数激活的反向传播(是的,即使Tensorflow / PyTorch可以替你做这个!)。这里简单介绍一下,反向传播是一种依赖于微积分链式规则来有效计算梯度的技术。为了在这个问题设定下使用链式规则,我们将上游导数与ReLU函数的梯度相乘。

我们先将ReLU激活函数进行可视化(就是下图的样子),然后这样定义这个函数:

为了计算函数的梯度(直观来说就是斜率),你可以想象出这样一下分段函数,如下面的指示函数所示:

    NumPy为我们提供了有用且直观的语法——我们的激活函数(蓝色曲线)可以通过代码表述出来,其中x是我们的输入,relu是我们的输出:

relu = np.maximum(x, 0)

ReLU函数的梯度函数(红色曲线)可以如下所示,grad表示上游梯度:

grad[x < 0] = 0

在没有首先自己推导梯度公式的情况下,这行代码可能没有任何意义。在我们的代码中,对于满足[h <0]条件(即x<0)的所有元素,将其对应上游激活函数的梯度(grad)数值设置为0。在数学上,这实际上相当于ReLU梯度函数的分段表示,所有x轴上小于0的数值,当乘以上游梯度时,它的值会变成0。

正如我们所见,通过我们对微积分的基本理解,我们可以清楚地理解代码的含义。

构建机器学习产品必需的数学知识

    为了介绍这一节,我与机器学习工程师进行了交谈,确定了数学在调试系统时最有力的地方。以下是工程师基于数学见解回答的问题示例。

如果你还没有遇到过它们,请不要担心。希望本节能够为你提供一些特定问题的相关内容,也许你也会遇到类似的问题并尝试解决哟!

Q:我该用哪种聚类方法可视化高维的客户数据呢?

A:PCA或者tSNE。

Q:我该如何校准用来阻隔虚假用户交易的安全阈值(例如在0.9或0.8的置信水平下)?

A:可以使用概率校准(Probability calibration)。

Q:描述我卫星数据在世界特定地区(如硅谷与阿拉斯加州)的偏差的最佳方法是什么?

A:这是一个开放的研究型问题。也许可以基于“人口平价”(demographic parity,该方法是要求预测必须与某特定敏感属性不相关)的原则展开。

通常,统计和线性代数可以通过某种方式应用于这些问题中的任何一个。但是,要获得满意的答案通常需要针对特定领域的方法。如果是这样的话,你如何缩小你所需学习的数学范畴呢?

定义一个系统

    我们并不缺乏资源(例如数据分析使用scikit-learn,深度学习使用keras)去帮助我们进行系统建模。而在建模之前,我们需要围绕将要被建模的系统考虑这些问题:

系统的输入/输出分别是什么?

应该如何准备好合适的数据格式,从而适应系统要求?

如何进行特征建模或数据整理,以便于模型的推广?

如何为需要解决的问题设定合理的目标?

你会惊讶地发现——要定义一个系统,其实非常复杂。而搭建数据工作流(data pipeline)也并不容易。换句话说,构建一个机器学习产品需要进行大量的繁琐复杂的工作;而这些工作并不需要太深的数学背景。

数学需要“按需学习”

    当你一头扎进一个机器学习的任务中时,会发现其中有些步骤对你来说难以进行,这种情况在进行算法调试时尤为常见。当你停滞其中时,是否知道该如何解决这一窘境呢?你设定的权重是否合理?

为什么模型没有按照某个损失定义进行收敛?衡量成功的正确指标是什么?此时,有一些方法可以帮助到你:对数据做出假设、以不同方式约束优化、或尝试不同的算法。

通常,你会发现建模/调试过程中需要数学直觉(例如,选择损失函数或评估指标),这些直觉可能有助于做出明智的工程决策。 这些是你学习的机会!

来自Fast.ai的Rachel Thomas是这种“按需”方法的支持者——在教育学生时,她发现对于深度学习的学生来说,让他们对将要学习的内容感到兴奋更为重要。之后,针对这些学生的数学教育即可“按需”填补之前未涉及的知识漏洞。

    接下来我将介绍对研究性工作中的机器学习方法有用的数学思维方式。批判性的观点认为,机器学习研究方法就像是就像是“拿来主义”,人们只是通过把更多运算扔进模型中,从而获得更好的预测表现。在一些圈子里,研究人员对实证研究方法仍然持怀疑态度,认为这些方法缺乏数学上的严谨性(例如某些深度学习方法),这些方法是不能将人类智慧发挥到极致的。

值得关注的是,研究界是建立在现有系统和假设的基础上,而这些系统和假设可能不会扩展我们对该领域的基本理解。研究人员需要提供新的基本模块,供我们在该领域中获取全新洞察力和方法。

这可能意味着我们需要像“深度学习教父” Geoff Hinton在他最近的Capsule Networks论文中所做的那样 ,重新思考构建某些领域的基础知识(如应用于图形分类的卷积神经网络)。

为了迈出下一步,我们需要提一些基本问题。这需要在数学方面的极度熟练——深度学习一书的作者Michael Nielsen称之为“有趣的探索”。这个过程涉及数千小时停滞、提问、重新思考问题以探索新观点。

“有趣的探索”使科学家们能够提出深刻,富有洞察力的问题,而不仅仅是简单的想法或架构的结合。显而易见,想要学会机器学习研究领域内需要的所有知识,是不可能的任务!要正确地进行“有趣的探索”,你需要遵循自己的兴趣,而不是为最热门的新结果感到焦虑。

机器学习研究是一个非常丰富的研究领域。当然,它在公平性、可解释性和可获得性方面也存在亟待解决的问题。在所有科学学科中都是如此,基本思维的获得并不能一蹴而就。要在解决关键问题所需的高水平数学框架的广度进行思考,需要长期的耐心。

将机器学习研究“大众化”

希望我没有把“研究数学”描绘得太深奥,因为这些通过数学而产生的思考应该以直观的形式呈现!可悲的是,许多机器学习论文仍然充斥着复杂且不一致的术语,使关键的直觉难以被辨别。作为一名学生,你可以尝试将密集的论文翻译成容易被直观理解和消化的小块文章,通过博客和推特等发表,这将对你自己和这个领域大有裨益。你甚至可以从distill.pub中找些例子,当作解释机器模型研究方法结果的读物。换句话说,将技术思想的祛魅化作“有趣的探索”手段——你自己的学习(和机器学习Twitter)会感谢你的!

主要领悟

   总的来说,我希望这篇文章为你提供了一个思考研究机器学习所需数学教育的开端。

不同的问题需要不同程度的直觉,我鼓励你首先弄清楚你的目标是什么。

如果你希望构建产品,请通过问题寻找同行和学习小组,并深入研究最终目标,激发你的学习。

在研究领域,广泛的数学基础可以为你提供工具,通过提供新的基础知识来推动该领域的发展。

来自:机器学习研究会订阅号
]]>
从统计机器学习视角理解深度学习:算法、理论与可扩展计算 //www.otias-ub.com/archives/776043.html Sun, 23 Sep 2018 16:59:27 +0000 //www.otias-ub.com/?p=776043 如何将深度学习等AI算法应用到实际场景里,不是一件容易的事情。 2016年,卡耐基梅隆大学计算机科学院的终身教授邢波(Eric Xing)在匹兹堡创办了Petuum,他致力于创建一个平台,通过自定义的虚拟化和操作系统构建机器学习和深度学习应用程序,为企业提供所需的机器学习工具。结合Petuum, 邢波教授在7月份深度学习夏令营分享了关于从统计机器学习视角理解深度学习的算法、理论与可扩展计算, 这一份Slides 286页, 非常全面, 是一份结合学术研究和实际应用的详实参照学习材料,不可不看.

 

统计机器学习视角下的深度学习:算法,理论,可扩展计算

这一份286页的教程slides从统计机器学习视角阐述了深度学习的算法、理论和分布式深度学习架构,内容丰富详实。首先一观邢波教授创立的Petuum人工智能/机器学习架构图,分别包含平台硬件层、系统层、实现层、算法层、模型层和任务应用层。

作者:邢波(Eric Xing)

邢波(Eric Xing)是卡耐基梅隆大学教授,曾于2014年担任国际机器学习大会(ICML)主席。主要研究兴趣集中在机器学习和统计学习方法论及理论的发展,和大规模计算系统和架构的开发。他创办了Petuum 公司,这是一家专注于人工智能和机器学习的解决方案研发的公司,腾讯曾投资了这家公司。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
政策扶持加码人工智能 创业者看好行业细分 //www.otias-ub.com/archives/836172.html Sun, 26 Aug 2018 14:59:08 +0000 //www.otias-ub.com/?p=836172 近年来,从中央到各大部委、到地方,对人工智能和大数据的扶持政策持续加大力度,深圳市这两年公布的相关扶持政策就超过20个,覆盖机器人、可穿戴设备、创客和智能装备、新能源、节能环保等诸多产业和新兴领域。

政策利好,从业者也铆足劲大展拳脚。有创业者就看好人工智能应用的行业细分,锁定一个领域做细做精。

“人工智能与实际应用相结合,应往劳动密集型领域首先推进应用。”蒋志皓是在通讯行业较早接触人工智能领域的从业人员,他在国内电信巨头公司有十多年技术经验,参与开创国内电信运营商对客户提供呼叫中心信息化服务和技术外包业务的先例,亲历了人工客服到智能客服转换的时代。

今年年初,蒋志皓创办了自己的科技公司,凭着在智能化通讯领域技术和业务能力的多年积累,蒋志皓从筹备团队之初就决定深耕人工智能应用于特定细分领域,以智能语音客服为核心技术,以外包服务为主要业务模式,服务于金融行业。

“人工智能是一套基础理论,一套泛泛的理论和算法实际上是无法做出一个广谱型服务的产品的,而将产品定位于

某一个特定的细分行业,在这个行业里做精做专,会更有可能成功,但是过程依然会相当的艰难。”尽管艰难,蒋志皓仍有信心去挑战。从2016年起,他就一直在筹备创建公司,为掌握更多行业信息,他到美国、澳洲等地调研。2017年11月,他特意去了一趟美国,邀请了几个UCLA毕业的工程师加入团队。今年春节刚过,他踏上了澳洲之行,一路考察,一路与国内研发团队电话会议,及时将最新信息同步给团队。几年前,蒋志皓回到他的母校北京邮电大学修读电子与通信工程硕士课程,获得了硕士学位,且在今年跟母校开展了校企的联合智能语音和语义算法合作研究,为他的公司提供基础学术领域的科研能力保障。

人工智能是新一轮科技革命和产业变革的重要驱动力量,未来人工智能将会像互联网一样持续渗透到各个行业和领域,在劳动密集型的某些细分领域行业将会很快得到重大的商业应用和突破,蒋志皓对此深信不疑。他表示,人工智能依赖于深度学习,需要大量的数据来进行训练,专业领域的数据各不相同,因此就算再厉害的算法能力,也不能涵盖各行各业,而在某一个特定的细分领域,通过不断的数据积累和应用场景训练,更有希望可以到达更高的技术高度,在产品和企业运营方面做成行业标杆。

“目前人工智能发展劲头十足,但总体的技术还存在很大的局限性。人工智能的理论研究发展到现在的水平,在商业应用上只相当于5岁孩子的智商,但是市场的需求的产品要具备18岁成人的智商才能服务到位,所以目前人工智能够成功商业化的领域非常狭窄。”虽然人工智能应用面已经越来越广泛,但产品的能力和深度还远远不够,因此蒋志皓认为可以在呼叫中心行业通过人机协同来提高效率,降低人类的工作量,这是商用效果较为直观的应用领域。

“通过机器学习和人机结合,机器人从一点点工作开始逐步替代人工,替代的比例随着数据量和系统能力会逐步提高,从1%到2%,到5%,再到10%,未来甚至提升到50%……,每提高1%的机器能力,其对于劳动密集型企业繁重和重复工作量释压,所产生的巨大社会正向效应都能非常直观,这个训练学习提升的过程就是人工智能与行业融合应用不断加深的过程,是必然趋势,我们的工作就是要推进这个进程。”

在蒋志皓看来,相较于其他领域,人工智能语音在客服领域的商业应用发展得要快一些。根据前瞻产业研究院数据,截至2017年中国智能语音市场规模达到105.7亿元,与2016年相比增长70%。随着智能语音应用产业的拓展,市场需求增大,预计今年中国智能语音市场规模将进一步增长,达到159.7亿元。利用智能语音客服系统等AI技术,通过对数据信息的高效处理,帮助企业减少人力成本、改善经营效率,提高用户使用体验,这是蒋志皓创办深圳市守卫者智能科技有限公司的初衷。在守卫者创立之初,蒋志皓废寝忘食带领团队迎难而上,在短短的几个月时间里,守卫者智能科技联合北京邮电大学研发了自有知识产权的智能语义理解引擎,并在智能语义理解的基础上研发了自主知识产权的智能知识库、语音质量检验分析系统、智能对话系统能产品。产品很快被国内一些大型商业银行和保险公司的采购,在这些大型金融机构的POC测试中,守卫者智能对话准确率超过了93分,语音质检模型准确率最高超过95分,在包括多个国内大型互联网公司一起参与的金融机构POC测试中,守卫者智能的产品多项指标名列第一。

“整个智能语音技术已经较为成熟,但应用到不同的行业和场景,就要定制不同的系统模式,这中间有很多要解决的问题。举个例子,医疗行业、金融行业的智能语音服务就截然不同。”蒋志皓认为,人工智能语音的下一个发展阶段必然是行业细分,在应用细分方面,他对守卫者业务定位十分清晰——在金融行业的智能语音客服这个垂直领域深入去做,做深、做扎实,通过不断的业务拓展和技术更新,持续积累金融行业数据,使算法更完善、更精准,同时通过业务运营,让金融企业比他们的客户更懂得客户自身的需求。

通讯员:小夏

]]>
不止步于云计算全球一哥:AWS正加快机器学习、人工智能普及化平台步伐 //www.otias-ub.com/archives/760600.html Wed, 15 Aug 2018 06:14:18 +0000 //www.otias-ub.com/?p=760600 199IT讯 自2006年业务上线,12年来AWS一骑绝尘,甩开微软和谷歌,在IaaS(Infrastructure as a Service基础设施即服务)行当成为当之无愧的大哥。同时在云存储、组网、计算、数据库等方面,AWS也已成为行业领导者。

据亚马逊AWS全球副总裁、大中华区执行董事容永康给出的数据,AWS 2018年第二季度的营业额已经增加到61亿美金,同比增长49%,年化收入预计超过240亿美元。数百万活跃客户大部分都是企业客户,分布全球190多个国家。

(图:亚马逊AWS全球副总裁、大中华区执行董事容永康 来源:199IT)

也许在旁人看来,AWS的确可以高枕无忧了。自有亚马逊的电商业务,视频行业Netflix和Prime视频等标杆客户已经让AWS极具想象空间。当然,AWS并不想止步于此。

无人机物流配送、Amazon Go 无人商店、智能音箱Echo等等这些新奇好玩的商业创新背后,AWS功劳居功至伟。

(图:亚马逊首席技术执行官沃纳·威格尔(erner Vogels) 来源:199IT)

亚马逊首席技术执行官沃纳·威格尔(Werner Vogels) 称,大概12年之前,AWS深知云将给软件开发带来翻天覆地的变化,大家都需要全新的工具。而AWS希望与软件开发者密切合作,打造出一个现代化的软件开发框架。因此,AWS不会给开发者一个预制好的房子,而是给开发者一个巨大的工具箱,在里面开发者可以挑选需要的工具,从而开发自己的软件。

时过境迁,在人工智能时代,AWS同样延续这一发展思路。AWS希望将机器学习的能力交付给每一位开发人员与数据科学家。

沃纳·威格尔(Werner Vogels)非常自豪于AWS上过去一年机器学习的使用井喷,达到250%的增长率,“而且在全球AWS平台之上,可以说全球这种机器学习的工作负载十个就有八个是在AWS平台之上运行的。如果要推动机器学习的普及化的使用,我们就需要做一些改进。因为机器学习需要全新的堆栈。”

目前,AWS上有框架、TensorFlow、Caffe等等,在此之上,AWS打造了一个叫SageMaker的平台,让每一位开发人员都能够通过算法获得机器学习的能力,如果只是用预制的模型,AWS提供有各种各样的服务。

沃纳·威格尔(Werner Vogels) 介绍称:“我们再来看一下机器学习的流程,首先要选择数据、挑选算法,然后做培训。培训就是要调整算法的参数,直到你获得的输出能够达到足够的准确度,就是达到你设定的门槛值。然后你把这个输出的模型进行部署,把它部署在多个可用区上,让模型可用。所有的这些组件我认为都是属于一些繁杂的工作。其实和机器学习本身并没有太多关系,80%的你做的工作都是一些所谓的没有差分性的苦活、累活。所以我们想把这个转过来,80%你们的工作应该是机器学习本身,而一点点只是那些繁杂的工作。SageMaker能够帮助你解决那些繁重的苦活累活。而你来选择任何你想用的算法,我们做一键式培训,你来选择要做算法测试的参数以及准确门槛值,输出的是模型,我们提供一键式模型部署,然后把它在多个AZ部署,这就是Amazon SageMaker的绝对革命式的机器学习普及化的平台服务。”

在过去6个月时间,AWS已经开发了机器学习方面100多个新的功能和新服务。就整体而言,2017年AWS推出的新的服务、新的功能,达到1400多项。单单在2018年第一季度已经推了大概400多个。

“AWS有数以万计的客户,在平台之上使用机器学习。比如在中国,我们有一家客户是开发无人车驾驶的,他们开发了一个非常复杂的,是用的Apache开源的框架来开发的,就是在AWS平台之上进行的技术开发。”据了解,自动驾驶公司图森未来、Monmenta等都在使用AWS的服务。

对于自动驾驶领域,虽然去年《华尔街日报》有传出亚马逊已经专门组建了一个团队,专注于无人驾驶技术,以帮助零售业在交通运输的变革中占据先机。

(图:AWS全球技术与开发者布道师团队负责人Ian Massingham 伊恩·马幸哈姆 来源:199IT)

但AWS全球技术与开发者布道师团队负责人Ian Massingham (伊恩·马幸哈姆)对199IT表示,“对于亚马逊或者AWS自身来说,我们绝对不会说自己来参与开发具体的自动驾驶的系统。因为我们是不会有非常可视性的所谓个人方面驾驶的数据的收集,我们也拿不到。但是我们有很多客户,比如图森,它在美国已经完成了250万英里的自动驾驶卡车的路测。同时我们和宝马等公司,为他们提供服务,帮助他们来开发自己的自动驾驶系统。

针对类似于像自动驾驶这样一些系统开发的需求来说,AWS提供一个大量数据输入、视频捕获、视频流传输的服务。“我们把它称之为Amazon Kinesis Video的服务,什么意思呢?我们可以把大量的视频流捕获,然后把它帮你们进行传输,并且把它打上时间码,你以后可以用注释应用来对它进行注释。同时还有一个Snowball的服务,它是可以以百态字节的体量,来帮助你传输大量的数据。其实不光是自动驾驶的开发,对于油气行业,对于很多其他的比如安全监控方面,都是一种非常好的数据传输的服务。”Ian Massingham (伊恩·马幸哈姆)介绍到。

在机器学习、人工智能甚至自动驾驶方面,AWS延续此前一贯思路,通过给开发者提供强大的工具库,通过自有的算法模型以及开源的算法模型,AWS正在抢占AI时代的战略高地,提供普及化的平台服务。

在全球化越来越热的机器学习、人工智能、自动驾驶的掘金浪潮之路上,AWS想做那个通盘赢家——卖水者。

 

 

 

]]>
腾讯QQ大数据:机器学习建模问题中的特征构造方法 //www.otias-ub.com/archives/758115.html Tue, 07 Aug 2018 05:09:39 +0000 //www.otias-ub.com/?p=758115 导语 在机器学习建模问题中,合适特征的构造对于模型的性能至关重要,看到很多同学介绍特征工程,包括特征的预处理和特征筛选等,这些非常重要,但是特征预处理和特征筛选的前提是要有基础特征,而这些特征从哪里来,又如何构造?现在总结一下在推荐系统中比较通用的特征构造方法。

场景分析:

推荐场景一般可以抽象为:内容(Item)和受众(User),其中内容主要是指要推荐的Item,在购物场景中Item就是商品,歌曲推荐中Item就是歌曲,受众是访问当前场景的用户,一般是自然行为人;推荐模型一般是计算不同的User-Item对的得分,这个得分反映的是用户点击当前物品的概率,获取得分最高的Top n的Item推荐给用户,所以整个特征关联模型可以抽象为如下图-1所示:

图-1 推荐系统关系模型

其中,可以分解为如下几部分:User-Item特征、User特征、Item特征、User-Item属性分布特征,下面具体阐述每种特征的构造方法。

User-Item特征:

User-Item特征主要从三个维度来刻画User对Item的“兴趣”,如图-2所示:

图-2  User-Item类型的特征构造

1)时间序列上的统计特征:

统计特征从四个角度(绝对值,相对值,是否感兴趣和深度感兴趣)来刻画User对Item的“兴趣”。比如,时间序列中User累积对某个Item的行为次数就是User对Item的绝对兴趣值:如果时间序列分为:一天、三天、一周(实际中时间还需要继续拉长一点来刻画用户长期的兴趣),行为是“点击”。那么这一个特征构造语句就可以翻译成三个不同的特征:分别是最近一天,三天和七天用户对每个Item的点击次数;时间序列上User对Item是否有重复的行为用来刻画和区分哪些Item是对User有深度吸引力的,如果在一段时间上只发生了一次行为,那么很可能User对这个Item并没有兴趣,只是随便看看;时间序列上User对Item是否有行为,用来刻画User过去某一段时间用户的关注点在哪里,对哪些是可能喜欢的,和上面的一条特征的区别在于可以涵盖用户可能比较感兴趣的Item并且这样用户兴趣特征也会更加丰富。

2)时间特征:

时间特征从三个角度(最近时间,行为频度,行为稳定性)来刻画用户对于Item的兴趣在不同时间上的活跃度。比如,User对Item的最后行为时间,可以翻译成一个时间特征,可以将这个时间进行归一化为一个0—1的标量,越接近于1表示User对这个Item具有越强的新鲜度;User对某个Item的平均行为时间间隔用来刻画User对Item的活跃频率,时间间隔越小说明对用户的吸引力越大。User对Item的行为时间间隔方差可以用来刻画User对Item的喜好的稳定性。

3)趋势特征:

趋势特征主要刻画用户对某个Item的兴趣趋势。比如,User一天对Item的行为次数/User三天对Item的行为次数的均值,表示短期User对Item的热度趋势,大于1表示活跃逐渐在提高;三天User对Item的行为次数的均值/七天User对Item的行为次数的均值表示中期User对Item的活跃度的变化情况;七天User对Item的行为次数的均值/ 两周User对Item的行为次数的均值表示“长期”(相对)User对Item的活跃度的变化情况。

User特征:

User特征主要包括用户的属性特征以及从多个方面刻画用户的“活跃度”,User类型的特征构造方法如图-3所示:

图-3  User类型的特征构造

时间序列的统计特征:

主要从三个维度(User总活跃,用户深度活跃,用户对于Item的覆盖度)来刻画用户的活跃。比如,时间序列上User行为次数总和,在划分成三个时间细粒度的情况下,可以翻译成三个特征,分别是一天,三天和七天User的行为总和,来表示User在当前时间段上的活跃。时间序列上User重复行为次数用来刻画用户真实的活跃深度。时间序列上User有行为的Item的数量,可以用来刻画用户的活跃广度,来表示用户是否有足够的意愿尝试新的Item。

1)时间特征:

主要从三个角度(最近时间,行为频度,行为稳定性)来刻画用户的活跃度。比如,User最后行为时间,时间越接近当前时间说明User的活跃度越强;User的平均行为时间间隔用来刻画User的活跃度,时间间隔越小说明User的活跃度越强。User的行为时间间隔方差可以用来刻画User活跃的稳定性。

2)趋势特征:

趋势特征用来刻画User的活跃趋势。比如,User一天的行为次数/User三天的行为次数的均值,表示短期User活跃趋势,大于1表示活跃逐渐在提高;三天User的行为次数的均值/七天User的行为次数的均值表示中期User的活跃趋势;七天User的行为次数的均值/ 两周User的行为次数的均值表示“长期”(相对)User的活跃趋势。

3)属性特征:

主要用来刻画用户的一些属性特征包括性别、年龄、学历以及使用机型等。

Item特征

Item特征主要包括Item的属性特征以及从多个方面刻画Item的“热度”,Item类型的特征构造方法如图-4所示:

图-4  Item类型特征构造

1)时间序列的统计特征:

从三个维度(Item的行为热度,热度趋势和时间间隔)来刻画Item的热度。比如,时间序列上Item行为次数总和,在划分成三个时间细粒度的情况下,可以翻译成三个特征,分别是一天,三天和七天Item的行为总和,来表示Item在当前时间段上的热度。时间序列上Item被重复点击次数用来刻画Item真实的热度深度,尤其在APP的推荐上,重复的使用或者点击说明当前APP对用户的吸引力越强。时间序列上和当前Item发生行为的User的数量(去重)刻画了Item的热度的广度。时间序列上Item的点击和曝光的比值(User不去重)—CTR,刻画了Item在相同曝光下被点击的概率。时间序列上Item的点击和曝光的比值(User去重)—CTR,刻画了Item在相同曝光下被点击的概率,剔除了某些特殊情况某个User对某个Item的行为过于集中的情况。

2)时间特征:

主要从三个角度(最近时间,行为频度,行为稳定性)来刻画Item的热度。比如,Item最后行为时间,表示Item的最近活跃;Item的平均行为时间间隔用来刻画Item的热度,时间间隔越小说明的热度越高。Item的行为时间间隔方差可以用来刻画Item热度的稳定性。

3)趋势特征:

主要刻画Item的热度和CTR的趋势。比如,Item一天的行为次数/Item三天的行为次数的均值,表示短期Item的热度趋势,大于1表示热度逐渐在提高;三天Item的行为次数的均值/七天Item的行为次数的均值表示中期Item的热度趋势;七天Item的行为次数的均值/ 两周Item的行为次数的均值表示“长期”(相对)Item的热度趋势。另外一种特征表示CTR的趋势:其中一天的Item的CTR / 三天Item的CTR表示“短期”Item的CTR趋势信息。

4)属性特征:

主要用来刻画Item的一些属性特征主要包括所属的类别。

User和Item之间的属性分布特征:

主要通过计算在不同时间段上User和Item之间的行为的统计特征:如果当前的User的属性包括:性别、年龄和Device,Item的属性包括:Item_id和类别,那么特征构造方法如图-5所示:

图-5  User和Item之间属性分布特征构造

1)时间序列上Item在Age的分布特征:

通过计算Item在年龄段上的行为数量(User不去重和不去重)来刻画Item在不同年龄段上的热度;Item在年龄段上的行为数量/Item总的行为数量来表示User在年龄上的热度分布;Item在不同年龄段上的点击和Item在相应的年龄段上的曝光之间的比值来刻画Item在不同的年龄段上的CTR。

2)时间序列上Item在Gender的分布特征:

通过计算Item在性别上的行为数量(User不去重和不去重)来刻画Item在不同性别上的热度;Item在性别上的行为数量/Item总的行为数量来表示User在性别上的热度分布;Item在不同性别上的点击和Item在相应的性别上的曝光之间的比值来刻画Item在不同的性别上的CTR。

3)时间序列上Item在Device的分布特征:

通过计算Item在不同Device上的行为数量(User不去重和不去重)来刻画Item在不同Device上的热度;Item在不同Device上的行为数量/Item总的行为数量来表示User在Device上的热度分布;Item在不同Device上的点击和Item在相应的Device上的曝光之间的比值来刻画Item在不同的Device上的CTR。

4)时间序列上User在ItemType上的分布特征:

通过计算User在不同的ItemType上的行为数量来刻画Use对不同的ItemType的喜好,计算User在不同的ItemType上是否有行为来刻画在时间段上User是否对当前的Item的类型感兴趣,计算User的行为在不同的Item上的分布来刻画对不同的ItemType的喜好程度。User在一段时间内,是否在ItemType上有重复行为,来刻画用户是否对当前ItemType深度感兴趣。

5)时间序列上ItemType在Age上的分布特征:

通过计算ItemType在不同年龄段上的行为数量(User不去重和不去重)来刻画ItemType在不同年龄段上的热度;ItemType在不同年龄段上的行为数量/ItemType在年龄段上的用户数量来刻画当前ItemType对这个年龄段的User的吸引程度;ItemType在不同年龄段上的点击和ItemType在相应的年龄段上的曝光之间的比值来刻画ItemType在不同的年龄段上的CTR。

6)时间序列上ItemType在Gender上的分布特征:

通过计算ItemType在不同性别上的行为数量(User不去重和不去重)来刻画ItemType在不同性别上的热度;ItemType在不同性别上的行为数量/ItemType在当前性别上的行为用户数量来刻画当前ItemType对这个性别的User的吸引程度;ItemType在不同性别上的点击和ItemType在相应的性别上的曝光之间的比值来刻画ItemType在不同的性别上的CTR。

上面列举了一些常见属性之间的分布特征,都是User针对Item或者Item针对User的统计分布,这些只是大部分场景中会出现的场景,在具体的业务中可以根据实际可以获取到的属性结合和样本之间的相关性来进行建模。

特征选择:

在实际的业务中,首先需要思考的是如何正确的构建样本对,在恰当的样本对构造的基础上思考和样本标签具有相关性的因素,这些因素包括用户和物品侧,找到这些因素之后才是特征构建,不同的场景和算法情况下需要不同的特征选择:比如说游戏推荐中活跃时长、付费意愿很重要,而弱化了在性别上的分布,因为游戏属于用户粘性比较大的类型,在商品推荐中性别分布和浏览、加购物车行为则同等重要,因为用户的性别和用户之间的兴趣有很强的相关性;对于不同的算法同样也需要不同的特征体系,对于逻辑回归这种解释性很强的线性模型,通常需要根据建模场景选择特征的细粒度,然后生成和样本具有相关性的特征,获取相关性最直接的方法是对特征进行特征交叉,而对于树模型或者FM模型,理论上则不需要进行特征交叉,因为模型本身就具有了特征的交叉能力。总之,合适模型加上适配的特征特征体系才能获得较好的效果。

小结:

特征工程通常在算法调优中占据了大部分的时间,本文旨在通过梳理推荐系统中常用的特征构造方法,实现快速的特征构造。本文主要是面向初涉推荐系统的同学,可以快速构造一些简单有效的特征,同时,本文提到的一些特征构造方法在某些场景下是冗余的,并不能带来新的信息,所以在实际的应用场景中还需要根据需求进行选择。

附录:

整体特征构造框架如图-6所示:

图6 特征构造框架

 

来源:腾讯QQ大数据

]]>
MIT:机器学习预测2018世界杯冠军 //www.otias-ub.com/archives/738750.html Sun, 17 Jun 2018 16:59:08 +0000 //www.otias-ub.com/?p=738750 麻省理工学院报道,他们的研究人员开发了一种新型人工智能,用以预测世界杯走势。

研究人员声称,他们应用了一种名为random-forest的计算方法,通过结合机器自我学习和常规统计,其准确率可能远胜于传统的统计方法。

在众多博彩公司的预测中,巴西拥有16.6%的最高夺冠几率,德国和西班牙紧随其后,夺冠概率分别有12.8%和12.5%。但random-forest认为,西班牙拥有更高的夺冠几率,其捧杯概率为17.8%,高于德国。这其中主要是因德国在16强中失利的可能性相对较大。在麻省理工的相关报告中,他们表示:

“西班牙比德国稍受AI青睐,这主要是因为德国在16强被爆冷的可能更高。”

近年来random-forest已经成为一种分析大型数据集的可靠方法,其在运行分析的同时规避了其他数据挖掘系统的一些缺陷。Random-forest的主要运算逻辑基于未来事件可以由决策树来决定这一原则,而决策树通过分析每一组数据集来得出其相应分支的结果。

在麻省理工的报告中称,影响西班牙和德国未来走向的重要因素是赛事本身的结构。他们指出,如果德国在小组阶段出线,其在16强淘汰赛面临的挑战将远大于西班牙,“翻车”的可能性不小。基于此点,random-forest通过计算,认为德国进入1/4决赛的概率只有58%;相比之下,西班牙则有73%的机率进入八强。

当然,假如西班牙和德国都成功进入1/4决赛,那么他们将有平等的机会最终捧杯。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
10大机器学习算法,看懂你就是数据科学家 //www.otias-ub.com/archives/722576.html Fri, 11 May 2018 12:14:14 +0000 //www.otias-ub.com/?p=722576 想成为数据科学家?你得是个博闻强识,又对新鲜事物保持好奇心的人。正因为如此,数据科学家会掌握几乎所有的常见算法,并精通其中一门,这样可以快速适应新领域的问题。

今天我们就来聊聊,每一位数据科技家都应该了解的10大机器学习算法。下面是关于普遍机器学习算法和快速资源的风暴之旅,准好了吗?烧脑挑战开始:

1. 主成分分析(PCA)/奇异值分解(SVD)

PCA是一种非监督学习,用来理解由向量组成的数据集的全局特性的方法。这里分析了数据点的协方差模型,用来了解哪些维度(大部分)/数据点(有时)更重要,即在它们自身之间具有高方差,但与其他变量时协方差较低。

这种思考模型主要用于考量具有最高特征值的特征向量。此外,SVD本质上也是一种计算有序成分的方法,但你不需要通过获取数据点的协方差矩阵来实现它。

这种算法通过获取已缩减维度的数据点,有助于解决多维度产生的冲击。

Libraries:docs.scipy.org/doc/scip

scikit-learn.org/stable
Introductory Tutorial:arxiv.org/pdf/1404.1100

2.1 最小二乘法和多项式拟合

还记得你在大学里学的数值分析编码吗?通过拟合直线和曲线得到一个方程。现在,你可以使用它们来适配机器学习中的曲线,用于非常小的低维数据集。对于大数据或多维度的数据集,你可能会需要过度拟合,所以不用费心。普通最小二乘法(OLS)具有封闭形式的解决方案,因此你不需要使用复杂的优化技术。

很明显,你可以使用这种算法拟合简单曲线/回归。

Libraries:

docs.scipy.org/doc/nump

Introductory Tutorial:

lagunita.stanford.edu/c

2.2 约束性线性回归

最小二乘法可能会被数据中的离群点、假维度和噪声干扰。因此,我们需要用约束来减少数据集上拟合的线的方差。正确的方法是拟合一个权重可控的线性回归模型。模型可以用L1正则(LASSO)或L2正则(Ridge Regression)或二者混合(elastic回归)。经过正则处理后对均方损失进行优化。

使用这些算法拟合具有约束性的回归线,避免从模型中过度拟合和掩藏干扰维度。

Libraries:scikit-learn.org/stable
Introductory Tutorial(s):youtube.com/watch?

youtube.com/watch?

3. K-均值聚类

这是所有人都喜欢的非监督学习聚类算法。给定一组矢量形式的数据点,我们可以基于它们之间的距离生成数据点群。它是一种期望最大化的算法,反复地移动群组的中心,然后聚集每个群组中心点。此算法所采用的输入是生成群组的数量,并且它将尝试汇集群组的迭代次数。

从名称中就可以看出,你可以使用这种算法在数据集中创建K集群。

Library:scikit-learn.org/stable
Introductory Tutorial(s):youtube.com/watch?

datascience.com/blog/k-

4. 逻辑回归

逻辑回归是一种约束线性回归,它的结果进行了非线性变换(常用的是sigmoid函数,或者tanh也可以),因此把输出限制成了+/-类的输出(在sigmoid中是1和0)。

交叉熵损失函数(Cross-Entropy Loss)用梯度下降法(Gradient Descent)优化。对初学者来说,逻辑回归用于分类,而不是回归。你也可以把逻辑回归看作一层神经网络。逻辑回归通过使用梯度下降法或者L-BFGS算法优化。NLP自然语言处理者们通常把它称之为最大熵分类器。

使用LR来训练非常简单,却是十分强有力的分类器。

Library:scikit-learn.org/stable
Introductory Tutorial(s):youtube.com/watch?

5.SVM(支持向量机)

SVM(支持向量机)是线性模型,类似线性/逻辑回归。不同之处在于它们具有不同的基于边际损失函数(支持向量的推导是我所看到过的最美的数理成果之一,和特征值的计算可以媲美)。你可以使用诸如B-FGS甚至SGD等优化方法来优化损失函数。

SVMs的另一个创新是,在特征工程中kernel使用。如果你有很好的领域洞察力,你可以用更好的kernel来代替旧的RBF kernel,并从中受益。

SVMs独一无二的特性就是可以学习一个类别的分类器

SVMs可以用来训练分类器(甚至回归函数)。

Library:scikit-learn.org/stable
Introductory Tutorial(s):youtube.com/watch?

6. 前馈神经网络

这些基本上是多层逻辑回归分类器。许多层权重由非线性(SigMOID,TANH,Relu+SULTMax和cool new SELU)分隔。它另一个比较知名的名字是多层感知器。前馈神经网络作为自动编码器,可用于分类和非监督特征学习。

前馈神经网络作为自动编码器,可用于训练分类器或提取特征。

Libraries:scikit-learn.org/stable

scikit-learn.org/stable

github.com/keras-team/k
Introductory Tutorial(s):
deeplearningbook.org/co

deeplearningbook.org/co

deeplearningbook.org/co

7. 卷积神经网络(Convnets)

当今,世界上几乎所有基于视觉的机器学习成果,都已经通过卷积神经网络实现。它们可以用于图像分类、目标检测甚至图像分割

这是Yann Lecun在上世纪80年代末90年代初的发明,其特征在于卷积层充当分层特征提取器。你也可以在文本中使用它们(甚至是图形)。

convnets用于最先进的图像和文本分类、目标检测、图像分割。

Libraries:
developer.nvidia.com/di

github.com/kuangliu/tor

github.com/chainer/chai

keras.io/applications/
Introductory Tutorial(s):cs231n.github.io/

adeshpande3.github.io/A

8. 递归神经网络(RNNs)

RNN通过在聚合状态下递归的使用同样的权重来对一个序列建模。前提是这个序列在0..t..T时间点上有输入,并且在时间t有从RNN的t-1步输出的隐含层。

现在纯的RNN已经很少使用了,取而代之的是代表序列建模最前沿的,与它对应的LSTMs和GRUs。

RNN(如果有紧密连接和非线性,现在f通常是LSTMs和GRUs的)。在纯的RNN中,LSTM单元取代了紧密连接层。

使用RNNs去完成序列建模的任务,如文本分类、机器翻译、语言建模。

Library:
github.com/tensorflow/m (Many cool NLP research papers from Google are here)

github.com/wabyking/Tex

opennmt.net/
Introductory Tutorial(s):
cs224d.stanford.edu/

wildml.com/category/neu

colah.github.io/posts/2

9. 条件随机场(CRFs)

CRFS可能是概率图形模型家族(PGMs)中最常用的模型。它们被用于像RNNs这样的序列建模,也可以与RNNs结合使用。它是神经机器翻译系统进入CRFs之前最先进的技术,并且在许多序列中用小的数据集标记任务。

目前,CRFS仍然比RNNs这样需要大量数据量支撑的算法更有优势。它们也可用于其他结构化预测任务,如图像分割等。CRF对序列中的每一个元素(例如一个句子)进行建模,使得其序列中某个组件的标签相互影响,而不是所有的标签彼此独立。

使用CRFs标记序列(文本、图像、时间序列、DNA等)。

Library:sklearn-crfsuite.readthedocs.io
Introductory Tutorial(s):blog.echen.me/2012/01/0

10. 决策树

假如,我得到一份关于各种水果数据的Excel表格,并需要告知哪些是苹果时,会抛出这么几个问题:

  • 第一个问题:“哪些水果是红色+圆形的?”

并用“是”和“否”来区分所有水果。

不过,所有的红色+圆形水果可能不是苹果,所有的苹果都不会只是红色+圆形的。

  • 第二个问题:在所有的红色+圆形水果中“哪些有红色or黄色的特征?”

同时我也会问,在所有非红色的圆形水果中“哪些是绿色+圆的。”

基于这些问题,我可以准确地分辨出哪些是苹果。

这一连串的问题就是决策树。

但是,这是一个基于我们直觉的决策树。直觉并不能在高维和复杂的数据上工作。我们必须通过查看标记数据来自动提出这一连串的问题。这就是基于决策树的机器学习技术所要做的。

早期的版本如CART树,曾经被用于处理简单的数据,但随着数据集越来越大,权衡方差与偏差需要用更好的算法来解决。如今正在使用的两种常用决策树算法是随机森林(在属性的随机子集上建立不同的分类器,并将它们组合成输出)和提升树(它不停地训练上层,用于纠正下层的错误)

决策树可以用来对数据点进行分类(甚至回归)。

Librariesscikit-learn.org/stable

scikit-learn.org/stable

xgboost.readthedocs.io/

catboost.yandex/

Introductory Tutorial:

xgboost.readthedocs.io/

arxiv.org/abs/1511.0574

arxiv.org/abs/1407.7502

education.parrotprediction.teachable.com

TD算法(值得拥有)

如果你还想知道上述任何一种算法,是如何做到像Deepmind Go那样击败世界冠军,很遗憾它们做不到。

在这之前我们讨论的所有10种算法都是模式识别,而不是策略学习。要通过学习策略解决一个多步骤的问题,比如赢得国际象棋游戏或玩雅达利游戏机,我们需要反复训练并从奖惩制度中学习。

这部分机器学习技术我们称之为深度强化学习。在这一领域的许多成功案例是融合了Convent或LSTM的感知能力产生的结果,这一些列算法称之为时间差异学习

这里面包括Q-Learning, SARSA和一些其它变型。这些算法在Bellman’s equations贝尔曼方程中非常智能,它可以通过从环境中获得的奖励训练,从而获取损失函数。

这些算法大多用于自动玩游戏,以及其他与语言生成和目标检测有关的应用。

相关资料

  • Top 20 Deep Learning Papers, 2018 Edition
  • Hierarchical Classification – a useful approach for predicting thousands of possible categories
  • The 10 Deep Learning Methods AI Practitioners Need to Apply

本文由【友盟+】编译  原作者 | Muktabh Mayank, ParallelDots.

 

]]>
如何快速应用机器学习技术? //www.otias-ub.com/archives/722517.html Fri, 11 May 2018 12:10:58 +0000 //www.otias-ub.com/?p=722517 目前机器学习技术正在对世界各地的企业产生重大影响,但很多机构依然对在何时、何处最优的使用机器学习感到困惑。为了成功的运用这门技术,企业首先要明确,哪些问题最适合应用机器学习,并确保有评估其影响的方案。

一般来说,机器学习算法是利用数据的统计属性建立输出与输入之间的关系。当研究人员把更多的数据输入算法时,它能够不断地学习并适应。最终,算法所建立的输入和输出的关系变的足够准确,它可以用于从新的输入预测输出。企业便可以运用这些预测发现新的洞察,以及赋能商业自动化。

找出那些可以用机器学习技术解决的问题。

如何确立一个可以用机器学习去解决的业务目标呢?以下步骤可供参考。

1)目标是实质性的、可量化的、可衡量的吗?

首先,利用机器学习技术实现的目标,应该对业务非常有意义。确定这样的目标通常需要业务负责人的参与,因为他们对业务有足够的了解,可以真正评估机器学习带来的价值。

其次,预测目标应该是可量化和明确定义的。例如,在最常见的机器学习框架——监督学习中,研究人员会给算法一个X输入和一个Y输出,并要求它找到X和Y之间映射的函数 Y=F(X)。

如果你希望网站对用户的吸引力达到最大化,你优化的目标Y可能是点击率、浏览总时长或它们的组合。监督学习要求业务负责人明确的量化他们需要优化的功能。

最后,机器学习算法的输出应该是持续的可衡量的。完美的机器学习算法需要不断适应新数据,以尽量减少预测的错误率。这使系统能够不停地学习和调整算法以优化其业务目标。

2)机器学习是正确的方法吗?

从广义上理解,企业可以通过两种方式开发智能系统(AI人工智能系统):专家系统和机器学习。

在专家系统中,人们明确地基于‘如果A,那么B’规则来制定行动计划。一般情况下,这样的系统并不像机器学习算法一样对数据有需要,而是依赖开发者对于问题的理解。

机器学习技术则需通过数据来学习规则。对于那些不能用严格规则进行编码的细微问题,机器学习能发现专家系统中可能错过的某种关系。但这种灵活性是有代价的:需要数据。

3)你有所需要的数据吗?

如果机器学习是解决业务问题的可行方式,数据必不可少,且数量和质量都十分重要。历史数据可以建立一种可靠的输入和输出关系来训练模型。但除了模型训练阶段之外,也需要基础架构不断的收集新数据,以便能持续学习。

评估机器学习在业务中的价值

在确定一个机器学习项目后,评估机器学习是否对业务有更广泛的影响力是很重要的。

机器学习研究中的一个活跃领域是解释算法输出结果的原因,研究人员可以对很多算法进行分解,从而为结果提供洞察。例如,知道用户为什么流失,就可以帮助企业加强产品或者开发自动化机制以防流失。在业务中主动寻找‘为什么’,对优化机器学习技术是非常重要的。

衡量机器学习算法对更深广的业务目标的影响尤为重要。例如,Facebook信息流提高用户交互度的目标,最初可能专注于提高内容的点击。但此目标可能会造成意想不到的后果,即通过增加内容噱头来吸引用户,最终可能导致整个用户群的CLV(用户终身价值)降低。随着时间的推移,可能有必要将目标从用户交互度调整为与长期客户留存相关的量化指标。

最近一项对1000位商界领袖的调查发现,66%的组织机构在用人工智能自动完成日常工作;80%的高管们表示人工智能技术创造的机会将引导企业的未来。而想要充分抓住技术带来的商业机遇,则需要企业负责人有效识别和衡量机器学习技术的影响力。

本文来自【友盟+】编译   原作者 | Alex Holub,Vidora联合创世人及CEO

]]>