数据分析 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Fri, 21 Jun 2024 12:43:58 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 Zendesk:2024年客户体验趋势报告 //www.otias-ub.com/archives/1696905.html Fri, 21 Jun 2024 21:30:23 +0000 //www.otias-ub.com/?p=1696905 Zendesk发布了“2024年客户体验趋势报告”。随着人工智能、数据分析和其他新兴技术的快速发展,我们正面临着客户体验领域的巨大变化,这些技术正在撼动行业的基础。

人工智能与智能体验

最好的客户体验是个性化的接触。4500名全球客户体验领导者都希望生成式人工智能能够加速更人性化的旅程的交付,这些旅程利用数据让人感觉风度和互动。

70%的客户体验领导者计划在未来两年内将生成式人工智能集成到他们的许多接触点中。

与此同时,客户已经为这一巨大变化做好了准备:在2500名全球消费者中有59%预计人工智能将彻底改变他们与企业的互动方式。

数据和值得信赖的经验

多年来,企业面临的最大挑战之一是如何有效利用堆积如山的客户数据。

62%的CX领导者认为他们在提供消费者期望的更即时的体验方面落后了。

如果能够预测客户需求,更快地解决问题,并提供高度个性化的体验,这一切都很容易做到,但这并不是一件容易的事。

下一代沉浸式体验

几十年来,消费者一直在网上购物,通过互联网购买商品和服务的方式也在不断发展。现在,现场体验和沉浸式体验正在极大地影响着在线购物的未来。

客户期待对话式商务,并热切地收听直播会议,以了解和购买新产品。


​文档链接将分享到199IT知识星球,扫描下面二维码即可查阅!

]]>
CMO Council:评估CMO的价值报告 //www.otias-ub.com/archives/1233752.html Sat, 03 Jul 2021 22:00:06 +0000 //www.otias-ub.com/?p=1233752 CMO Council发布了新报告“评估CMO的价值”。今年,全球首席营销官们将优先扩展营销自动化和数据分析,并在所有职能部门应用营销战略。

在接受调查的150名首席营销官中,约61%表示他们企业今年的首要发展的重点之一是扩大营销自动化和数据分析计划及资源。约58%的受访者还将提高战略营销深度和能力列为他们的五大优先事项,约一半(49%)的受访者希望寻求提高数字营销采用率的方法,并将其应用于所有渠道。

这些受访者中的大多数对他们的全球营销团队给予了良好的评价。尽管如此,大约1/3的受访者(32%)将提升团队的整体素质和能力作为今年的首要任务。

虽然数据分析和营销自动化等技能受到广泛追捧,一些受访者仍表示他们计划招聘或提升市场执行和运营(45%)、内容和需求生成(38%)和数字互动营销(33%)方面的职能。其他人还打算提升或招聘战略规划、品牌和定位(25%)以及销售情报和客户关系管理(24%)方面的领袖人才。

尽管有在这些领域招聘职能领导的计划,但这么做可能并不容易。只有不到1/5的受访者表示,找到经验丰富、熟练且知识渊博的职能领导和直接下属相对容易(12%)或不是问题(4%)。大约2/5的受访者认为这项工作总是具有挑战性(25%)或非常困难和耗时(18%),另有40%的受访者认为这项工作有中等难度。

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
中国汽车流通协会:2020年上半年公安部上牌数据分析 //www.otias-ub.com/archives/1087607.html Tue, 21 Jul 2020 00:14:05 +0000 //www.otias-ub.com/?p=1087607 近日,公安部公布截至2020年6月,全国机动车保有量达3.6亿辆,其中,汽车保有量达2.7亿辆。2020年上半年,机动车新注册登记1414万辆,比去年同期减少98万辆。其中,汽车新注册登记1042万辆,与去年同期相比减少200万辆。就此中国汽车流通协会汽车市场研究分会秘书长崔东树就次数据进行行业分析如下:

美国私家车的平均年龄已达11.8年。汽车保有量已创下超过2.78亿辆的纪录。中国汽车保有量在2020年上半年接近美国,尚未成为世界第一。

目前看中国上半年新增驾驶员的数量728万,驾校等增长受到疫情影响出现锐减情况。但摩托车上牌增长迅猛,上半年333万台,同比增长90万台,也是疫情下的出行更便利选择。

1、上牌保有的总体口径分析

 

2020年上半年的全国汽车保有量达2.7亿辆,同比增速8%,保有量增量达到1009万台,同比保有量的净增量的增速出现1%的下降。

2020年上半年新登记注册汽车数量1042万台,同比下降16%,这也是疫情下的很好的情况,。而汽车保有量的净增长达到了1009万台,这算起来增速达到了1%,保有量的增长速度大幅放缓。

2020年上半年汽车报废数量测算为33万台,相对于2019年的242万台大幅的下降。相对2015年的报废600万台和2017年的500万台水平,目前的保有量的报废速度实际上是在疫情中放缓之中,这也体现了整个车市的增长海油很大潜力。

2、汽车上牌城市销量百万级增长快

从城市分布情况看,截至6月,全国汽车保有量超过100万辆的城市共有69个,与去年同期相比增加3个。其中,汽车保有量超过200万辆城市31个,超过300万辆城市12个。

2016年比2015年百万城市的数量增长了9个,2017年比2016年百万城市的数量增长4个,到2018年百万城市比2017年的数量增长8个,2020年上半年仅增长3个,相信2020年下半年会增长很多。

2020年上半年汽车保有量超过200万辆城市31个,速度相对并不很快,2015年比2014年多一个,2016年比2015年多8个,2017年比2016年多6个,2018年比2017年多一个,2020年上半年比2019年多1个

2020年上半年超过300万辆城市12个,这个增长速度相对较快体现了,大城市加快增长特征。

2020年上半年的保有量的具体数据发布,超过300万辆城市12个,依次是北京、成都、重庆、苏州、上海、郑州、西安、武汉、深圳、东莞、天津、青岛。北京汽车保有量超过600万辆,成都汽车保有量超过500万辆。

广州与杭州都是汽车保有量的边缘化的城市,这也是促销费的机会。

今年上半年没有公布300万以下的排名。但作为限购城市的广州跟杭州的表现相对极差。

杭州的增量相对比较低迷,19年比17年年均增长12万台,较前期的10万台增量也相对一致,作为幅员辽阔的杭州地区,比上海大三倍,但保有量仅有上海的70%。

南京的表现相对较弱,近几年年均在16万台左右水平,而济南的表现也不如青岛的表现更强。

3、摩托车数据增长喜人

截至6月,全国机动车保有量达3.6亿辆,其中,摩托车保有量达6889.6万辆,占19.14%。

摩托车新注册登记332.5万辆,与去年同期相比增加88.5万辆;这都是很好的表现。

 

4、新能源汽车保有量

截至6月,新能源汽车保有量417万辆,与去年年底相比增加36万辆,增长9.45%。

由此可见,上半年半年的新能源车保有量增长速度略有放缓,上半年的417万台较年底增长36万台,,可见新能源车的疫情下的市场需求的确相对压力较大。

5、新司机大幅减少

2020年上半年的一年以内驾证的人员锐减,今年的领证的驾证人员有728万人,出现大幅锐减的特征。

我们相信随着我们驾驶员数量的快速增长,目前汽车驾驶员有4亿人,应该说未来我们的汽车销量也会获得一个较好增长的趋势,从驾驶人的年龄分布看,主要集中在26至50岁年龄段之间,其中26至35岁年龄段的有1.5亿人,占驾驶人总量的34.1%;36至50岁年龄段的有1.7亿人,占38.6%;超过60岁的有1424万人,占3.2%。中老年老司机逐步增长,车市发展的潜力巨大。

]]>
WFA:首席营销官的难题和优秀营销人员的标准 //www.otias-ub.com/archives/1073970.html Wed, 01 Jul 2020 22:00:20 +0000 //www.otias-ub.com/?p=1073970 根据世界广告商联合会(WFA)和2CV的一份新报告,在高级营销人员中,最广泛的共识是数字营销技能(87%)以及数据分析和洞察力(85%)很重要。

接受调查的近700名高级营销人员认为,掌握这些新技能的人(88%)对市场了如指掌。不仅如此,许多高级营销人员还认为,文化敏感度(80%)、商业敏锐度(78%)和创业精神(75%)等技能对从事营销工作的人来说很重要。前数字时代的营销人员可能会认识到这些是他们自己成功的基石。

虽然全球化思维(71%)和营销基础知识(67%)也是重要的技能,但很少有受访者认为销售经验(44%)和学术成就(31%)是营销领域的重要技能。

高级营销人员认为有很多个人技能很有价值。例如,灵活性很重要,91%的受访者提到了这一点。

除了灵活性,91%的受访者还将以下要素列为当今营销人员的重要个人特征:

激情

活力

好奇心

道德也被认为很重要,近90%的受访者认为这一点值得注意。公众对广告从业者的标准和研究表明,1/4的营销人员被迫在工作中使用不道德的营销策略,这一点值得注意。同样的研究也显示,92%的营销人员认为自己是道德的。

与此同时,大多数受访者也认为许多其他个人特质很重要,从勇气(88%)到创新(88%)、领导力(87%)、创造力(86%)、同理心(86%)和效率(86%)。在某种程度上,逻辑性(81%)和直觉(77%)也是重要的特征。


PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
Fastdata极数:2000-2020政府工作报告数据分析 //www.otias-ub.com/archives/1061301.html Thu, 04 Jun 2020 16:25:41 +0000 //www.otias-ub.com/?p=1061301

PDF版本将分享到199IT知识星球,扫描下面二维码即可!

]]>
一份优秀的数据分析报告应该这样写 //www.otias-ub.com/archives/1010029.html Thu, 20 Feb 2020 15:05:12 +0000 //www.otias-ub.com/?p=1010029 在每次的数据分析工作中,将分析过程与结果写成一份通俗易懂的报告是工作的最后一步,并且对有的人来说,这也是最难的一步。

一份技术报告的目的是传递信息。然而,技术信息是很难让人理解的,因为它不仅复杂,而且无法让人轻易的了解。将数学焦虑等融入到任何事情都可以被统计数据证实这一流行观念中,你就可以明白为什么做数据分析报告是一份挑战。如果你对数据分析报告撰写流程很陌生的话,可以考虑学习下面的内容。

一、明确内容

从你最了解的部分着手开始。在写一份数据分析报告时,你最了解的部分应该是你分析的统计数据、绘制的图形以及建立的模型。

img

你应该有能力去描述你是如何呈现总体特征的,如何生成这些数据的或者是提供了这些数据的源头,在做探索性的分析时你发现了数据存在哪些问题,你是如何处理这些数据的,对异常数据你做了怎样的处理,应用了怎样的变换方法,对于缺失的和重复的数据你做了什么,你是如何处理违反假设的情况和不显著的结果的。

img

接下来,你需要决定什么是重要的内容,以及,哪些内容对报告阅读者来说是重要的。因为除非你写的报告是面向你的大学教授或者是同龄的数据分析专业人员,否则的话,你可以十分确定的认为没有人想听你讲你是如何解决各类问题的,你用了什么技巧,或者你在分析数据的时候多么努力。没有人在意你的结果是来自Excel表格还是一段自己用R语言编写的程序。

一旦整理出了你需要的信息,就为这份报告写一个概述,这样你就会知道你都要写些什么内容。这样做可以帮助你不偏离主线。你的总结或许可以选择以下三种形式中的一种:

1.执行总结

执行总结面对的是决策者或者那些没有足够的时间或耐心去阅读超过400字的文章的人。把你的概述缩减到一页以内,不要使用任何术语,只提供那些决策者需要的,可以帮助他采取适当行动的结果信息(也就是:**你想要传达的信息)**。

2.总括

总括面对的是大部分读者,无论他们是否会阅读这份报告。一篇总括是报告内容的删减版,并且关注点在你想要传达的信息上。总括的内容也不应超过几页纸。

3.摘要

摘要面对的是同专业的人以及其他可以看懂数据分析的人。一篇摘要的内容通常是一页纸或者少于一页纸,并且总结了你所做的所有的重要的工作,从定义总体到评估效应量。摘要通常被用在学术论文写作中。一旦你知道了你的读者是谁,你就可以重新撰写概述以便抓住读者的注意力。

二、了解读者

每篇教你自学技术写作的文章都会首先告诉读者要考虑他们撰写报告的观众。即使如此,或许很少有作者真的这样去做。

在统计分析中,你通常会先开始考虑你想要做出推断的那些总体所具有的特征。与之相似的,当你开始撰写一篇分析报告时,你通常会先开始考虑你想要进行交流的那些读者所具有的特征。

img

你必须考虑那些即将阅读你的报告的读者的这些特征:是谁(who)、是什么(what)、为什么(why)、在哪里(where)、什么时间(when),以及如何做(how)。这里有一些你需要考虑的和读者有关的内容。

1.Who

读者通常是通过他针对报告所扮演的角色来定义的。一些读者会用这份报告来做决策。一些读者会通过这份报告学习新的信息。其他的会根据自己已经知道的情况来评论这份报告。因此,一份统计报告的读者通常会被定义为:决策人员、股东(利益相关者)、评论家或者对报告感兴趣的个人。

有的报告只会被一个人阅读,但是大部分报告会有很多读者。各行各业的人都有可能阅读你的报告。因此,会有初级的、中级的、甚至更多不同级别的读者参与阅读。这是有问题的,因为你无法取悦每个人。因此,要通过定位你的读者,首先关注接收你的信息的最重要的读者,其次关注读者中群体最大的那一部分。

2.What

一旦知道你的报告的目标受众是哪些人,你就应当尝试弄明白他们的特征。或许对于一个技术报告作者来说,最重要的特征是读者对报告的主题和报告中描述的统计技术的了解程度。你可能没办法改变读者对报告主题的知识储备,但是你可以通过调整呈现统计信息的方式帮助读者理解内容。例如,一个数据分析师可能遇到的读者类型包括:

(1)数学恐惧者

惧怕数字但是或许愿意了解概念。不要使用任何统计学术语。不要呈现公式。尽可能少的使用数字。例如,用“大约一半”代替任何百分比在50%左右的数字。那些额外的精度对数学恐惧者来说并不重要。

img

(2)游客

懂一些知识并且有兴趣。稳当一点。只是用你定义明确的基本术语。可以使用数字,只不过在一张表格里不要用得太多。将数值化为证书以保证你没有暗示错误的精确度。坚持使用饼图、柱状图,或许偶尔使用一下散点图,不要使用比这些更复杂的工具。不要使用任何公式。

(3)卖弄者

懂得比自己认为的少并且想要展示。只要你把你表达的意思定义出来,就可以使用术语。甚至一个喜欢卖弄的人也可能学到些东西。同样的,使用数字、统计图表,以及公式也是可以的,只要你能清晰的解释它们的含义。这类人如果没有指导的话可能会得出不正确的结论。

读者的特征为报告的长度、撰写的语调和风格提供了指导。

3.Why

那些读者很可能是对你的报告非常感兴趣呢还是仅仅是对它感到好奇(如果他们没有兴趣,那么他们就不算是读者)?对自己坦诚一点。为什么别人要有兴趣阅读你的报告呢?你将谁定义成为你的目标读者呢?他们会用你的发现做些什么呢?他们会了解到有用信息吗?他们将会做出一个决策呢还是会采取一个行动呢?这对他们来说是一个很重要的东西呢还是他们必须关注的?

4.Where

这份报告的受众是一个数量、范围有限的群体呢,例如为一个组织而进行的分析,还是任何人都有可能阅读它呢?这份报告的目标是组织中的上层人员呢还是普通人员(也就是说是自下而上还是自上而下)?关于这份报告有没有安全性或保密性的顾虑呢,无论是在个体还是组织层面上?

img

5.When

读者什么时候需要看到你的报告?在公布报告以前谁必须复查这份报告以及复查需要多久?截稿日期是否无法变动?你还剩多久的时间来撰写这份报告?是否有足够的时间让你想清楚你需要写什么?是不是有时间让你进行必要的额外的分析以填补报告大纲中的空白?当复查你的报告的时间是你撰写它所花费的时间的两倍的时候,你是否会因此生气呢?

这里有一些你应当牢记于心的建议。绝对,绝对,绝对不要将你没有写完、没有编辑好的报告的草稿提交上去应付复查。我告诉自己我写的每份报告都要遵守这条规则。不幸的是,像大多数人一样,我不听自己说的话。

最后,你要考虑如何呈现这份报告才能使读者从中得到最多的信息

img

组装:你写的报告将被如何组装起来(也就是说:组装成一件可以被分销的产品)?它将是一个简短的书信式报告,一份综合报告,一篇博客或者是一篇网络文章,一篇专业的期刊文章,一份权威报告,还是你的报告会构成其他文件的组成部分呢?

形式:你的这份报告将以电子文件的形式还是纸质文件的形式被分发呢?如果它是以电子形式被分发的话,它能否在互联网上取得呢?它能否被编辑呢?它是否会以什么形式限制获取呢,例如密码?

外观:这份报告是只能以白纸黑字的形式来呈现呢还是可以使用彩色内容?图表与文字的比重是多少?这份报告是很传统的呢还是会很华丽,就像营销手册一样?报告里会有11×17英寸大的折叠页呢还是会有超大的像地图一样的插入页呢?

三、明确方法

从高中起你就被告知行文开始前要拟一个大纲,写分析报告也是这样。然而有许多可能的提纲你可以根据您的受众特点和期望来选择。你首先要决定的是报告最终的建议是什么

您的报告是像政府部门的行政简报(不要混淆法律简报),信函报告,总结报告,综合报告,互联网文章或博客,专业期刊文章或白皮书等等。每一种报告都有自己的受众类型,内容和风格。

img

写报告就像是去旅行。信息就是你想要传递给最终目的地——观众的资产。报告的建议是持有信息的车辆。现在,您需要一张地图来了解如何到达目的地——那就是提供。

就像地图上有不只一条可能的路线,这里也有几种可能的大纲策略可以用来编写报告。

  1. 跟随数据的方法

如果您具有非常结构化的数据分析,则可以按顺序报告每个数据片段。调查往往属于这一类。这种方法使编写报告变得容易,因为在按照原始顺序重新组合之前,可以将报告各个部分分开并分发给其他人写。缺点是这种方法通常没有给出综合的结果。读者只能自己思考这一切意味着什么。

  1. 讲故事的方法

这种方法认为阅读统计报告不应该像修剪草坪一样枯燥。相反,你应该引导读者的好奇心,就像解开神秘的谋杀案之谜,你一点点地提供线索,但当把所有的线索放在一起时你给出的结论又十分合理。这与上述的“跟随数据的方法”几乎相反。

img

在讲故事的方法中,报告从最简单的数据分析开始,逐渐地过渡到精彩的高潮 – 分析的结论。与结论不相关的分析将被省略。通常报告的过程有一些弧线,譬如先前介绍的分析结果在后面的章节中被重申,以显示它是如何支撑整个故事情节。

图表在这种方法中非常重要。提纲更像是故事概述。对于每个文本页面,可能图表占据了一大半。讲故事的报告通常比其他方法的报告需要更长的时间,但是如果你的读者有耐心阅读完,那么结果将是会更深刻的(也就是说,不要试图把故事讲给路人听)。

所以,确保你有一个合适的提纲,但不要让它限制你。在构建提纲时,尽量平衡各部分,使读者有周期性的休息。但是,在每个部分中,小节的长度应与其重要性相对应。

文章来源于大数据分析和人工智能

]]>
DNB:4/5的B2B营销人员将在2020年专注于数据分析 //www.otias-ub.com/archives/964213.html Thu, 05 Dec 2019 20:00:27 +0000 //www.otias-ub.com/?p=964213 根据DNB的调查,4/5的B2B营销人员(83%)表示,他们将在2020年更加专注于数据分析。与此相一致,测量和分析技术成为他们的首要投资重点,以实现数据驱动的营销和广告目标。

在250多名接受调查的B2B营销人员中有69%将测量和分析作为投资优先事项,这是唯一拥有多数共识的技术。尽管如此,受访者也投资营销自动化平台(45%)、数据管理平台(39%)、客户数据平台(34%)和内容管理平台(34%),以帮助实现数据驱动的营销目标。

绝大多数受访者(92%)目前正在使用营销组合中已有的营销活动度量和分析工具,但较少的受访者(37%)正在使用这些技术的高级功能。

近9/10的受访者(88%)也在使用客户关系管理(CRM)技术,其中33%使用高级功能,52%使用基本功能。虽然使用CRM的受访者比例比去年(84%)有所增加,但使用该技术更高级功能的受访者似乎更少。

在接受调查的B2B营销人员和机构中只有57%使用营销自动化平台,还有1/4的受访者(25%)计划在未来12个月内使用该平台,18%的受访者没有使用营销自动化的计划。

最大的挑战集中在客户数据上,受访者认为孤立或无法访问的客户数据(27%)、不完整的客户数据(27%)和客户数据的准确性(21%)是他们在数据驱动营销中取得成功的最大障碍。

跨渠道的客户体验至关重要。大多数(87%)的受访者同意B2B企业需要像B2C同行一样关注客户体验,其中46%的受访者强烈同意这一说法。

最重要的是,几乎所有(94%)的受访者都认为他们的公司在各种数字和线下渠道上提供一致的体验很重要,3/4的B2B营销人员(74%)认为他们公司的能力至少与竞争对手相当。

对于B2B营销人员来说,无法充分利用数据和目前拥有的数据工具是跨渠道提供更好的客户体验的最大障碍之一(33%)。此外,由于缺乏有凝聚力的营销数据策略(25%)和可用的数据源(21%)也导致企业难以提供一致的跨渠道体验。

PDF版本将分享到199IT交流群,支持我们发展可加入!

]]>
ESOMAR:2018年数据分析和洞察行业增长10% //www.otias-ub.com/archives/938254.html Wed, 18 Sep 2019 19:00:30 +0000 //www.otias-ub.com/?p=938254 根据ESOMAR年度全球数据,传统市场研究的增长速度低于数据分析和洞察力。

2018年,传统市场研究行业刚刚超过470亿美元,仅比2017年(460亿美元)略有增长。尽管传统行业的增长率有所下降,但数据分析和洞察行业的增长速度(10%)超过了全球GDP的增长速度。

由于双方合并,2018年全球研究和洞察年营业额为800亿美元,2017年为760亿美元。

中国推动了主要增长(+11.9%)。除亚太地区(+3.7%)以外,所有地区在传统市场研究行业中均出现负增长。

北美地区稳定在+0.1%,中东地区下降9.2%,拉丁美洲紧随其后(-2.7%)。非洲是2017年增长最快的地区,2018年市场规模保持不变。

前五个国家的相对位置保持不变,美国是迄今为止最大的单一市场,市场研究行业价值207.5亿美元,占全球市场的44%;其次是英国67.8亿美元(14%)、德国27.9亿美元(6%)、法国24.7亿美元(5%)和中国24.2亿美元(5%)。

2018年定量研究方法占总支出的78%,定性研究占14%。

消费非耐用品、媒体和娱乐以及制药占了所有支出的一半。消费非耐用品占19%,媒体和娱乐以及制药各占市场研究支出的16%,尽管每个地区的支出情况有所不同。

ESOMAR总干事Finn Raben表示:“尽管有预测称研究行业正在衰落,但今年的数据显示,研究行业在2018年继续增长,尽管速度略有放缓。令人欣慰的是,我们看到增长既来自传统的研究行业,也来自更新的、扩展的市场,这证明对可操作的、基于证据的数据和洞察的需求仍然强劲。”

199IT.com原创编译自:ESOMAR 非授权请勿转载

]]>
Tractica:2030年量子计算市场将达到91亿美元 //www.otias-ub.com/archives/932767.html Sun, 08 Sep 2019 20:00:45 +0000 //www.otias-ub.com/?p=932767 量子计算是指使用量子力学的属性和原理来执行计算和解决问题。全球量子计算市场的发展动力是由于人们希望提高建模和模拟复杂数据的能力,提高和优化系统或流程的效率,以及更精确地解决问题。

根据Tractica的一份新报告,量子系统可以同时处理和分析所有数据,然后得出最佳解决方案,以及成千上万的替代方案,所有这些都在几微秒内完成。

Tractica预测,到2030年,企业量子计算市场的总收入将达到91亿美元,高于2018年的1.116亿美元。

Tractica首席分析师Keith Kirkpatrick表示:“量子计算机注定不会很快取代个人电脑或智能手机中的处理器。在企业大量采用量子计算之前,还需要大幅度扩展处理能力,提高纠错能力,编写和改进量子算法。”

MarketSandMarkets则预测,到2024年全球量子计算市场将达到2.83亿美元。2019-2024年复合年均增长率为26.8%。

按地理位置划分,主要行业参与者将在北美、欧洲和亚太地区开展业务。估计北美在2018年占最大市场份额,亚太地区在2019-2024年间保持最高的复合年均增长率。

亚太地区是多个行业的领先枢纽,包括医疗保健、银行、汽车和化学品。该地区是世界上最大的汽车生产国。此外,中国、日本和韩国等聚集了领先的消费电子产品制造商,包括智能手机、笔记本电脑和游戏机。需要解决诸如优化、材料模拟和跨这些行业的机器学习应用的各种复杂性。这些大中型企业将推动量子计算市场的增长。

199IT.com原创编译自:Tractica 非授权请勿转载

]]>
中国花卉协会:2018年我国花卉进出口数据分析报告 //www.otias-ub.com/archives/917509.html Mon, 05 Aug 2019 07:55:52 +0000 //www.otias-ub.com/?p=917509 为全面掌握我国花卉进出口情况,为花卉生产和经营者决策做参考,促进我国花卉业健康发展,中国花卉协会对2018年我国花卉进出口数据进行了系统分析,并于近日发布了《2018年我国花卉进出口数据分析报告》。

]]>
Sensor Tower:2019 年第二季度全球移动应用数据分析 //www.otias-ub.com/archives/912811.html Sun, 28 Jul 2019 05:24:14 +0000 //www.otias-ub.com/?p=912811
本周,移动应用数据分析公司 Sensor Tower 发布了其《2019 年第二季度数据摘要》报告,根据情报商店 Store Intelligent 的测算数据,报告对 2019 年第二季度的应用程序全球下载量进行了排名。其中排在首位的应用是 WhatsApp,下载量超过 1.91 亿次。

全球下载量排名情况

2019 年第二季度,全球下载量排名第二的应用程序是 Messenger,下载量超过 1.81 亿次,Facebook 超过 Tik Tok 重返第三, Tik Tok 和 Instagram 位列第四、第五。

自 2018 年第一季度以来,这五款应用一直高居榜首,而除了 Tik Tok,其它四款应用均隶属于 Facebook 集团。2019 年第二季度,Facebook 下载量超过 Tik Tok,重回季军位置。Snapchat 下载量比上季度增长了 63%,位列第六,这也是该应用自 2017 年第二季度以来获得的最佳排名。不过,非常遗憾的是,自 2017 年第一季度以来,Snapchat 从未冲进前五名。

App Store 下载量排名情况

单看 App Store,2019 年第二季度下载量最大的应用是 YouTube,下载量超过 2850 万次,其次是 Tik Tok、Instagram、Snapchat 和 Facebook。

TikTok 已经连续五个季度位列应用商店下载量排行榜前十名。Snapchat 和拼多多是 App Store 上下载量增长最快的两大应用。2019 年第一季度,拼多多还未冲进全球应用下载量排名前 30 名,第二季度已经跃居全球第九,中国第一。

Google Play 下载量排名情况

以应用程序在谷歌平台中的下载量进行排名时,2019 年第二季度下载量最大的应用是 WhatsApp,下载量超过 1.684 亿次,随后是 Messenger、Facebook、Tik Tok 和 Instagram。

令人意外的是,中国文件传输工具 SHAREit(茄子快传)下载量接近 Instagram,在 Google Play 上位列第六,总榜第七,是下载量最高的工具类应用。

2019 年第二季度,Facebook 超越 Tik Tok,与 WhatsApp 和 Messenger 携手跻身前三名。不过即使如此,Tik Tok 在该季度的下载量还是增加了近 65%,超过 1.6 亿次。虽然不敌 Facebook,但仍然遥遥领先于排名第五的 Instagram 应用。谷歌平台上很多应用的下载量,有很大一部分来自于印度市场。像是下载量前十名中的 SHAREit、Likee、Hotstar,都广受印度市场欢迎。

来自: 白鲸出海

]]>
2020第二届全球制造业数字化转型国际峰会 //www.otias-ub.com/archives/896935.html Tue, 25 Jun 2019 05:43:10 +0000 //www.otias-ub.com/?p=896935 由ECV上海希为主办的2020第二届全球制造业数字化转型国际峰会即将于2020年2月27-28日在上海盛大举行。

随着云计算、物联网以及人工智能等新兴技术的不断发展,数字化转型已成为企业发展的第一要务。据预测,到2021年,全球企业在数字化转型技术的支出将达到2.1万亿美金,复合增长率达到17.9%。数字化技术在各个行业不断渗透,为全球产业发展带来新的机遇,制造业作为国民经济的主体,是立国之本、兴国之器、强国之基,如何通过数字化技术实现制造业转型升级已成各个国家发展战略的重中之重。

2020第二届全球制造业数字化转型国际峰会将结合全球数字化转型成功真实案例,就如何融合IT与OT, 如何提升运营效率,商业模式创新,供应链优化,数字孪生,数字化人才需求等热点话题进行深入探讨,旨在为企业提供数字化转型参考和交流平台,促进数字经济和实体经济的有机融合,实现全球制造业的转型和升级。

会议形式:

  • 主题演讲+圆桌讨论

热点话题:

  • 中美贸易战对国内制造业的影响及如何实现整个产业的升级和转型
  • 制造业如何致胜数字化时代
  • 如何建设数字化、智能化、互联化、柔性化和定制化工厂
  • 在工业0时代,数字化转型如何彻底变革制造业的生产链

参会嘉宾:

  • 总裁
  • 董事长/总经理
  • 首席执行官
  • 首席数字官
  • 首席信息官
  • 数字化转型副总裁
  • 制造流程副总裁
  • 总监/业务经理
  • 销售总监/国际销售经理
  • 业务发展总监/经理
  • 战略发展总监/经理
  • 国际市场总监/经理
  • 区域总监/经理
  • 研发总监/经理
  • 技术总监/经理
  • 可持续发展总监/经理
  • 质量总监/经理

行业分类:

  • 管理咨询
  • 无线通讯
  • 建筑和机械
  • 工业自动化
  • 家用电器
  • 医药
  • 快速消费品
  • 采矿
  • 化学
  • 电子
  • 隐私安全
  • 供应链和物流
  • 大数据
  • 云计算
  • 人工智能和物联网
  • 平台和解决方案
  • 人力资源管理
  • 庄闲网络娱乐平台进入

演讲嘉宾:

  • 中华人民共和国工业和信息化部
  • 麦肯锡
  • 海尔
  • 西门子
  • 华为
  • 卡特彼勒
  • 宝洁
  • 罗尔斯-罗伊斯
  • 巴斯夫
  • 微软
  • 徐州工程机械集团
  • 拜耳
  • 宝马
  • 美世

联系方式:

联系人:邹一晗

电话:+86 21 8026 0707 Ext. 808

邮箱:franchyz@ecvinternational.com

网站:http://h5ip.cn/WsaE

 

关于上海希为(ECV International)

(ECV International)上海希为是亚洲领先的国际高端商业峰会及活动的主办和承办机构。公司拥有近200位行业研究及活动专家,每年在全球举办约40场高端国际峰会,涉及汽车、零售、纺织、鞋业、物联网、新科技等行业。我们为超过半数的财富2000强企业提供专业的商业会议及咨询服务,每年有超过6000位来自戴姆勒、通用电气、阿迪达斯、可口可乐、阿里巴巴、ABB等跨国公司、专业机构及创新企业的决策人参加我们的会议和活动。我们的使命是通过提供专业服务帮助客户抓住发展机遇、迎接挑战、实现全球范围内的可持续发展,进而影响行业格局,引领行业未来。

ECV除自身举办峰会外,还开展承办活动业务,为客户提供从活动策划,会议策划,创意到执行,三维动画,影视制作,文化演出活动等综合营销服务。活动策划和活动执行涉及创意方案、场地规划、物料规划、流程规划及其它服务。嘉宾邀请和媒体宣传涉及媒体邀约、演讲嘉宾邀请、新闻稿制订、广告投放及其他服务。

 

 

]]>
埃森哲是如何系统化做好数据分析 //www.otias-ub.com/archives/860268.html Wed, 10 Apr 2019 15:50:35 +0000 //www.otias-ub.com/?p=860268 全文以 PPT 的形式展开,并围绕着四个模块进行:

目录
    1 概述

2 数据分析框架

3 数据分析方法

3.1 数据理解 & 数据准备

3.2 分类与回归

3.3 聚类分析

3.4 关联分析

3.5 时序模型

3.6 结构优化

4 数据分析支撑工具

以下是 PPT 全文

]]>
Ssas:年度数据、分析和AI报告 //www.otias-ub.com/archives/830620.html Thu, 14 Mar 2019 16:59:34 +0000 //www.otias-ub.com/?p=830620 Ssas发布了“年度数据、分析和AI报告”。CMOs仍在努力从数据分析中获得最大收益,但高管们是否能够获得正确的数据? MIT Sloan代表Ssas进行的一项全球调查显示,3/4的受访者(76%)认为获得的数据很有用,这个数字与去年的调查一致。

近一半的受访者(47%)经常或总是相信数据的准确性,约1/3的受访者(37%)有时会相信数据的准确性。只有一小部分的受访者(6%)认为分析数据很少准确。

尽管人们对数据准确性的信任程度很高,但只有34%的受访者相信数据总是完整的。另外42%的受访者有时相信。最能说明问题的是,1/4的受访者(24%)认为分析数据很少或从不完整。

研究重点:

核实内部及客户资料为优先事项。近2/3的高管(63%)相信内部生成的数据是最受信任的第一消息来源。同时,大多数公司(62%)定期核实内部数据。

与其他数据源相比,客户提供的数据也会得到更多次的验证。在参与调查的高管中有50%的人定期核实客户数据,42%的人说他们有时会核实客户数据。然而,客户数据在可信性方面排名第四(37%)。

竞争对手的数据被认为是最不可信的数据,21%的受访者这么表示。这些数据也不经常被验证,只有34%的受访者经常核实,49%有时核实,18%的人从不核实。

领袖利用分析数据来制定和支持决策,CMOs正把分析纳入他们的决策中。只有19%的受访者总是支持分析的价值,还有32%的受访者经常这么做。

其他要点:

  • 55%的公司增加了数据质量预算。
  • 47%的受访者会追踪所有数据,44%的人制定了数据泄露应对计划。
  • 41%的公司告知客户如何收集、储存和共享数据。
  • 只有16%的受访者完全遵守GDPR。

199IT.com原创编译自:Ssas 非授权请勿转载

]]>
Facebook专利:通过数据分析用户经济状况与社会地位 //www.otias-ub.com/archives/687707.html Mon, 05 Feb 2018 13:17:26 +0000 //www.otias-ub.com/?p=687707

Facebook获得了一项新的技术专利,可以根据Facebook此前所收集的用户数据来分析用户的经济状况,并且将用户划分为不同的社会等级。

该公司最早于2016年7月就向美国专利与商标局申请了这个专利,但是直到本周这个专利才被披露。专利描述显示,这个技术所用的算法会根据用户的年龄、设备数量、房产、受教育程度以及居住地等数据对用户的经济状况进行精准评估。之后Facebook会将用户划分为3个社会经济等级,其中之一为中产阶级,另外两个阶级的具体名称并未具体命名。

Facebook的这个专利声明显示,如果用户不愿意分享它们的一些敏感信息,例如年收入情况,那么可能会导致用户分类准确性的下降。Facebook表示,这个专利的作用在于帮助广告商提高广告投递的精准程度,让他们可以将广告投送给自己的目标人群。目前还不清楚Facebook未来是否会将这个技术用于自己的广告平台上。

]]>
在活动效果评估时防止掉入对照组不具代表性的陷阱 //www.otias-ub.com/archives/675026.html Sat, 13 Jan 2018 07:38:33 +0000 //www.otias-ub.com/?p=675026

评估活动效果也就两大类方法

砸钱做活动,做推广对于企业来讲是非常普遍的事情,花这些钱究竟有没有效果,则需要对活动进行认真评估和分析。一般而言,对活动评估的方法无非两大类方法,一类是定向归因,第二类是对比分析。

定向归因适用于可以通过技术的手段或者其他手段可以比较准确把活动效果跟其他背景信息区分出来的场合。比如可以通过设定专门的活动页面来跟踪效果;在安卓渠道上获取新增客户时,我们也可以通过针对某次活动分配专门的渠道包来跟踪活动的效果。

但很多时候,我们并没法通过定向归因的方法来评估一个活动,一场推广带来的效果。比如我们做了一场全国性的品牌活动,由于线上线下是存在鸿沟,我们就很难完美地将活动的效果定向归因分析出来。这个时候采用对比分析是一种更近常见的方法。对比分析又可以细分为两种,一种是时间上的对比分析,也就是把活动分为前中后三个阶段来做对比分析。一种是横向的对比分析,横向的对比分析往往需要借助类似对照组这类横向的参考来评估活动的效果。

如上这些评估的方法,并不是非此即彼的,很多时候,在一场活动中,我们往往是多种方法结合来进行效果评估。

以上说了这些枯燥无味的原理,下面我们举两个🌰来说明下这些方法。

1、利用渠道包,点击归因来分析推广效果

小明所在的X公司最近在Y公司旗下的APP上面做了一场付费推广活动,目的是获取APP新增用户。为了跟踪推广活动的效果,小明制定了如下两种跟踪推广活动效果的方法:针对安卓系统,由于用户可以直接下载安卓安装包进行安装,小明就给Y公司提供了一个专门用于活动的安装包,用户点击活动链接就可以下载到该安装包,通过统计该安装包的数据,小明就知道Y APP带来了多少用户。

而对于iOS渠道,由于应用下载往往需要跳转至苹果应用商店,所以安装包的方式并不可取,于是小明打算通过点击归因的方法来跟踪活动的效果。点击归因需要Y公司进行配合,也就是在用户点击活动广告时,将这个用户的设备ID传递给小明公司,通过将这个点击设备ID,跟小明公司后端跟踪到的安装设备ID一对比,那么也可以测算出有多少用户来自Y公司。除了这个方法外,Y公司也可以定期提供设备ID数据包给小明的方法来做离线的匹配计算。

2、利用对照组来分析短信用户召回效果

小明最近做了一场短信召回用户的活动,针对一批超过30天没有活跃用户下发了短信进行召回。

在下发给用户的短信里面包括了一个页面,用户点击这个页面后,数据能够被跟踪到。页面中包括了一个下载链接,安卓用户点击该下载链接,会直接下载专属的短信召回安装包。iOS用户点击后则会跳转到苹果应用商店,用户再在苹果应用商店下载。

为了比较准确的统计短信活动的召回效果,小明采用了如下多种方法:

方法 说明
账号匹配 用户手机号码-设备ID-用户账号之间的对应关系
渠道包归因 专属于某个活动的安装包
时间对比 对比活动前中后的数据变化
对照组 对比活动组和非活动组的数据变化

根据如上方法,小明获取了如下的统计数据:

方法 指标项目 数值(个)
账号匹配  短信发送用户数量  10,000
 根据号码进行匹配回流的用户  1,000
渠道包归因  安卓渠道包的用户跟踪到的用户回流数量  200
时间比较  短信发送前1天的活跃用户数量  100,000
 短信发送期间的活跃用户数量  101,110
 短信发送后一天的活跃用户数量  101,050
对照组参考  短信发送前1天用户对照组活跃用户数量  1万人的沉默对照组中有150个活跃
 短信发送期间用户对照组活跃用户数量  1万人的沉默对照组中有155个活跃
 短信发送后,用户对照组活跃用户数量  1万人的沉默对照组中有152个活跃

小明分析以上数据发现,根据渠道包统计到的用户数量明显偏少,只有200多个,原因在于渠道包无法跟踪iOS用户,而且用户被短信唤起后,存在会主动到其他渠道下载安装的情况。于是小明不把渠道包的数量当作一个可靠的活动效果数据。

账号匹配的回流用户数据为1000个,这个数据跟采用直接用时间对比1100个相差不大。用线上活跃用户数据进行对比得出的用户数据比账号匹配多或者少都是正常的,因为除了活动本身外,线上的数据还会受到非活动因素的干扰,由用户主动因素或者其他因素等。从这个角度分析看,账号匹配回流的用户数据似乎是更可靠的,初步断定短信召回了1000个用户,召回率为10%。

但小明也不敢100%肯定这1000个用户就完全是短信召回的效果带来的。毕竟保不准,这1万个沉默的用户里面会有一部分用户会自然回流。为了更准确的评估,小明把眼光放在了对照组(这个对照组的样本结构参照本次召回用户结构设计,对照组里面不包括被下发短信的用户)。为了排除自然回流的干扰,小明建立了一个1万的人沉默用户对照组,前中后三天,这1万人的对照组中,分别有100,150,120个人活跃,回流率分别为1.5%,1.55%和1.52%。

小明认为这个对照组跟短信召回的用户具有一定的代表性,于是小明根据对照组调整后的召回用户数变成了

10,000*(10%-1.55%)=845人。

最终小明得出结论本次活动的用户召回为845人。

在用对照组进行对比分析时,我们一定要避免对照组不具有代表性的情况。

倘若小明由于前面活动的效果很好,打算增加短信用户的召回面。决定发送100万。那么原先这1万对照组的样本是否还有代表性就需要打个问号了。科学的方法是在这100万回流用户中专门再随机抽样一定的用户比例来建立一个新的用户对照组,而不是采用老的对照组。

]]>
老用户召回套路这么多,为什么留存率这么差 //www.otias-ub.com/archives/672555.html Sun, 07 Jan 2018 12:23:17 +0000 //www.otias-ub.com/?p=672555

一个产品历经时间发展,其积累的用户越来越多,而流失的用户也往往占到很高的比例,对流失的用户做召回已经成为用户增长运营的重要手段之一。

定期的常规召回和不定期的非常规召回

按频率来看,用户召回可以分为常规召回和非常规召回,常规召回,常规召回往往是近期和定期的召回,如可以在用户不活跃超过3天,7天,14天和28天的时候,给用户发个消息,提醒他常回来看看。

非常规召回则常见于非常时候的用户召回,往往也会针对流失时间很久的用户。如电商网站在其购物节都会向大多数用户发送消息,提醒用户上来看看。一些上市公司也喜欢在季末发送消息,吸引用户回归,达到完成KPI的目的。

召回消息的用户价值是核心

而向用户发送什么样的消息是提高召回率的关键。一般而言,给用户发送的消息有功能的升级,好友互动,精彩的内容,优惠等这些具有价值的诱惑无疑可以吸引用户注意。

功能升级是通过新鲜感和工具价值吸引用户回归。对于帮助人们解决问题的工具类产品而言,这个当然是用户最核心的价值了。如某个呼声很高的功能终于可以使用了或者某个功能的bug被修复了。

如果是社交产品,好友的互动消息也是吸引用户回归的好手段。社交产品玩这类往往玩得很溜,如某陌生人交友软件告诉你,附近有几个人暗恋你了,快上来看看他们都是谁。或者你关注的女神刚刚发布了失恋的状态。

如果是内容性的产品,如短视频或视频app,精彩的内容无疑是最好的召回手段了,当然这里也限于纯内容的产品,也可以包括电商网站的上新。

对电商网站而言,优惠打折无疑是最有号召力的了。这就是为什么双11来临之际,你会收到各种天猫买过东西的店铺的轰炸,告诉你多少折扣,多少优惠,企图吸引你回来。

召回方法虽然不少,但需综合权衡成本和效率

有了好的内容就成功了一半,接下来你就需要通过一些触达手段让用户知道这些信息。如果用户真的流失了,其实可以触达用户的手段就很少了。目前互联网企业常用的触达手段有push,短信,邮件和广告。

push这个方法适用于用户还没有把你的app彻底删除说再见的时候。企业能否向用户发送push取决于用户是否关闭了你app的消息推送,如果关闭了贵司APP的消息推送,你就需要绕点弯路,通过第三方app来唤起。很多大公司APP会通过一些相互唤起的保活合作来提高push消息的推送,一些第三方的push服务商也会提供类似的服务,但企业往往需要支付点费用。相比短信而言,push毕竟是个免费或者成本毕竟低廉的方法。

当用户已经彻底卸载了APP的时候,短信就成为了召回流失久远用户的主要方法之一了。在移动互联网上,用户用手机号码注册或者关联手机的比例日益增加,于是手机号码就成了很好的召回手段。发个短信的价格往往在几分钱,但短信的转化率往往也奇低无比,导致很多APP短信召回一个老用户的成本可能都需要几块钱,甚至十几块钱,而且不断攀升。优化短信召回效率除了对用户做更多的细分和精准召回外,把历史召回无效的用户样本剔除出去是个好办法。失恋的男女都懂得多次复合请求无效后应该适当放弃,但很多企业却傻乎乎不知道这个道理,去年在发了几次短信无效,今年仍然在继续徒劳无功发送,除了招致用户反感和投诉,以及高额的短信账单外,企业并无真正收益。

由于多数用户对于邮件的依赖越来越低,除了经常使用邮件的人群外,邮件在用户召回中的作用已经越来越少。往往见于电商类,企业级应用的用户召回。

广告虽然也是召回老用户的一种手段,但通过广告召回老用户,成本跟你获取一个新用户基本没有什么差别。广告的效率之所以低就是这个缘故。广告召回老用户往往效率极低,提高广告召回效率往往涉及到DMP或者数据的对接,对于注重数据安全的公司并不是个好主意。

如果不再爱了,前任攻略往往都是失效的,对低召回率要有心理准备

跟生活中的道理一样,如果用户不再使用你的app了,肯定是产品无法满足用户需求了。如果用户已经有替代品,你的召回极为可能是徒劳的。如果用户没有找到替代品,且仍然存在需求,虽然有一定概率召回,但召回率肯定是高不到哪里去的。如果用户已经没有了需求,那么这些召回的努力也是枉然了。

多一点真诚,漠视留存的欺骗套路还是少点好

召回概率低还不是最糟糕的,糟糕的是召回来的用户,产品也大概率留不住。

召回用户留存率低的原因往往是消息传递的价值,跟用户的预期与产品实际体验存在较大的偏差。

让留存率问题变得雪上加霜的是,有些公司为了完成公司的KPI,一味追求召回率,于是就采用各种连哄带骗的性质。如一个交友类的APP,告诉你,通信录有好几个妹子暗恋你了,兴冲冲上去一看,妈蛋一个都没有;一个购物类的app,告诉你今天购物打骨折,上去一看,尽是套路。这就类似在恋爱生活中,你试图跟前任复合时,一个劲地悔恨自己过去的行为,说自己已经变得更好更强,并许以将来种种的美好,前任竟然被说动了,相处几天一看,发现却是江山易改本性难移,一切的海誓山盟都是套路的忽悠。

用户是傻子,但不可能永远是傻子。如果你的用户造成了如下这张图里面的一个召回波峰,第二天就永远流失;如果你后续但召回的转化率一次比一次差,除了反思产品外,你还需要反思贵司的道德和价值观。

]]>
华尔街开始对财经新闻数据分析 //www.otias-ub.com/archives/565104.html Fri, 17 Feb 2017 12:30:28 +0000 //www.otias-ub.com/?p=565104 2016年11月9日,德国法兰克福证券交易所内一台电视正在播放特朗普胜选的新闻

就在美国媒体公信力因大选纷争备受质疑之际,旧金山联储的一项研究证明,新闻报道在预测经济活动方面具备巨大潜力。

旧金山联储的经济学家发现,衡量新闻报道所含情绪的指标与同时期商业周期指标之间存在很强关联性。同时,新闻报道中所隐含的情绪变化能预测未来经济活动。经济学家们选取了1980年1月至2015年4月美国16家主要报纸的经济新闻报道和社论,再依据特定标准从中挑选大约23.1万篇文章作为研究对象。

根据他们的研究,多数情况下,在预测联邦基金利率、消费、就业、通胀、工业生产以及标普500指数方面,衡量新闻报道情绪的指标要比目前广泛使用的指标表现更好。已有指标包括密歇根大学消费者信心指数和大型企业联合会消费者信心指数,它们分别创立于上世纪40年代末期和1967年。

这项研究基于一种假设,即经济情绪会影响到经济活动。目前有两种观点支撑着这种假设。一是所谓的“动物精神”概念,即消费者和商业信心本身可拉动经济活动。第二,信心指标可能纯粹是提供了信息,它们包含公众如何看待未来经济状况的相关消息,但这些信息尚未来得及在真实数据中得到体现。

那么,究竟如何判定一篇经济新闻报道中所体现的“情绪”呢?旧金山联储的研究人员采取了一种新颖的衡量方法 —— 通过一个拥有专利的机器学习预测模型,去给新闻文本内容中一系列不同情绪的表达程度打分。模型会评估整个句子结构,然后就其是否属于某种情绪分类给出一个概率评分。

这种方法与通常使用的文本式(或词库式)分析方法形成鲜明对比。文本式研究方法基于文章中一些特定词语(如糟糕、疲弱、平稳、强劲等等)出现的频率来判断一篇报道的情绪倾向。为了达到对比的目的,研究者同时使用了这两种方法。

关于新闻报道如何影响金融市场的研究并非是新鲜事物。不过,旧金山联储这一研究的特殊背景在于,基于大数据和计算机算法的量化投资策略正在金融行业变得更加繁荣。

专注于量化金融领域的美国经济智库The Thalesians创始人沙希德-阿曼(Saeed Amen)对彭博说,旧金山联储研究报告的得出的结果是说得通的。“因为经济新闻本身就是所发布经济数据的一种体现。同时,经济新闻中包含着前瞻性的评论。”

阿曼本人曾做了大量基于新闻情绪分析的投资策略研究。在2015年的一项研究中,他在高频实时数据分析的基础上创建了“基于新闻的经济意外指数”。然后,他利用这些指数建立了两个宏观投资模型,分别是四大经济体(美国、欧盟、英国、日本)主权债期货交易,以及美国国债期货利差交易。

测试结果显示,从2011年到2015年:

经风险调整后,基于新闻情绪分析的四大经济体主权债期货交易组合回报率为1.14,相应的被动管理组合为0.79;

经风险调整后,基于新闻情绪分析的美国国债利差交易组合回报率为0.9,相应的被动管理组合为0.46。

阿曼这一研究的特别之处在于,他将新闻情绪分析应用到了宏观资产领域,而不是具体的股票投资。由于难以建立准确模型,这种宏观领域的运用被认为是一项复杂的工作。

他在研究中的一个直觉性发现是,表现最佳的交易规则往往与“战争冲突”和“安全”等新闻话题相关。他说:“在地缘政治明显不稳定的时期,我们可能会看到投资者从风险资产转向避险资产,比如美国国债。”

除了报纸这样的传统媒体,社交媒体和搜索引擎等也已成为此类研究关注的对象。其中就包括新任美国总统特朗普爱不释手的推特。

英国利物浦大学金融学教授科斯塔斯-米拉斯(Costas Milas)2015年参与的一项研究显示,在当时的希腊债务危机期间,与“希腊退欧”(Grexit)相关的社交媒体讨论和谷歌搜索影响到了德国与一些欧元区外围国家之间的利差。这种影响甚至超出了经济数据的影响。

米拉斯参与的研究还发现,谷歌和Facebook上的“希腊退欧”搜索查询对市场造成的影响不及推特热词标签 “#Grexit”。他认为这是意料之中的。因为比起Facebook,人们更愿意点击推特上的链接。

他指出,(按照当时的数据)Facebook用户大约70%的新闻链接来自己家人和朋友,只有13%来自于新闻机构。相比之下 ,推特用户27%的新闻链接来源于新闻机构或记者,36%来自于家人和朋友。这种多样性意味着推特能提供范围更广泛的信息。

米拉斯说,大量的学术研究表明,社交媒体讨论的话题能预测金融市场的走势。这在负面经济新闻的传播中尤其明显。这种情况下,只使用金融变量的传统模型就显得力不从心了。

比如,美联社的推特账户曾在2013年4月23日被黑客攻击。遭劫持的账户发出了这样一条假新闻:“白宫发生爆炸,(前)总统奥巴马受伤。”随后,标普500指数一度蒸发掉超过1300亿美元市值。直到美联社澄清、白宫出面回应,市场才迅速恢复。

相关研究还表明,在线搜索行为不仅会影响股市走势,还影响到流动性不那么强的房地产市场。研究称,买家在评估可获取信息时的搜索密度越大,价格受到的影响就越大。

]]>
有了数据分析,餐饮行业会有哪些不一样? //www.otias-ub.com/archives/563857.html Tue, 14 Feb 2017 13:26:21 +0000 //www.otias-ub.com/?p=563857
本文作者 Bourree Lam 是《大西洋月刊》的副主编,本文阐述了数据分析对一个餐厅而言的重要性。

为了使一个餐厅变得成功,必须多关注一下食物以外的东西。这个行业以利润率闻名,如果没有一个精明的老板,即便是最好和最受欢迎的餐厅也很难生存下去。

Damian Mogavero 是餐饮行业的顾问,他分析了上千家餐厅的数据——哪个菜点的最多,哪个服务员可以带来最贵的账单,甚至还有天气如何——他发现这些指标可以帮助餐厅老板做出决策。最后,Mogavero相信他所收集的这些数据可以告诉他怎么让顾客开心。

Mogavero 认为不应该只是餐厅老板重视餐饮行业的数据分析,餐厅的主顾们也应该关注,这样他们最喜爱的餐厅才能环绕在他们身边。我最近和Mogavero 进行了交流,我们谈论了在行业里数据的作用,以及餐厅如何在当今见多识广的顾客面前存活下去。下面是谈话记录。

Bourree Lam: 你是怎么进入餐饮行业的?

Damian Mogavero: 在我十几岁的时候,我就爱上了餐饮行业。我那时是新泽西Hyatt的一个餐厅洗碗工,我学到了一节非常重要的课。总经理对我说:“如果你想在这个行业里取得成功,你所要做的就是超越顾客的期望。” 这句话至今还在激励着我。

Lam: 所以在二十年前,你创办了一个软件公司Avero,让餐厅可以看到他们自己的数据。你的第一个客户是谁?

Mogavero: Tom Colicchio和Danny Meyer是我最早的客户。那时他们还是Gramercy Tavern的合伙人,打算开始建造他们自己的美食帝国。Sushi Samba的Shimon Bokovza也是最早的客户。他们几位都非常开朗和上进,并且他们真正理解作为失意的餐厅老板的我所知道的那些商业问题。没有真正有用的信息可以帮助他们做出非常重要的商业决策。

Lam: 为什么说餐饮行业更倾向于直觉而不是数据分析?

Mogavero:它太具创造性了,并且它真的吸引了有创新精神的人,他们享受客户体验的艺术和设计。当我还是一个失意的餐厅老板时,我会问我的厨师和经理简单的问题,如:谁是你的顶部和底部的服务对象?你的食物成本为什么上升?你的劳动力成本为什么上升?然后他们会给我白眼、错误的答案或者编造的东西。真正让我感到绝望的是为什么花了这么长的时间去攻读管理的学位。

他们以各自不同的方式当着他们失意的艺术家,因为我所问的那些问题都被埋在一堆Excel的电子表格里了。我想说的是,办公室里从没发生过好的事情。在那里,你不能让顾客开心,也不能做出美味的食物。这就是我所看到的问题。我召集了一个厨师、一个侍酒师、一个餐厅经理以及三个技术人员作为公司的创始团队。我们传达的信息是:我们会创建一个软件,所以你可以回去做那些更有利可图的选项。

在过去,你只要开了饭店就能开始运营。但现在已经不可能了。

Lam: 但是你在书里说,这更多的是关于创造性而不是关于数据。

Mogavero: 数据会带领你去做出正确的决定。在书的开头,我说我爱Montauk的Navy Beach餐厅的人。他们从数据里知道了最好的天气是阴天。通过这个发现,他们意识到他们需要在晴天做一些不同的事情。这会把更多的顾客带到餐厅里。

Lam: 我喜欢书里的这个故事,因为它告诉我们仅仅收集数据然后观察它们是不够的——你需要在它们上面做些什么。你从你客户交给你的价值数十亿美元的资产负债表中分析出了什么呢?

Mogavero: 分解的办法就是,你有了你的平均账单并且还有进入你餐厅的人数的数据——这就是销售额。去理解驱使着这两个关键变量的数据是非常重要的。这都是关于客户体验的一致性。

在成本方面,你有食物成本的数据并且知道在下雨的星期六或晴天的星期天某一道菜的销量。每个菜单选项都有它自己的需求模式,所以如果你可以分离出这些,你就能降低你的食物成本,这将是销售额的30%到35%。在劳动成本方面,也占销售额的30%到35%,是关于理解需求模式的,所以你真的安排了正确的劳动力,不论是服务员、调酒师还是厨师。举个例子,在Fogo de Chao,他们真的擅长去理解那些模式以及它们根据活动和天气改变的方式。我们真正讨论的是理解背后的那些推动收入和成本的指标,以及困扰所有行业的最后一件事就是盗窃。

Lam: 你的软件所收集的数据是如何运用到那些更高收益的餐厅的呢?

Mogavero: 我们从销售点系统中挖掘数据,这是一个存储成千上万数据的地方。我们提供一个记分卡,上面记录着像开胃菜卖的如何、红酒卖的如何以及用餐时间这样的信息。利用这些简单的信息,你可以去给特定的服务进行培训。

Lam: 在书里,你说到在餐饮行业生存下去有多困难——只有60%的餐厅在三年后还能营业。但还是有一些餐厅持续着爆满的状态。

Mogavero: 迄今为止,现在是当美食家的最好时期。作为顾客我们有如此多的选择,因为大的趋势是我们期待着每个地方都有美味的食物。从曼哈顿的岛屿、纽瓦克的机场到我们手机上的应用程序。从餐厅的一面来说,大家对食物的觉醒创造了一个不可思议的机会。但也正因为如此,行业内的竞争从未停过,正在经历着史无前例的充满危险和挑战的时期。

我们现在生活在一个社交媒体的时代,比如Yelp,引导人们去发现新的地点。而很多时候,回到你喜爱的地方是要付出一些代价的。顾客的反应现在越来越透明了。顾客比以往更精明了,这是好事,但也让餐厅受到了更多的监督。

我们同样明白更高质量的原材料需要花费更多的钱,所以在食物的成本上,压力还是很大的。每个人都知道劳动力成本正在上升,房地产的成本也在上升,所以从顶端到底端因为这些因素都充满着压力。这也是为什么对于一个成功的餐厅来说,技术是一个关键的因素。

Lam: 这是一条有趣的平行线——当顾客得到更多的信息,餐厅也同样需要这些信息。

Mogavero: 这也是我开启地下烹饪之旅的原因之一。我和我的同事开启了这个旅行。我的公司拥有250亿的食物和饮料的数据,然后我注意到了一件事:同店销售额大于两位数的餐厅和小于两位数的餐厅是有很大差别的。我问自己:为什么会这样?

因此,我在七年前开始了这段旅程,去研究这个行业的定性的方面到底发生了什么。目的是给这个国家的餐厅老板看一看未来,因为在纽约,过去需要花20到30年才能成为餐饮界的主流。因为有线电视、社交媒体和食物博客,这些在纽约、旧金山和洛杉矶的美食餐厅仅需花6到12个月便能成为主流。我们的想法是帮助餐厅老板看到真正的美食一代的到来。

Lam: 那在其他方向呢?这个趋势是否也在大城市快速发展呢?

Mogavero: 因为信息传递得太快了,你会经常看到大城市的主流趋势传递到二线城市。但是你也会看到大城市会有一些趋势。这些都是因为信息流变得更透明且更快了。厨师在大城市昂贵的生活费用让二级市场觉醒了,我们看到很多厨师都离开了大城市。证据就是 James Beard 奖,你会看到获奖的人有很多来自二级市场。

Lam: 你看到哪些类型的餐厅正在这个新的透明的食物系统中挣扎呢?

Mogavero: 第一种就是那些大型的连锁餐厅。他们从不创新,将会持续受到挑战。顾客的期望值真的提高了。在过去,你可以直接开一个饭店然后运营。但这已不再可能了。

这本书是关于我们的餐厅经验是如何转化为两件大事上的:数据和技术的运用,以及美食一代趋势的顺应。我认为如果你不根据这个模型前进,你可能会不太好过。

有多少次你走进一家餐厅,然后有一次很棒的体验并爱上了这个餐厅。然后,你再次去那里的时候会想:这里发生了什么?这还是那家餐厅吗?这件事发生在了我的身上。或者你明明预订了,但是他们并没给你安排座位;或者你找不到你的账单在哪里;或者你只是想点另一杯饮料。这些事情的发生都是由于餐厅老板没有分析数据。对于我而言,这就是关于一个做正确事情的人在激励所有人。你不仅想让你的餐厅存活下去——你还想让它们不断创新,并且你从中获得你想要的体验。

翻译来自:虫洞翻翻 译者ID:盖里君

来自:译东西 

]]>
2017年数据分析行业发展趋势 //www.otias-ub.com/archives/553190.html Tue, 03 Jan 2017 10:38:51 +0000 //www.otias-ub.com/?p=553190 2016年刚刚过去,我们不妨回过头来总结一下今年数据分析的情况。美国总统大选可以说是今年最引人关注的事件之一。与很多媒体报道的一样,共和党的一位战略家Mike Murphy曾经预测希拉里会当选。事实上,当他看到川普当选的结果时,不禁感叹到,数据已经死亡。

然而,现在预测数据的死亡显然是过早的。IDC近期一项研究表明,大数据以及商业分析的市场在2016年的增长率高达11%,到2020年的复合年增长率可以达到11.7%。在即将到来的2017年,数据分析行业同样是机会与挑战并存。不妨来看一看我们对于数据分析行业在2017年发展的预测。

非结构化数据将逐渐占据主导地位

非结构化数据是不能融入关系数据库的数据,包括视频、PPT、文档等内容。结构化数据分析告诉我们的是现在发生了什么,而非结构化数据的分析告诉我们的则是为什么。然而,2015年IDG的一项调查显示,只有43%的被调查者会优先选择非结构化数据,因为目前支持分析非结构化数据的工具太少。2017年,机器学习以及数据可视化工具将快速发展,我们有望看到非结构化数据地影响力不断提升。

嵌入式分析将快速发展

嵌入式分析是目前商务智能发展最快的领域。Logi公司的调查显示,超过66%的被调查者表示正在使用嵌入式分析,30%的被调查者表示将会考虑使用这一工具。

嵌入式分析近年来的发展可以说是指数级的,我们也希望它之后的几年能够维持这样良好的发展态势。Logi的研究表明,商务用户对嵌入式分析的使用率是传统商务智能工具的两倍。Gartner2016年的嵌入式分析报告也显示,87%的应用提供商认为嵌入式分析对用户很重要,这一比例在2015年则为82%。

数据科学家角色的演变

Forrester的一项研究表明,2017年人工智能的投资额将会是2016年的三倍,将会极大地促进数据分析在市场营销、电子商务应用、产品管理等商务领域的应用。在2015年的一项调查中,只有51%的数据分析决策者表示,他们可以独立搜集并且分析数据而不需要技术人员的支持,这一比例在2017年将会变成66%。

这是否就宣告了数据科学家的死亡了呢?答案显然是否定的。美国西北大学Kellogg管理学院的数据分析项目执行主任Joel Shapiro表示,“在正常的情况下,数据是可以自动生成并且进行分析的。但是从根本上说,分析学存在的意义是得出与其他方法不一样的结论。我对于现在的分析产品感到十分怀疑,我认为它们声称的下载数据并且自动生成消费者洞察的结论是不成立的。”从短期来看,数据科学家几乎不可能被取代,但是随着人工智能逐渐代替传统的报告与分析等智能,我们希望看见数据科学家在未来的几年变得更有创新性,从而保证不被人工智能所淘汰。

消费者行为分析的发展

单单在美国,所有公司明年在数字广告上的花费就预计将达到770亿美元,而来检测这笔花费是否值得的方法则是看消费者的反馈。预测单个消费者性格的能力为定制化广告提供了切实有效的工具,从而帮助营销人员根据每个消费者的性格特点进行消费者细分,而不是传统的年龄以及性别的要素。

在过去的数十年间,心理学家了解消费者性格特点以及行为的方法不外乎心理学实验以及调查问卷,而数字营销人员如今可以利用数据同样增进对消费者的了解。马来西亚科技大学的学者Ikusan R. Adeyemi表示,“研究表明,我们可以从消费者的上网习惯中推断出他的性格特征。”随着市场营销人员对数据分析工具的逐渐精通,我们乐见消费者行为分析的美好前景。

规范分析取代预测分析占据主导地位

预测分析在今年的数据行业占据了主导地位,然而在2017年,将有更多的企业选择使用规范分析方法。Gartner数据显示,规范分析市场自2014年来的复合年增长率为22%,到2019年其规模将发展到10亿美元。预测分析通过分析当前的数据集模式以及复合场景的结果为管理人员提供决策上的数据支持。尽管Gartner的调查发现只有10%的企业目前在使用预测分析方法,但是我们预测到2020年,预测分析的市场占有率将达到35%左右。

广告

其实,任凭数据行业变化,一个以不变应万变的办法便是提高自己的技能,积累实用的projects,这样无论面对任何变化都可以从容处之。为了让大家在2017年斩获心仪的数据offer,或者说在这一领域更得心应手,太阁数据科学家直通车便应运而生了。

]]>
百度内部PPT: 数据分析的道与术 //www.otias-ub.com/archives/549845.html Mon, 26 Dec 2016 10:15:01 +0000 //www.otias-ub.com/?p=549845 1482747228-6673-Zp5vEr1Dg9siafmGghO7cjVD35Cw

这是一个来自百度内部培训关于数据分享的、阅读类的PPT,文字说明非常充分,适合刚入门数据分析的朋友进行学习。

主要内容:

1、什么是数据分析(道)

1.1 数据分析是什么?

1.2 什么是做好数据分析的关键?

1.3 分析要思考业务,尤其是接地气

1.4 分析要言之有物,行之有效

2、数据分析方法(术)

3、常见的统计陷阱

4、PPT蕴含的人生哲理

1482747228-1685-E73cPrvHal96GjCwooAksLiaea3Q

1482747228-7301-GCpP5AibdTcI8TMcjFXSPBpEnXUw

1482747228-8480-fUcRQaCUvWW41rduJqM1EfdsCSEg

1482747228-5554-VDhQokAUoCGVjnFPq0CUuAnPZNmA

1482747228-5381-E6YdyIV8ztnmcaJTcQbEB2SuJUmA

1482747229-4209-Mx7laOOtckusichqibRbB9EdkKUA

1482747229-4226-GoqmfDaJuFickJtp0OM5jOB9db2g

1482747229-1426-ntelLsZYqpxed16ADp5umCicdrEg

1482747229-2625-FJcubYChibX01uauyJpfJEK76w7A

1482747229-8964-QmzicmiboenvTbdvsnB2HRA7jOMg

1482747229-3638-X8u1lhl2kN4Eaw32HWCTiaNw38Pw

1482747230-5573-SiczxOEokSnPIo0Ptro8vEVHFAzA

1482747230-8138-WL4G2uQJHxKus8ufOVhHqn2nibVA

1482747230-3982-KXQ6icChL2zApLvDo0XfBZuibUDw

1482747230-2905-b9HpG9g8cvDfnOyBr5Ah1OuMScCg

1482747230-4051-2VNhwkQ4XoWicGgSp3ibHz6Yf8CQ

1482747230-3968-ysmSzjpcUov8Cl0E9UI5JCtsicQg

1482747231-7101-EV7L5mQnpEw0jwnYtbIyibEODm3g

1482747231-1636-LWawYeFTjszregge0EnjNqzq8D1A

1482747231-4058-ItEhg7W9yow57uzNmgNcP6iccsBw

1482747231-6888-wjeycwh1wbY96JEknCp5KsGOlw4g

1482747231-4009-xpkEDmMc4eAvokyZgmhxWbZZUITQ

1482747231-2462-GIx1Hic7rN8WYho1p3qhpibRJyXw

1482747232-3859-bP4RPKEkaxYu5k0hAmxiaiagicYw

1482747232-3789-RCe5ibXVyzuUY2LAichuriaCvzTw

1482747232-8096-iaPXhkFJedqHa9SjQ7YV5Zich92w

1482747232-6443-MMFMbT6Oy7d2GT0lAM0qnR25977g

来自:36大数据

]]>
从零开始数据分析:一个数据分析师的数据分析流程 //www.otias-ub.com/archives/546384.html Wed, 14 Dec 2016 15:09:56 +0000 //www.otias-ub.com/?p=546384 数据分析百科给出准确定义:指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

简而言之就是有目的的收集数据、分析数据,使之成为信息的过程。

数据分析过程1、探索性数据分析

初步获取的数据是杂乱无章的,通过图表形式对数据进行整合,找寻数据之间存在的关系。

2、模型选定分析

通过探索性数据分析,归纳出一类甚至是多类数据模型,通过对模型再次整合,进一步分析出一定的模型。

3、推断分析

通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。

数据分析流程

1481728168-9951-f537e46669e28b4e21563a335-th

完整数据分析流程图

1. 识别信息需求

识别信息需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。

2.数据采集

了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。

在数据采集阶段,数据分析师需要更多的了解数据生产和采集过程中的异常情况,能很大程度上避免“垃圾数据进导致垃圾数据出”的问题。

2.数据存储

在数据存储阶段,数据分析师需要了解数据存储内部的工作机制和流程,最核心的因素是在原始数据基础上经过哪些加工处理,最后得到了怎样的数据。由于数据在存储阶段是不断动态变化和迭代更新的,其及时性、完整性、有效性、一致性、准确性很多时候由于软硬件、内外部环境问题无法保证,这些都会导致后期数据应用问题。

3.数据提取

数据提取是将数据取出的过程,数据提取的核心环节是从哪取、何时取、如何取。

在数据提取阶段,数据分析师首先需要具备数据提取能力。常用的Select From语句是SQL查询和提取的必备技能,但即使是简单的取数工作也有不同层次。

第一层是从单张数据库中按条件提取数据的能力,where是基本的条件语句;

第二层是掌握跨库表提取数据的能力,不同的join有不同的用法;

第三层是优化SQL语句,通过优化嵌套、筛选的逻辑层次和遍历次数等,减少个人时间浪费和系统资源消耗。

4.数据挖掘

数据挖掘是面对海量数据时进行数据价值提炼的关键,以下是算法选择的基本原则:

没有最好的算法,只有最适合的算法,算法选择的原则是兼具准确性、可操作性、可理解性、可应用性。

没有一种算法能解决所有问题,但精通一门算法可以解决很多问题。

挖掘算法最难的是算法调优,同一种算法在不同场景下的参数设定相同,实践是获得调优经验的重要途径。

在数据挖掘阶段,数据分析师要掌握数据挖掘相关能力:一是数据挖掘、统计学、数学基本原理和常识;二是熟练使用一门数据挖掘工具,Clementine、SAS或R都是可选项,如果是程序出身也可以选择编程实现;三是需要了解常用的数据挖掘算法以及每种算法的应用场景和优劣差异点。

5.数据分析

分析数据是将收集的数据通过加工、整理和分析、使其转化为信息,通常所用的方法有:

老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;

新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图;

数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务操作过程中便于业务理解和实施是关键。

6.数据可视化

数据分析界有一句经典名言,字不如表,表不如图。别说平常人,数据分析师自己看数据也头大。这时就得靠数据可视化的神奇魔力了。除掉数据挖掘这类高级分析,不少数据分析师的平常工作之一就是监控数据观察数据。

7.数据应用

数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。

数据沟通能力。深入浅出的数据报告、言简意赅的数据结论更利于业务理解和接受。

业务推动能力。在业务理解数据的基础上,推动业务落地实现数据建议。

项目工作能力。数据项目工作是循序渐进的过程,无论是一个数据分析项目还是数据产品项目,都需要数据分析师具备计划、领导、组织、控制的项目工作能力。

附:数据分析常用方法

1、描述性统计分析

包括样本基本资料的描述,作各变量的次数分配及百分比分析,以了解样本的分布情况。

此外,以平均数和标准差来描述市场导向、竞争优势、组织绩效等各个构面,以了解样本企业的管理人员对这些相关变量的感知,并利用t检验及相关分析对背景变量所造成的影响做检验。

2、Cronbach’a信度系数分析

信度是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性(consistency)来加以表示该测验信度的高低,信度系数愈高即表示该测验的结果愈一致、稳定与可靠。

针对各研究变量的衡量题项进行Cronbach’a信度分析,以了解衡量构面的内部一致性。一般来说,Cronbach’a仅大于0.7为高信度,低于0.35为低信度(Cuieford,1965),0.5为最低可以接受的信度水准(Nunnally,1978)。

3、探索性因素分析(exploratory factor analysis)和验证性因素分析(confirmatory factor analysis)

用以测试各构面衡量题项的聚合效度(convergent validity)与区别效度(discriminant validity),因为仅有信度是不够的,可信度高的测量,可能是完全无效或是某些程度上无效,所以我们必须对效度进行检验。

效度是指工具是否能测出在设计时想测出的结果,收敛效度的检验根据各个项目和所衡量的概念的因素的负荷量来决定,而区别效度的检验是根据检验性因素分析计算理论上相关概念的相关系数,检定相关系数的95%信赖区间是否包含1.0,若不包含1.0,则可确认为具有区别效度(Anderson,1987)。

4、结构方程模型分析(structural equations modeling)

由于结构方程模型结合了因素分析(factor analysis)和路径分析(path analysis),并纳入计量经济学的联立方程式,可同时处理多个因变量,容许自变量和因变量含测量误差,可同时估计因子结构和因子关系,容许更大弹性的测量模型,可估计整个模型的拟合程度(Bollen和Long,1993),因而适用于整体模型的因果关系。

在模型参数的估计上,采用最大似然估计法(Maximum Likelihood,ML);在模型的适合度检验上,以基本的拟合标准(preliminary fit criteria)、整体模型拟合优度(overall model fit)以及模型内在结构拟合优度(fit of internal structure of model)(Bagozzi和Yi,1988)三个方面的各项指标作为判定的标准。

在评价整体模式适配标准方面,本研究采用x2(卡方)/df(自由度)值、拟合优度指数(goodness.of.f:iJt.in.dex,GFI)、平均残差平方根(root—mean.square:residual,RMSR)、近似误差均方根(root-mean—square-error-of-approximation,RMSEA)等指标;模型内在结构拟合优度则参考Bagozzi和Yi(1988)的标准,考察所估计的参数是否都到达显著水平。

]]>
中美企业在数据分析上的最大差异:增长黑客的实践 //www.otias-ub.com/archives/498857.html Sun, 24 Jul 2016 15:42:34 +0000 //www.otias-ub.com/?p=498857 本文作者:GrowingIO 创始人&CEO 张溪梦,原LinkedIn商务分析高级总监,微信公众号 GrowingIO 。 链接 

一、烧钱≠增长,数据驱动是一种能力

在过去10年,中国互联网发展速度非常快,以前是流量驱动的互联网经济。随着人力成本不断攀升,竞争不断加剧,完全靠流量、预算、烧钱来获取客户和市场,已经不可持续了。如果你获取客户的成本高、速度慢且代价大,导致商业价值不能涵盖成本,最终是无法盈利和变现的。

同样获取一个购买客户,在中国可能是美国 5 倍的成本。在中国任何垂直领域都不是一个真空的领域,总会存在跟你同样估值或融资额差不多的竞争对手。如果你花钱效率比别人高,那就很容易出类拔萃,甚至把竞争对手至于死地。而高效花钱的前提,就是要有数据支持,依照数据分析去花钱。

所以只有把效率提升,用相对快的速度,更低的成本,来帮助一个企业获得增长,才是一个公司的核心竞争力之一。

获取增长里的第一步就是做好产品,让用户能够停留在你的APP、网站和服务里。以前流量为王的时代,就像一个漏水的桶,因为进来的水量很大,哪怕它在猛烈地漏水,你的桶慢慢也能灌满。但今天你进来的水越来越少,漏水的速度干不上进水的速度,这个企业就不可能有任何实质性的增长。

所以企业需要把产品做到非常高黏度,用户体验非常好、愿意天天来用的产品,就是不漏水的一只桶。然后再有效率地优化各种渠道,把新的用户导进来,这样才能获得一种爆发式的增长。

二、中美企业的四大差异

实际上这套理论,在美国已经应用了多年,这也是我们回到中国后,看到的一个核心的区别。除此之外,还有四个非常大的差异在中国和美国整个企业的市场里:

1、是否有数据驱动意识的差异

中国为数很多的企业,还没有意识到数据驱动能为企业带来的巨大价值,或者说只有少数超大规模的公司意识到了这一点。大部分中国的企业,没有意识到数据的价值,使得创始人的决策、商业知觉远远重于数据驱动,这是我的第一个印象。

2、是否进行数据分析实践的差异

在美国,数据分析不管是产品还是方法论,已经很多年了。中国很多企业发展比较快,发展时间比较短,在实用操作能力上和美国有一定差异。这种高级数据分析的能力,基本只集中在几个领头的互联网或者大型企业里,其中互联网公司更具备这种能力,而大部分企业不具备这种操作经验和能力。

3、是否用数据做决策的差异

我们发现,在中国企业内用数据做决策的人,相对美国企业内部来说,比例比较低。像以前我工作过的LinkedIn里,不能说100%,但接近80-90% 的人,每天每周都在用数据做决策和优化。在国内,通过我们对客户的了解,包括对很多付费客户的了解,他们内部用这种决策的人相对来说很少。

4、是否用工具代替人力的差异

美国已经迭代到不是靠人力解决运营效率问题的时代,他们已经完全进入工具化、产品化、规模化时代。在中国很多企业里,还停留在准备大量雇佣人,大量雇佣高级的数据工程师、分析师,甚至建造整个数据这条体系的阶段,和美国之间的差异还是蛮大的。

这四点差异也决定了我们今天在中国做产品的形态:

第一:企业不太习惯用数据分析工具,觉得没有价值。

第二:数据分析实践没有什么太大的规模,只在一些核心的互联网公司里。

第三:内部人员使用数据分析工具的经验不够。

第四:数据分析工具化程度不足。

三、增长黑客的落地和实现

Sean Ellis 最先提出 “Growth Hacker” ,并帮助硅谷多家公司完成产品的快速增长,其中不少已经IPO,其中最著名的是Dropbox。当时Sean在Dropbox负责用户增长,他用了一年的时间,将用户的基数和使用频率提高了500%。

1469374927-6810-nw6ernqcz6egyx6v

增长黑客是三个角色的聚合,既是一个市场营销师,又是产品开发师,又是一个数据分析师。增长黑客的核心,是以最快的方法、最低的成本、最高效的手段获取大量的增长。

1469374927-2058-nhk69ip6311xhlnw

现在流行的海盗法则“AARRR”模型则将 “ Growth Hacker ”落地成五个可以执行的步骤,分别是:获取用户(Acquisition)、激活用户(Activation)、用户留存(Retention)、用户变现(Revenue)和推荐传播(Referal)。

分享一下国外知名的互联网企业早期实践增长黑客的案例,它们分别涉及AARRR的五个方面。

1、获取用户:Hotmail通过在每一封用Hotmail发出的邮件下面附上“Get your free email at hotmail.”聪明地实现了第一波病毒营销;

2、激发活跃:LinkedIn向客户发送同学毕业、升职等特定邮件提升活跃度;

3、提高留存:Facebook通过优化产品适应非洲网络环境,初期非洲网络速度很慢,用户留存度很低

4、增加收入:亚马逊Prime订户的各种优惠和增值活动:如“70美元免费运输”的活动,将营业额提高了150%。

5、传播推荐:把Dropbox介绍给新用户,可以获得增长空间。

而这些实践的背后都涉及到数据分析,如转化分析、留存分析、渠道分析、a/b测试等等。正式这些以价值为导向的数据分析将增长黑客落地,不断驱动业务和客户的增长。

四、以价值为导向的数据分析,任重道远

增长黑客这套框架,是相对普世的,尤其是中国的创业者更加需要。中国大数据生态是技术先行于理论体系的,而美国是理论体系稍微先行于技术。比如增长的这套框架,不是一套产品实践的框架,而是一套商业管理方法论的框架,有了这套框架以后,用各种产品和工具来补足,就变得可执行了。

在中国大数据已经火爆了三四年,很多企业却还没有找到落地和变现的方法。增长这套方法论,已经被很多企业证明是有价值的,包括 LinkedIn、Facebook、Airbnb都在实践,从企业建立半年后就可以开始应用了。这套方法论在国内有很大的需求,结合企业内部的运营,才能为企业产生价值。

我们还想通过产品和践行,纠正一个误区。对很多中国互联网企业来说,他们认为只要接入了你的工具,立刻就能看到效率。实际上并不是这样,必须要把数据化运营这套方法论,结合到每一天的运营里去,同时很熟练地使用数据分析的工具。这是一个不断循环、不断提升的过程。我们在 LinkedIn 不是通过一个项目就带来了50% 的增长,而是很多个小的项目,不断演化、迭代,最后产生几何倍数的增长。

]]>
四年不间断数据分析告诉我们的四个经验教训 //www.otias-ub.com/archives/492812.html Thu, 07 Jul 2016 16:26:51 +0000 //www.otias-ub.com/?p=492812 导 读

1.追踪一次点击很简单,一次点击只是一次点击。但用户与移动应用的互动方式可谓五花八门,包括单击、长按、滑动、摇晃和其他很多手势操作。

2.如果你自称是数据驱动,但每件事情都必须由一位分析师经手,那么你就不是真正的数据驱动。

3.为了某些变量而进行优化,你将在短期内受益,但从长远来说将毁掉你的公司。为了用户体验而进行优化,虽然需要更长的时间才能看到效果。

数据分析日新月异。

大多数变化起因于从PC端计算向移动端计算的过渡。移动端对数据分析而言仍然是个新领域。变化太快,所有人都在寻找更新、更好、更快的解决方案。

四年来,我们一直在分析数据,从未间断。在帮助企业进行数据分析的时候,我们发现了四个经验教训,希望能和大家分享共勉。这些经验教训事关大局,但有时会在追新求快的过程中被忽视。它们至关重要,如果你想成功地发挥数据的全部潜力,就必须将这四个经验教训牢记心中。

1. 你的工具现在不一样了

人们想当然地以为,他们用来进行日常网站分析的工具应该也适用于移动端。但并非如此。网站和移动端不是体验产品的两个途径,它们是完全不同的媒介,有各自的结构、组织、动机和指标:

·身份识别:移动应用没有Cookies。用户在首次下载和注册时,会生成一个唯一ID,这就是用户的身份识别码。

·离线使用:用户并不总是在线使用移动应用,因此不能单纯地依靠在线追踪。

·手势操作:追踪一次点击很简单,一次点击只是一次点击。但用户与移动应用的互动方式可谓五花八门,包括单击、长按、滑动、摇晃和其他很多手势操作。

1467908790-5874-3417eb9bbd9018e80c1744
·群组分析:用户使用移动应用的时间显然是从安装开始,到不再活跃使用为止,因此你可以对某些群体的行为方式和他们对变化的反应进行深入分析。

·赚钱方式:通常来说,网站通过广告赚钱,因此他们的分析服务于那个目标。移动应用往往不是这样,而是试图通过额外的安装,直接从终端用户手中赚钱。

经验教训:重视移动端

用户在移动端体验产品的方式完全不同,因此你用来分析这些用户的工具必须进行调整。移动分析并非可有可无,对打造一款出色的移动产品至关重要。

移动分析是最强大的工具之一,不容忽视。比起普通的分析工具,移动分析将让你对用户行为有一个全新的了解,而你了解到的东西将帮助你改善用户满意度,提高用户留存率,打造出更具粘性、更加强大的产品。你的公司将因此变得更加壮大。

2. 数据可获取性现在变得更加重要

移动优先的约会应用Tinder开始走红后,他们以前有效的分析平台不堪重负,本应该只用几分钟就搞定的查询请求却花了几个小时。这是不可接受的,尤其是考虑到我们希望我们作出的几乎每个决定都有数据做支撑。

以前,所有的数据请求都通过机构内部的一个中心节点进行处理,如果产品经理需要有关用户行为或者转化漏斗的信息,他们会向数据科学部门提出请求,然后得到回复。

现在,移动设备更小的屏幕、更精简的菜单和更具多样性的互动方式产生了大量的日常用户信息。每家公司都渴望获得数据。

要是没有办法使数据对所有人可用,机构的决策机制将陷入瘫痪。

经验教训:打破陈规

确保你的工具服务于整个机构的数据需求。Instacart公司的法里德·莫萨瓦特(Fareed Mosavat)说:“如果你自称是数据驱动,但每件事情都必须由一位分析师经手,那么你就不是真正的数据驱动。”

随着你的公司开始扩大规模,这会变得越来越重要。数据请求量的猛增将大大减缓公司的决策速度。因此,你必须采用一种打破陈规的分析解决方案。

如果只是你和你的联合创始人,自制的工具可能就足够了,但其他人仔细考虑了数据可获取性的问题。你需要专注于发展你的公司,而不是寻找尽可能好的分析解决方案。

3. 请不要搞砸用户体验

几年前,初创公司的“增长黑客”对Facebook和Zynga等公司的巨大成功痴迷不已,他们开始利用技术手段来实现自己应用的增长。

但实现增长的技术手段会口耳相传,一家公司做出了一个好东西,于是一传十,十传百,其他人开始模仿。但他们做起来总要差那么一点。同样的招数不能用两次。

因此,有些应用为了短期指标而过度优化,最后变得几乎一无是处。那些社交分享按钮、黑暗模式、全屏接管和烦人的通知推送可能会在短期内提高你的用户转化率,但从长远来看,它们几乎总是会让你付出代价。

Facebook等公司得以实现增长并非是因为它们发现了某些低层次的转化率指标需要加以解决。如果它们在发展初期采取了现在某些应用的做法,基本上如今就会跟MySpace同样下场了。

以前和现在继续靠数据致胜的公司总是把用户体验放在首位。每次更新,哪怕对用户的负面影响很小,也需要仔细地权衡利弊。从长远来看,留住用户的正是始终保持良好体验的做法。

经验教训:倾听用户的声音

大多数程序员在编写软件的时候,也编写了单元测试。这些代码块向程序输入数据,模仿实际用户的行为。通过监督运行结果,开发人员可以知道他们的应用是否达到预期效果。

你在进行试验的时候,不要只是做出更新,然后抱以最大的希望。要学会改变思维方式。如果更新幅度很大,先让团队成员试用。如果没有什么问题,再让数量有限的一群用户试用。

不要为了更新而更新:分析使用者的反应,然后评估你是否想更大规模地推出这个更新。

4. 分析用户行为,不要盲目行动

在数据分析方面,最大的转变是从原始和高级数据过渡到更加全面的行为分析。

四年前,想要理解应用的使用情况,你基本上有三个选择:

·分析个人用户如何浏览和使用应用的原始数据。

·分析高级数据可视化仪表板,其中包含转化漏斗和留存率图表。

·聘请一支出色的数据科学家团队,收集、处理和分析各个群体如何使用你的应用,以及他们为什么这样使用。

前两点很有用,但还不够。第三点太花钱。但现在的一些工具比四年前的工具更加便宜、更易于使用,使那种“如何和为什么”的分析成为可能。

基本原则是分组。不要着眼于个别用户或者整个用户群,而要分析用户群组的行为模式。找到你认为会提高你的应用长期留存率的行为模式,然后进行更加深入的分析。

重点不在于把某个按钮做成绿色,使用户转化率提高微不足道的0.04%。关键是要找到用户体验中的拐点,使用户一次次地回头使用。

1467908790-3625-3417eb9bbd9018e80c3345
经验教训:保持简洁

有无数种方法来分析应用产生的数据。眼光不要狭隘,不要认为成功的最好办法是为了你觉得重要的某些随机转化变量而进行优化。

不管是以前、现在还是未来,重要的只有一件事:用户体验。你的分析必须服务于用户体验,而不是反过来。找到使你的应用脱颖而出的用户行为,然后在这些行为上加大投入。

为了某些变量而进行优化,你将在短期内受益,但从长远来说将毁掉你的公司。为了用户体验而进行优化,虽然需要更长的时间才能看到效果,但方向是正确的。

结论:

向移动端的转移已经在很大程度上改变了数据分析。它大幅增加了可追踪事件的数量,改变了我们分析那些事件的方式,使用户体验变得前所未有地重要。

移动分析的新奇性已经使很多人就移动分析应该如何去做提出了各自的想法和框架,学习新的策略不是一件坏事。但在寻找解决办法的过程中,要始终把大局放在心中:

·让你的团队拥有合适的工具

·让你的团队可以获取数据

·不要损害用户体验

·分析人们如何使用你的应用

围绕着这四点组织你的试验和分析,你将为长期的成功做好准备,眼光不要只是局限于眼前的好东西。

原文:4Lessons Learned From 4 Years Of Non-Stop Data Analysis

原文来源:business2communit

By.Archana Madhavan

编译:车品觉

]]>
数据分析中6个常规的错误 //www.otias-ub.com/archives/484274.html Wed, 15 Jun 2016 14:37:47 +0000 //www.otias-ub.com/?p=484274 1466001444-5691-8gvt0w9Hu3bib1nqxic557Tic6LQ

大数据时代,数据分析成为最重要的事情。但是,如何正确地进行数据分析?如何才能不被隐藏的数据欺骗?以道御术,方为正途。本文整理归纳自百度数据分析专家,百度技术学院(BIT)讲师,百万美金大奖获得者毕然老师的 《大数据分析的道与术》 ,帮你认清数据分析的常规错误!

 

1. 错把关联当因果

夏天雪糕销量越好,游泳溺水的事件也越多,是不是雪糕中某种成分对人影响的后果呢?简单的思考后就会发现,是因为气温越高,雪糕销量会越高,同时温度越高,去河里游泳的孩子就越多,溺水事件也就越多,雪糕销量和溺水是关联关系,而并非因果关系。

上面的例子很简单,也很容易被识破,但在实际的数据分析中,关联和因果并不是那么容易区分。再举一例:

某广告公司分析人员发现:每月广告投入越高的用户,越不容易流失,而广告投入低的用户群则很容易流失,从而得出结论:“高投入会降低客户流失率,建议销售引导客户提高首月广告投入,从而降低新客流失率”。而实际情况是,新客户初期的投入常常都比较少,看广告有了效果之后,才会逐步扩大广告投放预算,投入高的客户流失率低是因为认可广告投放效果,而不是因为花的钱多。

关联性很容易判断,如何判断是否是因果关系呢?因果符合下面的特征:

  • 两个事件是关联的,就是说总是同时出现
  • 原因在前,结果在后
  • 原因消除的话,结果也消除

因果关系需要设计相对严谨的对照来证明,更多的时候需要靠经验来判断,这时候更注意要谨慎下结论。

2. 不匹配的比较

例:美国与西班牙战争爆发后,不少美国人不愿意参军,坦诚是因为怕死,针对这种情况,美国军方做了一份统计报告来劝说大家参军:“可靠数据统计,美国海军的死亡率是 0.9%,而同期纽约市民的死亡率是 1.6%”,潜台词非常明显,如果惧怕死亡更应该参军,因为在军营中比呆在纽约更安全。

这个例子乍看起来很有道理,如果你仔细琢磨,就会发现其中的阴谋:比较的对象不一样!如果仔细查阅,就会发现,美国海军死亡名单基本都是健康的青年小伙,而纽约市民的死亡名单大多是老弱病残,这两份数据放在一起显然不合适。

在做数据比较的时候,需要选取合适的比较对象,以便更准确地认知和发现结论,在数据分析中,一般选取的比较对象有以下几类:

  • 自身历史 与历史同期相比,比如去年同期或上个季度。
  • 同行竞品
  • 合理预期 与之前产品发展的预期相比,比如:A 产品的研发,比预期收入提高 10%
  • 同质对照组 A/B Test 结果的对比

3. 基于个案的认知

每当劝说朋友戒烟时,朋友总会拿出这个段子:

不抽烟不喝酒,63岁–林彪

不抽烟只喝酒,73岁–周恩来

只抽烟不喝酒,83岁–毛泽东

既抽烟又喝酒,93岁–邓小平

吃喝嫖赌样样有,103岁–张学良

没有任何坏习惯,一生做好事–23岁,雷锋

无论抽不抽烟,一个人都可能在各个年龄下死亡,从宏观的统计上分析,抽烟的人的寿命平均比不抽烟的人小 5 岁,而上面举出的个例,则无法说明问题。

4. 精挑细选的数据维度

例:一所艺术院校,男生校服只有裤子款式,而女生有裤子和裙子两种款式,经统计得知 75% 的女生选择裙子,25% 的女生选择裤子,今天你进入校园,远远看到一个穿裤子的同学,他是男生的概率更高,还是女生的概率更高?

凭感觉得到的答案是男生概率高,因为所有的男生都穿裤子款式,而只有 25% 的女生选择裤子款式。这个例子中忽略了一个重要的数据:男生和女生的人数。

如果告诉你,该学校共 1000 人, 900 人是女生,100 人是男生,结果是什么?

女生选裤子的有 900*25% = 225 人

男生选裤子的有 100 人

很显然,这种情况下,这个人是女性的概率更高。在普通人看来,往往会有男女各占一半的经验误解。所以,在一些情况下,隐藏了部分数据就是说谎。

5. 过多脑补的推理

在一个冬日的晚上,产品流量出现下跌,经过一番分析,得出原因:天气太冷,网民因为手冷而不愿意上网,提前上床睡觉,所以流量下跌。

在一个冬日的晚上,产品流量出现上涨,经过一番分析,得出原因:天气太冷,网民不愿意出门,只好在家窝着上网,所以流量上涨。

该案例背后的信息是:一个结果可能有多个原因可以解释,“大忽悠”往往引导人们只去相信其中的一个,整个推理过程没有对应的细节数据辅助。

6. 先入为主的偏见

先别往下看,这幅图的内容是什么?

1466001444-9186-HRvMn677sDX9G6x9iaQR7TicTCDA

你可能觉得这幅图太过模糊和抽象,一时也看不出是什么,如果告诉你说,这是一只斑点狗,很多人就会恍然大悟,觉得确实是一只斑点狗。这里隐藏了一个重要的心理学理念:

你脑子里想的是什么,你就会去寻找什么,你将会得到你期盼的结果

—— 勃朗宁

该理念有个通俗的说法是“人们只会看见他们愿意看见的事情”。

在数据分析中,虽然很难不带任何“先入为主”的观点,但依然要追求追求客观分析的态度,也要适时根据数据去观察和反思,不断修正自己的观点。

 

]]>
详解数据分析的一般步骤及业务分析方法 //www.otias-ub.com/archives/474511.html Sun, 22 May 2016 15:39:29 +0000 //www.otias-ub.com/?p=474511 导读:数据分析对企业来说意义重大,现在数据分析岗位也很普及。好的数据分析,能为企业转型决策提供依据,作为企业中的顶梁柱,你怎么能不会数据分析?今天小编跟大家一起来学学数据分析的一般步骤及业务分析方法。

1463931541-1164-3417eb9bbd9018a4c0df0f
一、数据分析的一般步骤浓缩精华版

第一步:数据准备:(70%时间)

•获取数据(爬虫,数据仓库)

•验证数据

•数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集)

•使用python进行文件读取csv或者txt便于操作数据文件(I/O和文件串的处理,逗号分隔)

•抽样(大数据时。关键是随机)

•存储和归档

第二步:数据观察(发现规律和隐藏的关联)

•单一变量:点图、抖动图;直方图、核密度估计;累计分布函数

•两个变量:散点图、LOESS平滑、残差分析、对数图、倾斜

•多个变量:假色图、马赛克图、平行左边图

第三步:数据建模

•推算和估算(均衡可行性和成本消耗)

•缩放参数模型(缩放维度优化问题)

•建立概率模型(二项、高斯、幂律、几何、泊松分布与已知模型对比)

第四步:数据挖掘

•选择合适的机器学习算法(蒙特卡洛模拟,相似度计算,主成分分析)

•大数据考虑用Map/Reduce

•得出结论,绘制最后图表

循环到第二步到第四步,进行数据分析,根据图表得出结论完成文章。

二、数据分析业务分析版

“无尺度网络模型”的作者艾伯特-拉斯洛·巴拉巴西认为——人类93%的行为是可以预测的。数据作为人类活动的痕迹,就像金矿等待发掘。但是首先你得明确自己的业务需求,数据才可能为你所用。

1.数据为王,业务是核心

•了解整个产业链的结构

•制定好业务的发展规划

•衡量的核心指标有哪些

有了数据必须和业务结合才有效果。首先你需要摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。

2.思考指标现状,发现多维规律

•熟悉产品框架,全面定义每个指标的运营现状

•对比同行业指标,挖掘隐藏的提升空间

•拆解关键指标,合理设置运营方法来观察效果

•争对核心用户,单独进行产品用研与需求挖掘

发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用你的感觉去揣测用户的感觉,因为每个人的教育背景、生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要使用直觉与观察(数据可视化技术来呈现)。

3. 规律验证,经验总结

发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。

有关数据分析,还有更多更重要的内容值得我们去学习,今天的数据分析步骤和业务分析方法希望能对大家有帮助。

作者:纽带线CRM

]]>
三个你在书中无法学到的数据分析知识 //www.otias-ub.com/archives/454270.html Fri, 25 Mar 2016 10:19:48 +0000 //www.otias-ub.com/?p=454270 1458901031-6081-GCfic7YFhAkXfk3dHicaoVfglAzw

在大数据特别热门的今天,出现了各种培训课程。但我发现这些课程的重点都放在算法的学习上。如何理解logistic回归或深度学习的确很酷,但一旦你开始处理数据,你会发现还有其他的东西更为重要。

我在大学里教了很多年的深度学习,这些课程和讲座总是特别注重特定的算法,你学习支持向量机器、高斯混合模型的聚类、k-均值等等,但是只有在你写硕士论文的时候你需要用到这些方法。
那么什么才是正确的呢?关键就是你要保证你做的模型对于未来的数据也能有好的表现,所以我在这里教你三个书本不能教给你的知识。
1、对模型的有正确的认识是关键
数据分析、机器学习或是数据科学的主要目的,就是建立一个能预测未来数据的系统。在普通情况中,你很难发现监督学习(例如分类)和无监督学习(例如聚类)之前的区别,你通常会使用你构建和设计的方法去搜集一些数据,但最终你希望你设计的模型可以应用到未来的数据,并且确保该模型行之有效,可以同你对原始数据的测验结果相同。
初学者经常会犯的一个错误就是,只看到了已有数据的表现,就认为这对未来数据是适用的。很不幸的是事实通常不是这样,例如在一个监督学习的案例中,任务是根据你的输入输出的行为来预测,例如把电子邮件分为垃圾邮件和非垃圾邮件。
如果你只考虑训练数据,那么对机器来说很容易返回完美的预测结果,只是通过死记硬背就可以。机器因为其容量大,可以存储和检索大量的数据,但这导致过度拟合,缺乏概括。
所以适当的评估方式是通过分割数据,分析一个部分,然后预测其他部分来模拟未来的结果。通常,训练部分是庞大的,过程也要重复数次,以获得几个数字来看看什么才是合适的方法,这个过程称为交叉验证
尽管方法看起来如此可靠,还是经常会发生错误,特别是当数据是不稳定时,例如数据的基础分布会随时间变化,在现实中这是经常发生的,6月的销售数字和12月的就会有很大不同。或者数据点之间具有大量相关性,也就是说,如果你知道一个数据点意味着你已经知道了很多关于另一个数据点的信息。例如,股票价格通常在一天之内会从一个价格跳到另一个价格,如果你搜集这些数据,并做了测试,很可能会推导出和它有相关性的数据。
每当出现这种情况,你就会得到过于乐观的数字,你的方法将无法在未来真正的数据中很好地工作。在最坏的情况下,当你终于说服别人来使用你的方法时这个方法并不能达到预期效果。所以学习如何正确评估是关键!
2、一切都在于特征提取
学习到一种新的方法是令人兴奋的,但事实是,大部分最复杂的方法执行起来基本是相同的,而真正的区别是在通过学习把原始数据的特征提取出来。
现代的学习方法是非常强大的,很容易在几十秒内处理成百上千的数据点,但事实是,这些方法是非常愚蠢的,特别是线性模型(如Logistic回归,线性支持向量机)方法基本上同你的计算器一样傻乎乎。
它们善于通过足够的数据鉴定出特征,但是如果信息不足,或者没有通过输入线性组合展现特征的,它们就什么也做不了。它们也无法通过洞察数据的来实现数据自身的缩减。
换句话说,你可以通过合适的特征来大量减少数据所需的量。假设说你减少了所有要预测的函数的特征,还有什么东西需要学习,对不对?那是多么强大的特征提取!
这意味着两件事。首先,你需要确保你掌握了这些方法中的一个,而且要坚持下去。所以你真的不需要Logistic回归和线性向量机都学习,只学习其中一个就行。这也包括你需要理解哪些方法是类似的,这其中的关键点在于底层的模型。所以深度学习是不一样的,但线性模型在表现上来看是差不多的,尽管这些方法有些不同,但是在大多数的案例中都可以得到类似的预测结果。
第二点,你需要学习所有关于这个行业的特征。不幸的是这是一门艺术,而且几乎没有任何教科书可以提供,因为只有很少的理论。正常化有一个很长的道路,有时特征需要提前对数。每当你可以消除一些自由度,你就可以显著地减少你所需要训练的数据量。
有时候发现这些类型的转化是很容易的。例如如果你正在做手写字符的识别,如果有前景色和背景色的区别,字符的颜色就会变的很重要。
教科书往往只提供一些看起来很强大的方法,你需要用数据测试一下就能得出结果,这也可能是从理论观点和数据源来说是对的,但是在现实中,数据和我们的时间是有限的,所以寻找大信息量的特点是非常有必要的。
3、选型大多数是看周期,而不是数据集的大小
你不想在大数据时代过多的表达自己的观点,但是大多数数据会完美的融入你的主内存。你的方法可能不会在跑数据上花费很长时间,但是你会花很多时间从原始数据中提取出特征,进行交叉验证。为你的学习方法比较不同特征提取管道和参数。
对于模型的选择,你可以通过大量的参数组合,评估一个相同的数据副本的性能。现在的问题就是所有的组合爆炸,比方说你有两个参数,它需要大约一分钟来训练你的模型,并获得一个结果来评估数据集的性能。如果每一个参数有5个候选数值,并且执行5倍交叉验证(把数据分割成5部分,测试5次,在每次迭代中使用不同的数据来测试),这意味着你需要运行25次来找出哪种方法的效果更好,这可能需要花费两个小时的时间。
好消息是这是很容易并行化的,因为不同的运行是完全相互独立的。这同样适用于特征提取,您通常使用相同的操作(解析,提取,转换等),以每个数据独立设置,导致一些“ 密集并行”。
坏消息是这对做数据分析的人来说是很多的,因为所有的这些意味着对复杂办法实现拓展实现是没有什么需求的,但是对于储存的并行数据运用一些相同的算法在大多数情况下都非常有帮助。
最后有很多数据并不意味着你需要所有的数据,问题是有关于潜在学习问题的复杂性。如果这个问题可以用一个简单的模型解决,你就不需要用那么多的数据来推断模型的参数。这种情况下,采用数据的随机子集可能会有很大的帮助。正如我上面所说的,有时候正确的共您可以帮助他们减少所需要的数据点的数量。

总之知道如何正确的评价可以帮助你减少一个方法不能应用与未来数据的风险。获取正确的特征提取可能是最有效的。

作者 | Mikio Braun,数据科学家和机器学习专家,柏林工业大学博士后

]]>
数据分析工作常见的七种错误及规避技巧 //www.otias-ub.com/archives/449376.html Wed, 16 Mar 2016 04:36:32 +0000 //www.otias-ub.com/?p=449376 1458102981-8396-common-data-science-mistakes

“错误是发现的入口。”——James Joyce (著名的爱尔兰小说家)。

这在大多数情况下是正确的,但是对于数据科学家而言,犯错误能够帮助他们发现新的数据发展趋势和找到数据的更多模式。说到这儿,有一点很重要:要明白数据科学家有一个非常边缘的错误。数据科学家是经过大量考察后才被录用的,录用成本很高。组织是不能承受和忽视数据科学家不好的数据实践和重复错误的成本的。数据科学的错误和不好的数据实践会浪费数据科学家的职业生涯。数据科学家追踪所有实验数据是至关重要的,从错误中吸取教训,避免在未来数据科学项目中犯错。

福尔摩斯有一句名言是如何定义侦探的,而数据科学家在商业中的角色就类似侦探。

“我是福尔摩斯,我的工作就是发现别人不知道的。”

企业要想保持竞争力,它必须比大数据分析做的更多。不去评估他们手中的数据质量,他们想要的结果,他们预计从这种数据分析中获得多少利润, 这将很难正确地找出哪些数据科学项目能够盈利,哪些不能。当发生数据科学错误时——一次是可以接受的——考虑到有一个学习曲线,但是如果这些错误发生在两次以上,这会增加企业成本。

在Python中学习数据科学,成为企业数据科学家。

避免常见的数据科学错误:

1、相关关系和因果关系之间的混乱

对于每个数据科学家来说,相关性和因果关系的错误会导致成本事件,最好的例子是《魔鬼经济学》的分析,关于因果关系的相关性错误,导致伊利诺斯州给本州的学生发书,因为根据分析显示家里有书的学生在学校能直接考的更高分。进一步分析显示,在家里有几本书的学生在学业上能表现的更好,即使他们从来没有读过这些书。

这改变了之前的假设和洞察:父母通常买书的家庭,能营造愉快的学习环境。

大部分的数据科学家在处理大数据时假设相关关系直接影响因果关系。使用大数据来理解两个变量之间的相关性通常是一个很好的实践方法,但是,总是使用“因果”类比可能导致虚假的预测和无效的决定。要想实现利用大数据的最好效果,数据科学家必须理解相关关系和根源的区别。关联往往是指同时观察X和Y的变化,而因果关系意味着X导致Y。在数据科学,这是两个完全不同的事情,但是许多数据科学家往往忽视了它们的区别。基于相关性的决定可能足以采取行动,我们不需要知道原因,但这还是完全依赖于数据的类型和要解决的问题。

每位数据科学家都必须懂得——“数据科学中相关关系不是因果关系”。如果两个关系出现彼此相关的情况,也不意味着是一个导致了另一个的产生。

2、没有选择合适的可视化工具

大部分的数据科学家专心学习于分析的技术方面。他们不能通过使用不同的可视化技术理解数据,即那些可以令他们更快获得洞察力的技术。如果数据科学家不能选择合适的可视化发展模型,监控探索性数据分析和表示结果,那么即使是最好的机器学习模型,它的价值也会被稀释。事实上,许多数据科学家根据他们的审美选择图表类型,而不是考虑数据集的特征。这个可以通过定义可视化的目标避免。

即使数据科学家开发了一个最优秀和最好的机器学习模型,它也不会大叫说“尤里卡”——所有这些所需要的是结果的有效可视化,可以理解数据模式的不同,和意识到它的存在可以被利用来获得商业成果。常言道“一张图片胜过1000个单词。”——数据科学家不仅要熟悉自己常用的数据可视化工具,也要理解数据有效可视化的原理,用令人信服的方式获得结果。

解决任何数据科学问题的至关重要一步,就是要获得该数据是关于什么的洞察力,通过丰富的可视化表达,可以形成分析基础和建立相应模型。

3、没有选择适当的模型-验证周期

科学家认为,建立了一个成功的机器学习模型,就是获得了最大程度的成功。但是,这只是成功了一半,它必须要确保模型的预测发挥作用。许多数据科学家经常忘记或者倾向性的忽视这样的事实,就是他们的数据必须在指定的时间间隔进行反复验证。一些数据科学家经常犯的一个普遍性错误:如果和观察到的数据吻合,就认为预测模型是理想的。已建立的模型的预测效果可以因为模型的关系在不断变化而瞬间消失。为了避免这种情况,数据科学家最好的解决方式就是每个小时都对含有新数据的数据模型进行评分,或者基于模型的关系变化快慢逐日逐月评分。

由于几个因素,模型的预测能力往往会变弱,因此数据科学家需要确定一个常数,用以确保模型的预测能力不能低于可接受的水平。有实例即数据科学家可以重建数据模型。能建立几个模型和解释变量的分布总是更好的,而不是考虑单个模型是最好的。

为了保留已建模型的预测效果和有效性,选择迭代周期是非常重要的,如果做不到,可能会导致错误的结果。

4、无问题/计划的分析

数据科学协会主席Michael Walker说: “数据科学的最高级用途就是设计实验,提出正确的问题和收集正确的数据集,一切工作都要根据科学的标准。然后你将获得结果,并解释它。”

数据科学是一个结构化的过程,以明确的目标开始,随后出现一些假设的问题,最终实现我们的目标。数据科学家往往站在数据之上而不考虑那些需要分析回答的问题。数据科学项目必须要有项目目标和完美的建模目标。数据科学家们如果不知道他们想要什么——最终得到的分析结果将会是他们不想要的。

大多数数据科学项目最终是回答“是什么”的问题,这是因为数据科学家通过手头的问题作分析而不遵循做分析的理想路径。数据科学是使用大数据回答所有关于“为什么”的问题。数据科学家应该通过整合以前未被整合的数据集,主动分析给与的数据集,回答以前没人解答的问题。

为了避免这种情况,数据科学家应该集中精力获得正确的分析结果,这可以通过明确实验,变量和数据准确性和清晰明白他们想要从数据中获得什么实现。这将简化以往通过满足假设的统计方法来回答商业问题的过程。引用伏尔泰的一句话——“判断一个人,是通过他的问题而不是他的答案。”——先确定明确的问题是及其重要的,能够实现任何企业的数据科学目标。

5、仅关心数据

根据博思艾伦咨询公司的数据科学家Kirk Borne,“人们忘记在数据的使用,保护以及统计产生的问题如认为相关关系就是因果关系会产生伦理问题。人们忘记了如果你处理的数据足够长,它就会告诉你任何事,如果你有大量的数据,那么你就可以找到相关关系。如果人们拥有大数据他们会相信他们看到的任何事情”。

数据科学家常常因为得到来自多个数据源的数据而兴奋,并开始创建图表和可视化来做分析报告,忽视发展所需的商业智慧。这对任何组织来说都是危险的事情。数据科学家经常给与数据太多决策制定的权力。他们不够重视发展自身商业智慧,不明白分析如何令企业获益。数据科学家应该不仅仅让数据说话,而且善于运用自身的智慧。数据应该是影响决策的因素而不是数据科学项目决策制定的最终声音。企业雇佣的数据科学家应该是可以将领域知识和技术特长结合起来的,这是避免错误的理想情况。

6、忽视可能性

数据科学家经常倾向性忘记方案的可能性,这将导致作出更多的错误决策。数据科学家经常犯错,因为他们经常说,如果企业采取了X操作一定会实现Y目标。对于特定的问题这没有唯一的答案,因此要确认数据科学家从不同可能性中所做的选择。对指定问题存在不止一个可能性,它们在某种程度是不确定的。情景规划和可能性理论是数据科学的两个基本核心,不应该被忽视,应该用以确认决策制定的准确性频率。

7、建立一个错误人口数量的模型

如果一个数据项目的目的是建立一个客户影响力模式的模型,但是他们仅仅考虑那些具有高度影响力的客户的行为数据,这不是对的做法。建立该模型不仅要考虑那些具有高度影响力的客户的行为数据,也要考虑那些不怎么有影响力但是具有潜在影响力的客户的行为数据。低估任何一边人口的预测力量都可能导致模型的倾斜或者一些重要变量的重要性下降。

这些都是数据科学家在做数据科学时常见的错误。如果你能想到的任何其他常见的数据科学错误,我们很乐意在下面的评论听到你的想法。

原文:7 Common Data Science Mistakes and How to Avoid Them

]]>
百度:数据分析之道(PPT) //www.otias-ub.com/archives/449321.html Wed, 16 Mar 2016 04:09:42 +0000 //www.otias-ub.com/?p=449321 1458101348-2033-3417eb9bbd9018531a6321

 

1458101348-9311-3417eb9bbd9018531a6422

 

1458101348-6500-3417eb9bbd9018531a6423

 

1458101348-7010-3417eb9bbd9018531a6424

 

1458101348-4784-3417eb9bbd9018531a6525

 

1458101348-3089-3417eb9bbd9018531a6526

 

1458101350-7673-3417eb9bbd9018531a6627

 

1458101350-4947-3417eb9bbd9018531a6628

 

1458101350-6950-3417eb9bbd9018531a6629

 

1458101350-3056-3417eb9bbd9018531a672a

 

1458101350-9591-3417eb9bbd9018531a672b

 

1458101350-9599-3417eb9bbd9018531a672c

 

1458101351-5352-3417eb9bbd9018531a682d

 

1458101351-1217-3417eb9bbd9018531a682e

 

1458101352-8194-3417eb9bbd9018531a692f

 

1458101352-3474-3417eb9bbd9018531a6930

 

1458101354-1152-3417eb9bbd9018531a6931

 

1458101352-5072-3417eb9bbd9018531a6a32

 

1458101353-2609-3417eb9bbd9018531a6a33

 

1458101354-4867-3417eb9bbd9018531a6a34

 

1458101354-5899-3417eb9bbd9018531a6b35

 

1458101354-8257-3417eb9bbd9018531a6b36

 

1458101355-5822-3417eb9bbd9018531a6c37

 

1458101356-1953-3417eb9bbd9018531a6c38

 

1458101356-8044-3417eb9bbd9018531a6c39

 

1458101356-7669-3417eb9bbd9018531a6d3a

 

1458101356-4302-3417eb9bbd9018531a6d3b

 

1458101357-6469-3417eb9bbd9018531a6e3c

]]>
2016年占主导地位的21项数据分析和趋势发展 //www.otias-ub.com/archives/440044.html Thu, 18 Feb 2016 12:59:47 +0000 //www.otias-ub.com/?p=440044

153b064ad6c1889d3fe

随着社交媒体、移动化和云计算的发展,数据分析及相关的技术已经作为一款具有颠覆性的技术在这个数字时代占有了一席之地了。在过去的2015年中,我们已经看到对大数据的分析利用正被一股强大的利用新的数据技术以加强商务智能的推动力推动着由测试步入到了生产阶段。

Hadoop发行商Hortonworks公司的CTOScottGnau预测以下趋势将在2016年主导数据和分析市场领域:

  获取一切可提供洞察分析价值的数据

在2016年,企业将着眼于从所有数据中获得洞察价值,Gnau表示说。“这不只是关于物联网,而是要通过互联网连接起凡是能够提供洞察分析价值的一切设备。”他说。“我们要超越传感器等相关设备,着眼于一切可以从中获取洞察价值数据信息的设备,这包括来自企业生产过程中的服务器日志、地理位置和来自互联网的所有数据。”

 重视边缘数据

Gnau表示说,企业必须超越他们的数据中心并开始重视利用边缘的数据。他指出,数据流现在收集了来自许多传感器和服务器之外的设备上的数据,例如,来自海上的石油钻塔或太空中的卫星。这使得管理安全边界及提供跨系统的完整数据源有一个巨大的机会。Gnau表示说IoAT创建了一个新的模式,需要新的思维和新的数据管理系统,而这些解决方案将在2016年变得更加成熟,并进一步渗透到企业运用中去。

运动平台的数据

在2016年,业界将看到运动平台的数据运用的发展。“企业用户有对于更高级别的平台来处理许多设备协议,并把所有的数据流汇集到Hadoop的需要。”Gnau表示说。“该平台需要方便多协议语言的通信。运动数据和静态数据的整合是2016年中的一个大机会。”

大数据变得容易

有市场对于简化大数据技术方面有需要,并为此在所有层面都存在的机会:技术、消费等领域。Gnau表示说,在2016年,数据分析技术将明显有趋于走向简单化的趋势。“无论你是集群操作员、安全管理员或是数据分析员,每个人都希望Hadoop及其相关的大数据技术是简单直接的。”他说。“其处理过程就像一个单一的集成开发经验或减少设置或配置文件的数量一样将开始出现一刀切的模式。”

Hadoop用于关键任务工作负载

在2016年,Hadoop将被用于交付更多的关键任务工作负载,并超出“网络规模化”的企业,Gnau预测说。“虽然像雅虎、Spotify和TrueCar这样的公司都建立了相关的业务部门以便充分利用Hadoop,我们将看到更多的传统企业使用Hadoop,以便从其所管理的大量数据中提取有价值的见解,并提供新的关键业务分析应用程序,而这想要简单地实现,没有Hadoop是不可能的。”他说。

IT系统管理解决方案提供商Adaptiva公司创始人兼首席技术官迪帕克·库马尔预测:

今年,数据将得到限制

“对于数据的使用将变得更加规范,因为供应商将无法跟上数据的需求;而企业也将无法跟上成本的上涨。”库马尔说。“这样一来,企业将开始利用技术来监测这些数据。”

系统管理将因为大数据分析而变得智能化

“大数据分析解决方案的集成整合将继续功亏一篑,留下未连接的孤岛的数据的业务洞察力未被发现——而系统管理将介入帮助。”他说。

能源分析专家FirstFuel软件公司首席数据科学家巴德里·拉加表示,在2016年,我们将看到:

 数据的运用更加民主普及化

拉加说,多亏了像亚马逊的MechanicalTurk这样的解决方案,使得企业和个人用户将能够更方便地收集来自世界各地的数据信息,而在此之前他们是无法实现的。“不仅能够更容易的找到数据,同时更加用户友好的工具的出现将使人们无需具备大量的数据知识就能进行数据信息分析,从而确保获得有意义的价值洞察了。”他说。

 对于数据隐私权问题的关注将增加

欧洲最近制定了严格的数据监管规定,这意味着企业用户将需要针对如何解决数据安全问题制定相应的战略。”企业已经不能仅仅将数据隐私问题视为一个事后考虑的事项了,他们需要主动的解释他们是如何使用数据的,确保其符合企业所在地及全球的相关监管法律法规。”他说。

为了从数据分析中发掘数据价值见解,新的应用程序将被开发

拉加说,在2016年,企业和个人用户将进一步挖掘数据并进行分析,以提供个性化的引人入胜的跨行业的数据体验,包括能源,体育,社会公益和音乐领域。“比如,人们将能够使用数据以根据自己的个人喜好来改变歌曲。”他说。

商业智能和分析企业Tableau软件公司的产品营销总监丹·高根预测了2016年大数据领域的一系列发展趋势,包括:

NoSQL获得发展

高根说,2016年,NoSQL数据库将成为领先的企业IT环境,作为无模式的数据库概念的优势会变得更加明显。“没有比从Gartner的运行数据库管理系统魔力象限能够看到更加令人震惊的显示画面了。”而这在过去,甲骨文,IBM,微软和SAP是占主导地位的。“相比之下,在最近的魔力象限中,我们看到了研发NoSQL的公司,包括MongoDB、DataStax、Redis实验室、MarkLogic和亚马逊网络服务(其DynamoDB产品),数量上超过了Gartner的领导者象限报告的传统数据库供应商。

 ApacheSpark进一步用于大数据分析

ApacheSpark已经从Hadoop系统的一个组件成为了不少企业大数据平台的选择了。“较之Hadoop,Spark为数据处理速度带来了大幅的提升,并且已经成为目前规模最大的大数据开源项目了,根据Spark项目的发起者和Databricks的联合创始人马泰扎哈里亚介绍。”高根说。“我们将看到越来越多的企业使用案例Spark,例如,在高盛集团,Spark已成为大数据分析的’通用语言’。”

 大数据进一步成熟

Hadoop被添加到了企业标准。高根说,企业利用Hadoop的能力将在2016年变得成熟。“作为其进一步成熟的证据,Hadoop的不断发展的趋势将使其成为企业IT规划的核心部分,我们将看到围绕着诸如安全这样的企业系统组件投资的增长。”他说。“ApacheSentry项目为实施细粒度提供了一个系统,基于角色的授权将数据和元数据存储在Hadoop集群上。这些都是客户希望从他们的企业级RDBMS平台和现在的新兴大数据技术能够获得的前沿的能力类型,从而进一步消除了企业采用的一大障碍。”

 大数据获得快速发展,并进一步促进Hadoop的采用

高根说,2016年,我们将看到Hadoop获得传统上一直与数据仓库相关的性能。“随着Hadoop获得更多对于企业用户的吸引力,我们将看到来自最终用户对于同样快速的数据探索的能力的不断增长的需求,这与他们对于传统的数据仓库的期望是一样的。”他说。“为了满足最终用户的需求,我们看到越来越多地对于诸如ClouderaImpala、AtScale、ActianVector和JethroData等新技术的采用——这进一步模糊了”传统”BI和“大数据”之间的概念。

帮助最终用户发现所有形式的数据增长的选择数量进一步增加

自助服务的数据准备工具正在爆炸式的普及。高根说,部分的原因是由于转向企业-用户生成的数据发现工具的采用,如Tableau,减少了分析数据的时间。“企业用户现在希望也能够减少数据分析的准备时间和复杂度,尤其重要的是在处理各种数据类型和格式时。”他说。”我们已经看到了这一领域的创新,包括从专注于最终用户准备的大数据公司如Alteryx、Trifacta、Paxata和Lavastorm,同时还看到有长期的ETL领域的领军企业如Informatica公司对于其REV产品进行的大量的投资。”

 MPP数据仓库在云中的增长正在升温

高根说,数据仓库的“死亡”已经被炒作了一段时间了,而在这一细分市场的增长已经放缓也已经不是什么秘密了。“但我们现在将看到这项技术应用程序转移到云计算的一个重大转变,在这一个领域亚马逊凭借其在Redshift的按需云数据仓库占据了主导。”他说。“Redshift是AWS增长最快的业务,但其现在需要面临来自谷歌BigQuery、以及来自提供长期数据仓库的强势竞争者如微软产品(AzureSQL数据仓库)和Teradata的竞争、还有来自诸如2015年Strata+HadoopWorld获胜者初创公司Snowflake的竞争。分析人士认为,那些已经采用Hadoop的企业中,有90%的企业还会继续保持他们的数据仓库,通过这些新的云服务产品,这些客户可以相对于存储在他们的Hadoop数据湖的更大量的数据信息,能够动态地在数据仓库中向上或向下扩展的存储和计算资源。

融合收敛的流行:物联网、云计算和大数据结合到了一起

该技术仍处于初期阶段,但来自物联网设备上的数据将成为“杀手级应用”,成为推动云和PB级数据爆炸式增长的驱动因素之一,高根说。“出于这个原因,我们将看到了领先的云服务和数据公司,如谷歌、亚马逊网络服务和微软将把物联网服务带入我们的生活,使得数据可以无缝地迁移到他们的基于云的分析引擎。”他说。

数据仓库和大数据分析专家企业Teradata公司的企业系统总经理丹·格雷厄姆表达了他对于2016年的预测:

企业将重新设置Hadoop

格雷厄姆认为,在2016年,我们将看到企业汲取他们从以往的部署到重新构建他们的方法的相关经验教训。“随着Hadoop和相关开源技术超越了纯粹的知识收集,以及炒作的消退,企业将重新设置(但不会放弃)自己的Hadoop部署,以解决他们所学到的教训——特别是围绕管理,数据集成,安全性和可靠性等领域”他说。

关于数据分析算法的探讨将进入企业高层会议

在数据采集和数据的托管分析的制备过程中,相关的算法将升温。”他说。“这样一来,企业的CEO和投资者们将开始探讨深层的数据分析为核心业务的目标。”

数据湖泊最终会发现一些杀手级应用程序

受数据量和成本因素的影响,数据湖泊将成为原始物联网数据最常见的存储库,格雷厄姆说。”物联网M2M数据的规模大小将将超过几个数量级运行内存容量,从而推动了低存储成本的数据湖技术。”他说。

在数据中心捕获的物联网数据的价值将迅速被新的交易数据的价值所削弱

“缺乏货币化的数据字段,大多数传感器的数据将在数小时,几天或几周的时间后变为低价值,因为这些数据信息将被相同的传感器的更新的数据集合所替换。”格雷厄姆说。“架构和系统将被迫以弥补这一数据价值的快速下降,以应付数据存储和处理成本。”

]]>
如何通过统计分析工具做好APP的数据分析和运营 //www.otias-ub.com/archives/407481.html Fri, 20 Nov 2015 00:40:02 +0000 //www.otias-ub.com/?p=407481 数据分析,对于开发者和运营者都是十分重要的,漂亮的数据分析可以帮助在关键节点上线并推广应用,从而获得最大的利润。那么,该如何通过统计分析工具做好APP的数据分析和运营呢?

1 行业数据

51619433_1

行业数据对于一个APP来说,至关重要。了解行业数据,可以知道自己的APP在整个行业的水平,可以从新增用户、活跃用户、启动次数、使用时长等多个维度去对比自己产品与行业平均水平的差异以及自己产品的对应的指标在整个行业的排名,从而知道自己产品的不足之处。这种纵向的对比,会让自己的产品定位、发展方向更加清晰。

2评估渠道效果

51619433_2

在国内,获取用户的渠道是非常多的,如微博、微信、运营商商店、操作系统商店、应用商店、手机厂商预装、CPA广告、交叉推广、限时免费等等。看一个APP的数据,首先要知道用户从哪里来,哪里的用户质量最高,这样开发者就会面临一个选择和评估渠道的难问题。但是通过统计分析工具,开发者可以从多个维度的数据来对比不同渠道的效果,比如从新增用户、活跃用户、次日留存率、单次使用时长等角度对比不同来源的用户,这样就可以根据数据找到最适合自身的渠道,从而获得最好的推广效果。

3 用户分析

51619433_3

产品吸引到用户下载和使用之后,首先要知道的就是用户是谁。所以,我们需要详尽地了解到用户的设备终端类型、网络及运营商、地域的分布特征。这些数据可以帮助了解用户的属性,在产品改进以及产品推广中,就可以充分利用这些数据制定精准的策略。

 4 用户行为分析

51619433_4

在关注完用户的属性后,我们还要高度关注用户在应用内的行为,因为这些行为最终决定着产品所能够带来的价值。开发者可以通过设置自定义事件以及漏斗来关注应用内每一步的转化率,以及转化率对收入水平的影响。通过分析事件和漏斗数据,可以针对性的优化转化率低的步骤,切实提高整体转化水平。

5 产品受欢迎程度

在了解了用户的行为之后,我们应该看一下自己的产品是否足够受欢迎,这是一个应用保持生命力的根本。开发者可以从留存用户、用户参与度(使用时长、使用频率、访问页面、使用间隔)等维度评价用户粘度。进行数据对比分析的时候,要充分利用时间控件和渠道控件,可以对比不同时段不同渠道的用户粘度,了解运营推广手段对不同渠道的效果。

如果以上5点的数据都很漂亮,说明你的APP已经做得相当不错了。当然,如果你的APP还没有给你带来收入,那么你仍然有一段较长的路要走。

]]>
美国大数据产业–信息图 //www.otias-ub.com/archives/403384.html Tue, 10 Nov 2015 09:17:55 +0000 //www.otias-ub.com/?p=403384 TheDataScienceEcosystemviaCrowdFlower

数据科学早已不是新颖事物了,不过对数据品质的须要却是这几年才激增起来的。这可不是一阵时兴或旧词新用,而是一场革命。大至总统选举,小至总部设在厨房餐桌的小守业公司的各种决策,已不再是建设于直觉与猜想之上,而是植根于切实可靠的数据。

数据科学开展突飞猛进,当初各种数据工具已经构成了一个宏大的生态系统。我花了一个多月以尝试给这个生态系统勾勒出一个明晰的轮廓,在接上去的文章里会引见给大家。

数据科学本身性能交叉,许多数据公司与工具难以归类。但总体来说,它们分属数据专家任务流程中的三个主要部分:数据获取、数据解决、数据分析。

为何要勾勒这个数据生态信息系统?

我花了少量时间与数据专家交换,了解他们的任务流程、难点及处置打算。数据科学工具不可胜数,这个生态系统表当然无奈将其逐一列举,不过最罕见的软件、公司及推进这些工具开展的开源顺序都已蕴含其中。

数据专家不能只生存在R言语或Excel表格里。他们需求工具来获得品质拔尖且可用于预测分析的数据。其实我感觉这正是统计学家和数据专家的区别所在。在我看来,统计学家利用数据停止回归分析。而数据专家需求实在获取数据、停止回归分析、沟通结果、展示形式,并逾越所在机构过后的局限,立足于制高点带领大家寻求实在可行的打破开展。鉴于他们需求兼顾整个数据通道,我宿愿这个数据生态系统可能列举出数据专家门罕用的重要工具和利用方法,以及工具之间的交互联络。

如今干货来了!

第一部分:数据源

数据是整个数据生态系统的源头。总的来说,数据源可分为数据库、运用和第三方数据三类。

数据库

结构化数据库早于非结构化数据库出现。结构化数据库每年有约250亿美元的市场,你可能在数据生态系统图里看到妇孺皆知的Oracle,和一些新创公司譬如MemSQL等。结构化数据库储存有限的数据列,普通由结构化查问言语(SQL)运转,用于数据可靠欠缺至关重要的畛域,比如说财政和经营。

对结构化数据库有一个重要假定,那就是查问数据时必需能失去分歧且欠缺的结果。想一想谁绝对需求这样一种结构化数据库?对了,就是你的银行。它们存储账户信息、个体姓名、借款等等,必需随时候毫不差地知道你账户中的金额。

而另外一种则是非结构化数据库。道理之中,非结构化数据库是由数据专家们开拓的,由于数据专家眼中的数据与账户并不相反。数据专家不太在意查问结果绝对分歧,他们更关注数据的灵敏性。因此,非结构化数据在许多方面升高了对数据存储和查问的要求。

很多非结构化数据库是谷歌获失利利的间接产物。谷歌尝试把互联网存储在数据库中,高频交易合法性,其野心和工程之宏大可想而知。MapReduce是一种用于这种数据库的技术,只管它必定程度上没有结构化查问言语 (SQL)那么强大,然而用户可能依据需求来调整和扩大它们的数据。MapReduce的数据利用甚至已经超出了谷歌的初始预期。比如如今谷歌可能在一切网站间查问,并根据网站之间的互相链接来调整搜查结果。这种可量化的灵敏查问使谷歌获得了渺小的竞争劣势,因此雅虎和其余公司以巨额投资来开发这种技术的开源版本,名叫Hadoop。

此外,非结构化数据库通常所需的储存空间通常更小。在过去数据存储十分低廉,因此几年前,一些主要的互联网公司不得不每隔几个月就清空一次数据库。如今这种情况已难以构想了。

从强大的引荐引擎,到世界级的翻译系统,到令人难以置信的存货治理,都建设于这些数据之上。非结构化数据库普通来说没有结构化数据库那么精确,但关于许多运用(尤其是数据科学界),这个折衷是值得的。举例来说,比如你的非结构化数据库在100个机器上运转,然而其中有一个当机了。这时你仅用99台机器(而非100台)来决议向用户引荐观看一部特定的电影,也齐全可行。这种类型的数据库看重灵敏性,量化以及速度,哪怕不能随时保障齐全精确。

还有一个更有名的例子。一个软件公司创建了一个基于Hadoop的非结构化数据库软件Cloudera。来看看它有多大的生长空间吧:7年前,我接到风投的电话,他们预期Cloudera在寰球有10到15家公司的市场,去年Cloudera已获得了将近10亿美元的融资。

随着数据专家取代财务和会计,成为最主要的数据生产者,数据库将会越来越走进每一个体的生存 。

商业运用

十年前,没有人想过能把重要的商业数据存在云端,如见这却早已成为了事实。这兴许是商业的IT基础结构的最大转变之处。

我在数据库生态系统中列出了四种主要的商业运用,区分是销售、营销、产品和生产者,每一种性能都有多种SaaS运用可供抉择。SalesForce 应该是首先掀起这股趋向的并最先获失利利的。他们把软件开发的指标人群是终端用户(销售团队),而非单个的首席技术官。这对他们的用户十分有用,在此进程中,大家也能看到公司客户可以信赖地把重要公司数据放在云端。

销售数据不再存在于用户自己装置的内部数据库,而是被放在云端,由努力于保障数据可用且巩固的云端公司提供效劳。其余公司也纷繁效仿这种做法。当初基本上每个商业部门都有一个对应的数据运用。Marketo存储营销数据,MailChimp存储电子邮件,Optimizely存储A/B测试数据,Zendesk存储顾客满意度,诸如此类。

为什么这是相干的呢?当初每个商业部门都有强大的数据库,由数据专家分析并用于预测分析。数据量很大,却零散地分布在多个运用之中。比如说你在SugarCRM 中检查某个生产者的信息,然而当你想知道这名顾客的效劳记载时,需求去ZenDesk中检查。而假设你想要知道他能否支付了最近的账单,则要去查Xero。一切的数据都被存放在不同的地点,网站和数据库中。

商业数据被转移到了云端,可能存放更多的数据了,然而这些数据被零散地存放在全世界的不同效劳器的不同运用里。

第三方数据

第三方数据出现得比结构化和非结构化数据库都早得多。Dun & Bradstreet从1841年就末尾卖数据了。随着数据对每个机构都愈发重要,这个畛域也将会获得长足的开展。

在数据库生态系统图中,我大体把第三方数据分红四个畛域,区分是商业信息数据,社交媒体数据,网页爬虫和地下数据。

商业信息数据末尾最早。我上面提到了Dun & Broadstreet,商业数据购置对许多商业机构来说都至关重要。商业数据能回答一切B2B公司至关重要的效果:咱们的销售团队该找谁谈?当初,这些数据更被裁减运用至网上地图和高频买卖等畛域。新创的数据卖方如Factual,不只售卖商业数据,更偏差于从这些高盈利的新型畛域起步。

社交媒体数据只管是新兴产物,但开展很快。经过智能PR公司对社交媒体中的文本作情感分析,营销人员可以实在地了解到品牌热度与影响力,并有效评价品牌价值。你可能从Radian6 和DatSift里看到全副细节。

接上去咱们来看看网络爬虫,我个体以为这是一个很有开展后劲的畛域。假设可以把一切网站都作为数据源,由数据科学团队开展和分析,真不知道还有多少新型商业和技术会由此而生。当初从事网络爬虫的重要公司包含 import.io和kimono,我以为这个畛域将在接上去几年呈现爆炸式的增长。

最后,当然还要提及群众数据。假设没有数据专家团队的反对, 不知道奥巴马总统能否还可以赢得2004年的大选,这能够也是起初奥巴马大力推进 Data.gov 的缘由。许多地方政府也紧随其后。亚马逊网络效劳 存放了许多惊人的群众数据,囊括从卫星图像到坦然公司的邮件等各个方面。这些宏大的数据系列可能协助扩展新型商业,训练更智能的算法,并处置许多实践效果。这个畛域开展快速,甚至出现了 Enigma.io 这种专门协助企业利用群众数据的公司。

开源工具

开源数据储存的种类激增,尤其是在非结构化数据的存储方面,Cassandra, redistribute, Riak,Spark, CouchDB 和MongoDB 等都大受欢迎。它们多数专一于公司运用,另外也着重于数据工程的生态系统。经过这个交互式地图 你将可能一睹最受欢迎的开源数据存储及开采工具的概貌。

]]>
傲娇的大数据,真的能告诉你什么时候穿秋裤? //www.otias-ub.com/archives/399613.html Sun, 01 Nov 2015 14:00:47 +0000 //www.otias-ub.com/?p=399613 傲娇的大数据,真的能告诉你什么时候穿秋裤?

凉风有信,秋月无边,魔都大降温袭来!

于是乎DT君倒下了,此刻明显感到上呼吸道有些感染——通俗来说,就是感冒。

对症下药,DT君急忙打开了百度,郑重地在搜索框中输入“感冒”两字。然后,度娘自动推荐了“感冒了吃什么好的快”,正合孤意,轻轻一点,跳转页面第一条却是:

640

对于已经习惯了只有“喝杯热水”问候的DT君,惊喜来得猝不及防。

不过惊喜过后,细思极恐:根据我的上网行为,百度们完全能准确知道你在何时何地感了个冒,然后,趁机给你投个精准的广告。

DT君也只是害怕了三秒,随后就坠入了大数据的脑洞:

能知道我感冒的百度,当然也知道别的人是不是也感冒了。逻辑非常简单,某个时段某个区域突然出现了一大波关于“感冒”的搜索,那么基本不用怀疑,有大量的人此时此地感冒了。

什么时候是感冒高发期呢?

DT君截取了2012年到现在的百度搜索数据,发现这还真是有一点小规律。比如说,就全国来看,每年12月到次年1月,“感冒”这个词的搜索量就会暴增,并在年初到达顶峰。当然,3月以及9月也是不得不提防的次高危季节。

6402

考虑到中国地大物博,南北温差跨度之大,地区性数据可能实际价值更大。DT君又看了看魔都的搜索趋势,最近大风大雨大降温,像DT君这样上网找药的人确实节节攀升。

6430

再来看看搜索地域,似乎也有一点端倪,比方说,广东人真的很爱搜“感冒”。当然,并不能就此下定论,广东人就比较容易感冒。因为广东同学自己说了,我们这里上网的人特别多,基数大跟别的省比较很不公平!

6404

好事的DT君又去查了一下2012年以来的淘宝指数,黄色的是秋裤,蓝色的保暖内裤,灰色的是棉毛裤。

不过,广东人并不喜欢以上三类的任何一种,看来号称冬天不下10度的广东人,不喜欢买秋裤……

6405

细心的DT君还发现一个不科学的小巧合:搜索秋裤等类似产品排名靠前的地区,跟搜索感冒排名靠前的地区,几乎没有重合。

这……我们再看看秋裤、棉毛裤、保暖内裤热销的季节。

6406

秋裤的购买也很有季节规律:

每年11月中,保暖必备就会迎来突然飙升的销售高峰。凑巧,正是感冒搜索高峰来临之前。

DT君不得不构想出这样一个李菊福的故事:秋天降温了,妈妈叫你穿秋裤,听话的人都去淘宝下单了,其余各位,12月就只能去问度娘,“感冒了吃什么好得快”。

按照这个剧本:麻麻叫你穿秋裤的时候,一定要听她的话!

——分割线,上面是DT君的脑洞,下面才是有料的科普——

对于感冒(以及其他疾病),除了DT君感受到的精准营销,互联网大数据还有更高级的价值:疾病预测。

此处请出大名鼎鼎的“Google Flu Trends”(GFT),在大众看来,这可能算是大数据现实应用的先驱之作了。

2008年,GFT项目上线,试行预测流感传播。第二年《自然》刊登了一篇来自谷歌攻城师们的有趣论文:《利用搜索引擎查询数据检测禽流感流行趋势》。

预测原理跟DT君上面说到的一样简朴:在某个区域的某个时间段内,发现大家都在搜索“流感”,那么就有可能在此时此地出现了流感人群,相关部门可以依据此发布流感预警信息。

有个部门叫做“美国疾病预防与控制中心”(很多人可能更熟悉它的缩写CDC),其实也一直在默默地采集流感数据并发布预警信息,但是由于操作流程的关系,往往会滞后两个星期,这时候再发预警绝对是来不及。

谷歌攻城狮们在发表论文前,将GFT的预测数据(下图黑线)与美国疾控中心的监控数据(下图红线)做了仔细的对比,发现重合度还挺高。

6407

果然,GFT成功预测了几周后美国H1N1的爆发,一战成名。但这并不是Happy ending……后来的故事告诉我们,大数据其实很调皮!

四年后的2013年,《自然》上刊发了一篇新的论文,指出GFT预测的流感样病例门诊数超过美国疾控中心预测结果的两倍。

这……谷歌都错了,以后还怎么相信爱?

不过,2014年的《科学》上的另外一篇论文,帮忙解释了这一现象,原因归结起来就是“大数据傲慢”,具体有以下几种可能:

  • 在进行计算的过程中。很有可能会出现过度拟合(将噪声误认为信号)的情况:很多关键词只是看似与流感相关,但实际上却并无关联。

  • 相关搜索(People also search for)的算法也会对GFT造成影响。例如搜索“发烧”,相关搜索中会给出关键词“流感”,而搜索“咳嗽”则会给出“普通感冒”。

  • 搜索建议(Recommended search)也会进一步增加某些热门词汇的搜索频率。

DT君凭生活经验也觉得还有一种情况:如果新闻里都在报道感冒,大家都会好奇地搜索关心一下,于是,感冒的搜索量大幅上升。

这事也可以问度娘,在百度指数上,图中标记了字母的地方是出现了“新闻头条”的时点,可以看出有时候确实感冒主题的热点新闻后面,紧跟了一波搜索上涨,但有时候也没有……

6408

就这样,“大数据傲慢”可能会不规则地出现在各种可能性当中,从而干扰了预测的准确度。

不过,对于疾病预测的尝试不会因为这么一点小挫折就停止。

大中华区的度娘也在进行这方面的尝试,站在巨人的肩膀上,它的预测模型看起来也很科学(至于和谷歌比谁更靠谱DT君不敢下结论):

将百度自身数据(比如搜索、微博、贴吧)与中国疾控中心(CDC)提供的流感监测数据结合建立预测模型。

而且,度娘不仅可以预测流感,还把手口足病、艾滋病、肝炎、心脏病、性病、各种癌都包办了。谷歌都玩脱的事情,百度居然这么强悍?DT君不明觉厉。

百度预测的负责人曾经被问过这个问题,他是这么说的(此处为原文照登,不代表DT君的态度):

谷歌主要是通过相关性选取的检索词,而我们可以直接从原始日志数据构造特征, 在特征选取上会更灵活准确。我们的空间粒度也比谷歌更细,可以利用流感爆发在空间上的相关性做更好的预测与丰富产品功能。

6409jpg

DT君登陆上去看了下最近的热点地区和预测情况,正在大降温的魔都果然一直都盘旋在榜单前列。

顺便看了下最近的艾滋病热点地区,榜单前列来来回回都是黑龙江、云南、四川、山西……以及我大魔都,按照常识推测也很有道理的样子。这几个地区的盆友们,进行高危行为更要注意安全啊!

最后DT君想说的是,大数据在监控疾病趋势并建模预测方面,有巨大潜力可挖掘是无需质疑的,但至少在眼前,还远没有到把大数据当神算子的时候,所以这些已经研发出来的大数据疾病预测产品,参考即可。

这事,任还是很重,道也还是很远,不管是美帝还是我大天朝,攻城狮和科学家叔叔们加油~

文/唐蒂姆

来源:公众号DTcaijing

]]>
电商数据分析基础指标体系 //www.otias-ub.com/archives/393759.html Tue, 13 Oct 2015 10:19:09 +0000 //www.otias-ub.com/?p=393759 信息流、物流和资金流三大平台是电子商务的三个最为重要的平台。而电子商务信息系统最核心的能力是大数据能力,包括大数据处理、数据分析和数据挖掘能力。无论是电商平台(如淘宝)还是在电商平台上销售产品的卖家,都需要掌握大数据分析的能力。越成熟的电商平台,越需要以通过大数据能力驱动电子商务运营的精细化,更好的提升运营效果,提升业绩。构建系统的电子商务数据分析指标体系是数据电商精细化运营的重要前提,本文将重点介绍电商数据分析指标体系。

电商数据分析指标体系分为八大类指标,包括总体运营指标、网站流量指标、销售转化指标、客户价值指标、商品及供应链指标、营销活动指标、风险控制指标和市场竞争指标。不同类别指标对应电商运营的不同环节,如网站流量指标对应的是网站运营环节,销售转化、客户价值和营销活动指标对应的是电商销售环节。

  1.电商总体运营指标

 

 

总体运营指标
流量类指标 独立访客数(UV)
页面访问数(PV)
人均页面访问数
订单产生效率指标 总订单数量
访问到下单转化率
总体销售业绩指标 成交金额(GMV)
销售金额
客单价
整体指标 销售毛利
毛利率

电商总体运营整体指标主要面向的人群电商运营的高层,通过总体运营指标评估电商运营的整体效果。电商总体运营整体指标包括四方面的指标:

1)流量类指标

独立访客数(UV),指访问电商网站的不重复用户数。对于PC网站,统计系统会在每个访问网站的用户浏览器上“种”一个cookie来标记这个用户,这样每当被标记cookie的用户访问网站时,统计系统都会识别到此用户。在一定统计周期内如(一天)统计系统会利用消重技术,对同一cookie在一天内多次访问网站的用户仅记录为一个用户。而在移动终端区分独立用户的方式则是按独立设备计算独立用户。

页面访问数(PV),即页面浏览量,用户每一次对电商网站或着移动电商应用中的每个网页访问均被记录一次,用户对同一页面的多次访问,访问量累计。

人均页面访问数,即页面访问数(PV)/独立访客数,该指标反映的是网站访问粘性。

2)订单产生效率指标

总订单数量,即访客完成网上下单的订单数之和。

访问到下单的转化率,即电商网站下单的次数与访问该网站的次数之比。

3)总体销售业绩指标

网站成交额(GMV),电商成交金额,即只要网民下单,生成订单号,便可以计算在GMV里面。

销售金额。销售金额是货品出售的金额总额。

注:无论这个订单最终是否成交,有些订单下单未付款或取消,都算GMV,销售金额一般只指实际成交金额,所以,GMV的数字一般比销售金额大。

客单价,即订单金额与订单数量的比值。

4)整体指标

销售毛利,是销售收入与成本的差值。销售毛利中只扣除了商品原始成本,不扣除没有计入成本的期间费用(管理费用、财务费用、营业费用)。

毛利率,是衡量电商企业盈利能力的指标,是销售毛利与销售收入的比值。如京东的2014年毛利率连续四个季度稳步上升,从第一季度的10.0%上升至第四季度的12.7%,体现出京东盈利能力的提升。

2.网站流量指标

 

 

常用流量类指标
流量规模类指标 独立访客数(UV)
页面访问数(PV)
流量成本类指标 访客获取成本
流量质量类指标 跳出率
页面访问时长
人均页面访问数
会员类指标 注册会员数
活跃会员数
活跃会员率
会员复购率
会员平均购买次数
会员回购率
会员留存率

1)流量规模类指标

常用的流量规模类指标包括独立访客数和页面访问数,相应的指标定义在前文(电商总体运营指标)已经描述,在此不在赘述。

2)流量成本累指标

单位访客获取成本。该指标指在流量推广中,广告活动产生的投放费用与广告活动带来的独立访客数的比值。单位访客成本最好与平均每个访客带来的收入以及这些访客带来的转化率进行关联分析。若单位访客成本上升,但访客转化率和单位访客收入不变或下降,则很可能流量推广出现问题,尤其要关注渠道推广的作弊问题。

3)流量质量类指标

跳出率(Bounce Rate)也被称为蹦失率,为浏览单页即退出的次数/该页访问次数,跳出率只能衡量该页做为着陆页面(LandingPage)的访问。如果花钱做推广,着落页的跳出率高,很可能是因为推广渠道选择出现失误,推广渠道目标人群和和被推广网站到目标人群不够匹配,导致大部分访客来了访问一次就离开。

页面访问时长。页访问时长是指单个页面被访问的时间。并不是页面访问时长越长越好,要视情况而定。对于电商网站,页面访问时间要结合转化率来看,如果页面访问时间长,但转化率低,则页面体验出现问题的可能性很大。

人均页面浏览量。人均页面浏览量是指在统计周期内,平均每个访客所浏览的页面量。人均页面浏览量反应的是网站的粘性。

(4)会员类指标

注册会员数。指一定统计周期内的注册会员数量。

活跃会员数。活跃会员数,指在一定时期内有消费或登录行为的会员总数。

活跃会员率。即活跃会员占注册会员总数的比重。

会员复购率。指在统计周期内产生二次及二次以上购买的会员占购买会员的总数。

会员平均购买次数。指在统计周期内每个会员平均购买的次数,即订单总数/购买用户总数。会员复购率高的电商网站平均购买次数也高。

会员回购率。指上一期末活跃会员在下一期时间内有购买行为的会员比率。

会员留存率。会员在某段时间内开始访问你的网站,经过一段时间后,仍然会继续访问你的网站就被认作是留存,这部分会员占当时新增会员的比例就是新会员留存率,这种留存的计算方法是按照活跃来计算,另外一种计算留存的方法是按消费来计算,即某段的新增消费用户在往后一段时间时间周期(时间周期可以是日、周、月、季度和半年度)还继续消费的会员比率。留存率一般看新会员留存率,当然也可以看活跃会员留存。留存率反应的是电商留住会员的能力。

3.网站销售(转化率)类指标

 

 

网站销售(转化率)类指标
购物车类指标 基础类统计 加入购物车次数
加入购物车买家数
加入购物车买家数
加入购物车商品数
转化类统计 购物车支付转化率
下单类指标 基础类统计 下单笔数
下单金额
下单买家数
转化类统计 浏览下单转化率
支付类指标 基础类统计 支付金额
支付买家数
支付商品数
转化类统计 浏览-支付买家转化率
下单-支付金额转化率
下单-支付买家数转化率
下单-支付时长
交易类指标 成功类统计 交易成功订单数
交易成功金额
交易成功买家数
交易成功商品数
失败类统计 交易失败订单数
交易失败订单金额
交易失败订单买家数
交易失败商品数
退款统计 退款总订单量
退款金额
退款率

(1)购物车类指标

基础类指标,包括一定统计周期内加入购物车次数、加入购物车买家数、加入购物车买家数以及加入购物车商品数。

转化类指标,主要是购物车支付转化率,即一定周期内加入购物车商品支付买家数与加入购物车购买家数的比值。

(2)下单类指标

基础类指标,包括一定统计周期内的下单笔数、下单金额以及下单买家数。

转化类指标,主要是浏览下单转化率,即下单买家数与网站访客数(UV)的比值。

(3)支付类指标

基础统计类指标,包括一定统计周期内支付金额、支付买家数和支付商品数。

转化类指标。包括浏览-支付买家转化率(支付买家数/网站访客数)、下单-支付金额转化率(支付金额/下单金额)、下单-支付买家数转化率(支付买家数/下单买家数)和下单-支付时长(下单时间到支付时间的差值)。

4.客户价值类指标

 

 

客户价值类指标
客户指标 累计购买客户数
客单价
新客户指标 新客户数量
新客户获取成本
新客户客单价
老客户指标 消费频率
最近一次购买时间
消费金额
重复购买率

客户指标。常见客户指标包括一定统计周期内的累计购买客户数和客单价。客单价是指每一个客户平均购买商品的金额,也即是平均交易金额,即成交金额与成交用户数的比值。

新客户指标。常见新客户指标包括一定统计周期内的新客户数量、新客户获取成本和新客户客单价。其中,新客户客单价是指第一次在店铺中产生消费行为的客户所产生交易额与新客户数量的比值。影响新客户客单价的因素除了与推广渠道的质量有关系,还与电商店铺活动以及关联销售有关。

老客户指标。常见老客户指标包括消费频率、最近一次购买时间、消费金额和重复购买率。消费频率是指客户在一定期间内所购买的次数;最近一次购买时间表示客户最近一次购买的时间离现在有多远;客户消费金额指客户在最近一段时间内购买的金额。消费频率越高,最近一次购买时间离现在越近,消费金额越高的客户越有价值。重复购买率则指消费者对该品牌产品或者服务的重复购买次数,重复购买率越多,则反应出消费者对品牌的忠诚度就越高,反之则越低。重复购买率可以按两种口径来统计:第一种,从客户数角度,重复购买率指在一定周期内下单次数在两次及两次以上的人数与总下单人数之比,如在一个月内,有100个客户成交,其中有20个是购买两次及以上,则重复购买率为20%;第二种,按交易计算,即重复购买交易次数与总交易次数的比值,如某月内,一共产生了100笔交易,其中有20个人有了二次购买,这20人中的10个人又有了三次购买,则重复购买次数为30次,重复购买率为30%。

 5.商品类指标

 

 

商品类目指标
产品总数指标 SKU数
SPU数
在线SPU数
产品优势性指标 独家产品收入比重
品牌存量 品牌数
在线品牌数
上架 上架商品SKU数
上架商品SPU数
上架在线SPU数
上架商品数
上架在线商品数
首发 首次上架商品数
首次上架在线商品数

产品总数指标。包括SKU、SPU和在线SPU。SKU是物理上不可分割的最小存货单位。SPU即Standard Product Unit (标准化产品单元),SPU是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性。通俗点讲,属性值、特性相同的商品就可以称为一个SPU。如iphone5S是一个SPU,而iPhone 5S配置为16G版、4G手机、颜色为金色、网络类型为TD-LTE/TD-SCDMA/WCDMA/GSM则是一个SKU。在线SPU则是在线商品的SPU数。

产品优势性指标。主要是独家产品的收入占比,即独家销售的产品收入占总销售收入的比例。

品牌存量指标。包括品牌数和在线品牌数指标。品牌数指商品的品牌总数量。在线品牌数则指在线商品的品牌总数量。

上架。包括上架商品SKU数、上架商品SPU数、上架在线SPU数、上架商品数和上架在线商品数。

首发。包括首次上架商品数和首次上架在线商品数。

 6.市场营销活动指标

 

 

市场营销活动指标
市场营销活动指标 新增访问人数
新增注册人数
总访问次数
订单数量
下单转化率
ROI
广告投放指标 新增访问人数
新增注册人数
总访问次数
订单数量
UV订单转化率
广告投资回报率

市场营销活动指标。包括新增访问人数、新增注册人数、总访问次数、订单数量、下单转化率以及ROI。其中,下单转化率是指活动期间,某活动所带来的下单的次数与访问该活动的次数之比。投资回报率(ROI)是指,某一活动期间,产生的交易金额与活动投放成本金额的比值。

广告投放指标。包括新增访问人数、新增注册人数、总访问次数、订单数量、UV订单转化率、广告投资回报率。其中,下单转化率是指某广告所带来的下单的次数与访问该活动的次数之比。投资回报率(ROI)是指,某广告产生的交易金额与广告投放成本金额的比值。

7.风控类指标

 

 

风控类指标
买家评价指标 买家评价数
买家评价卖家数
买家评价上传图片数
买家评价率
买家好评率
买家差评率
投诉指标 发起投诉(申诉)数
投诉率
撤销投诉(申诉)数

买家评价指标。包括买家评价数,买家评价卖家数、买家评价上传图片数、买家评价率、买家好评率以及卖家差评率。其中,买家评价率是指某段时间参与评价的卖家与该时间段买家数量的比值,是反映用户对评价的参与度,电商网站目前都在积极引导用户评价,以作为其他买家购物时候的参考。买家好评率指某段时间内好评的买家数量与该时间段买家数量的比值。同样,买家差评率指某段时间内差评的买家数量与该时间段买家数量的比值。尤其是买家差评率,是非常值得关注的指标,需要监控起来,一旦发现买家差评率在加速上升,一定要提高警惕,分析引起差评率上升的原因,及时改进。

买家投诉类指标。包括发起投诉(或申诉),撤销投诉(或申诉),投诉率(买家投诉人数占买家数量的比例)等。投诉量和投诉率都需要及时监控,以发现问题,及时优化。

8.市场竞争类指标

 

 

市场竞争类指标
市场份额相关 市场占有率
市场扩大率
用户份额
网站排名 交易额排名
流量排名

市场份额相关指标,包括市场占有率、市场扩大率和用户份额。市场占有率指电商网站交易额占同期所有同类型电商网站整体交易额的比重;市场扩大率指购物网站占有率较上一个统计周期增长的百分比;用户份额指购物网站独立访问用户数占同期所有B2C购物网站合计独立访问用户数的比例。

网站排名,包括交易额排名和流量排名。交易额排名指电商网站交易额在所有同类电商网站中的排名;流量排名指电商网站独立访客数量在所有同类电商网站中的排名。

总之,本文介绍了电商数据分析的基础指标体系,涵盖了流量、销售转化率、客户价值、商品类目、营销活动、风控和市场竞争指标,这些指标都需要系统化的进行统计和监控,才能更好的发现电商运营健康度的问题,以更好及时改进和优化,提升电商收入。如销售转化率,其本质上是一个漏斗模型,如从网站首页到最终购买各个阶段的转化率的监控和分析是网站运营健康度很重要的分析方向。

 文:傅志华

  关于作者:傅志华先生曾为腾讯社交网络事业群数据中心总监以及腾讯公司数据协会会长。在腾讯前,曾任DCCI互联网数据中心副总裁。傅志华先生现就职于某互联网公司大数据中心副总经理,同时任中国信息协会大数据分会理事和中国互联网协会大数据工作组专家,北京航空航天大学软件学院大数据专业特聘教授,中科院管理学院MBA企业导师。

]]>
酷传:2015年8月电影APP数据分析 //www.otias-ub.com/archives/388515.html Fri, 25 Sep 2015 04:39:01 +0000 //www.otias-ub.com/?p=388515 ku1

在电影剧情精彩程度远远比不上微博里戏码的国内电影市场上,7月份的暑期档令人印象深刻,广大国民在这个暑期档终于丢弃了“看笑话,到影院,看剧情,上微博”的生活常识,奔着《大圣归来》《捉妖记》《煎饼侠》三部电影的高口碑进入了电影院。一个月55亿元人民币的票房市场完全是靠着国产电影撑起,历史性的突破就这样诞生了。国产电影终于扬眉吐气了一回。

当然这也有国产片保护月的功劳。

与此同时,各大电影APP也没闲着,电影市场的爆发对电影APP的成长有什么样的刺激呢?国内最大的应用上传监控平台酷传给出的最新数据分析,为我们做出了详尽的分析:

ku2

ku3

《速度与激情7》《大圣归来》《捉妖记》《煎饼侠》等爆款高口碑电影能大幅拉动电影市场、电影APP的成长,并协助整个市场在淡季平稳落地,不至于整个市场过山车式的忽高忽低。

ku4

ku5

猫眼电影、时光网、豆瓣电影三家长期盘踞电影APP前三名,但电影APP市场目前还无寡头。

ku6

万达电影、中影票务通在万达、中影集团亲爹的支持下,增势稳定。其中万达电影能够精确把握住每一次电影市场爆款爆发,借势发展能力最强;中影票务通则通过中影集团的资源运作,每个月都能平稳增长,逆市增长情况明显。

ku7

初创产品电影票比价依靠良好的定位,成功的产品命名带来良好的搜索优化,在2月春节电影市场高峰期取得了媒体的规模传播,从而获得了61%大幅度的增长,使得其前七月整体增长率(图5)排名第二。

ku8

淘宝电影在亲爹阿里的资源整合下,连续3个月逆市高涨。最高增幅在7月达到了66%,增幅排名第一。而阿里干儿子猫眼在7月的增幅只有8.2%,但依靠过往长期的推广积累,体量最大,增幅排名第一。

刚刚改名微票儿的QQ电影票,亲爹腾讯在7月中旬开始大规模推广,整个7月增幅高达18.6%,增幅排名第二,总量排名第五,与今年1月相比总量排名下降一位。

]]>
知微:618电商大促微博营销效果数据分析 //www.otias-ub.com/archives/359041.html Fri, 26 Jun 2015 17:30:14 +0000 //www.otias-ub.com/?p=359041 618电商大促微博营销效果数据分析_000001

618电商大促微博营销效果数据分析_000002

618电商大促微博营销效果数据分析_000003

 

618电商大促微博营销效果数据分析_000004

618电商大促微博营销效果数据分析_000005

618电商大促微博营销效果数据分析_000006

618电商大促微博营销效果数据分析_000007 618电商大促微博营销效果数据分析_000008 618电商大促微博营销效果数据分析_000009 618电商大促微博营销效果数据分析_000010

 

618电商大促微博营销效果数据分析_000011 618电商大促微博营销效果数据分析_000012 618电商大促微博营销效果数据分析_000013 618电商大促微博营销效果数据分析_000014 618电商大促微博营销效果数据分析_000015

 

618电商大促微博营销效果数据分析_000016 618电商大促微博营销效果数据分析_000017 618电商大促微博营销效果数据分析_000018 618电商大促微博营销效果数据分析_000019

618电商大促微博营销效果数据分析_000020 618电商大促微博营销效果数据分析_000021

]]>
Spotify收购Seed Scientific数据分析公司 提高音乐推荐准度 //www.otias-ub.com/archives/358347.html Thu, 25 Jun 2015 16:32:16 +0000 //www.otias-ub.com/?p=358347 继Apple收购音乐数据公司Semetric后,Spotify也宣布收购另一家音乐数据分析公司——Seed Scientific,分析用户最爱音乐,为艺术家、听众和品牌商提供更好的流媒体音乐服务。

Seed Scientific创立于2013年,曾经服务过的知名客户包括奥迪、联合利华、联合国,甚至还有苹果的Beats Music。不过这次收购后,Spotify将独享Seed Scientific的服务,不再给苹果提供音乐数据服务了。

该公司的20人团队将会加入Spotify在纽约办事处,通过数据发现、收集、分析和可视化服务,捕捉分析与某个公司有关的数据,以此更好地了解用户。

8156612795140345273

该公司还在网站上写道:“Seed Scientific的团队和技术将整合到Spotify的高级分析部,结合尖端数学、科学、设计、工程等学科,构建模型和工具,对音乐数据进行分析。”

以Seed Scientific为中心的高级分析部还将帮助Spotify公司改进其在产品和业务上的决策。它可以分析出该给用户推荐什么音乐,关注什么人,什么样的乐队广告能与用户产生共鸣等,此外,还可以知道乐迷的所在地,以此计划巡演。

Seed Scientific公司创始人兼CEO Adam Bly 将主导这个单元的设计和运营,他还将与Spotify一年前收购的The Echo Nest合作。这家公司主要为音乐流媒体网站和应用提供平台数据支持,在被收购前也曾服务过Beats Music。

18437872180963077486

随着 Apple Music、Google Music 甚至 Jay Z 旗下 Tidal 的加入,流媒体音乐俨然变成了一块激烈的战场。Spotify 目前最大的竞争对手是 Apple Music,后者最大的优势是资源和钱。这让他们有能力去争取一些独播版权,Pharrell 将在 6 月 30 日发布的最新单曲 Freedom 就只能在 Apple Music 上播放。Spotify 在资源上、对内容方的控制上不及苹果,但胜在有先发优势,并且有免费+广告模式。而数据可以帮助 Spotify 向用户提供更好的服务,从而提供更加多的附加价值,吸引免费用户转化为付费用户。

]]>
Steam:全球游戏数据分析-中国单机游戏在趋于正版化 //www.otias-ub.com/archives/357926.html Tue, 23 Jun 2015 15:39:46 +0000 //www.otias-ub.com/?p=357926 对于Win10预览版如何转正,Windows Insider负责人Gabriel Aul最近一次的回复是,对于使用Windows Insider Preview版本的用户无需进行正式版升级预定,届时会自动升级。今天早些时候,Gabriel再次在微软官方博客发表长文,详细述说了Win10预览版用户如何转正。

16hTO-J1KrQ-ostQLswMrVA

 

具体来讲,运行Win10预览版(家庭版和专业版)的Windows Insider成员,只要注册了微软账户(MSA),与其连接的安装了Win10预览版的PC就可在7月29日开始收到正式版推送。注意,系统会保持激活状态,后续也可以使用正式版ISO随意进行纯净安装。

另外,如果运行的是Win10预览版(企业版),需要在批量许可服务中心(Volume Licensing Service Center, VLSC)下载正式版并激活。需要提醒的是,这种升级方法并非免费。

正如微软之前所讲的那样,感谢Insi以下资料采集于一位媒体记者个人开发的Steam Spy工具。Steam Spy会自动采样随机玩家的账户资料然后分析整合。这种方法当然有不足之处,但对用户的资料和使用习惯的分析却很准确。这篇文章基于这位媒体记者在DevGAMM 2015发布的演讲。最初发布于“Making Games”杂志。

1Z4B9fW2HYjQ_DOj0hSQ12g

美国玩家喜欢《侠盗猎车5》《无主之地2》和《上古卷轴5:天际》

  美国是Steam平台上最大的消费国家,大概拥有2千2百50万用户(占Steam用户总数的18%)。正如你所能预料的,美国人最喜爱开放式世界游戏以及射击游戏。或者开放式世界射击游戏(比如《无主之地2》或者《侠盗猎车5》)——它们棒极了!

这是意料之中,美国市场实在太大了,大到让人无法无视。但它并不是唯一的市场,并且有时候,你不应该以美国市场为第一标准。

俄罗斯

1UQvL5e2oUomubfY4avaXpA

现在让我们来谈谈俄罗斯。在很长的一段时间里,俄罗斯是著名的盗版之国,即使现在它依然有很多盗版玩家。俄罗斯在Steam平台上拥有1千360万用户(11%),但若是你开发的游戏没有俄语化,那么你是不会知道这一切的。因为对于一款没有俄语选择的游戏,大概只有1.7%的销量是来自于俄罗斯用户——可以无视,对不对?

但是当你将游戏翻译成俄语,并且稍微降低一点价格(正如Valve所建议的),那么你会发现购买游戏的俄罗斯玩家会激增至6%。若是你再添上一个能实际玩上的多人模式——那么这个数据会暴增至15%——老毛子最爱多人模式游戏了。若这个游戏是免费玩的,呵呵——俄罗斯玩家会爱不释手,22%的数据跑不了。这一点,DOTA 2可以证明给你看。

至于游戏背景,俄罗斯玩家最爱的是二战以及核爆之后的世界,除此之外,他们跟一般的西方玩家没有任何区别。

德国

至于德国玩家,他们非常特别。若是你开发的游戏是模拟游戏,那么恭喜你,德国玩家会贡献给你高达15%的销量——当然前提是你必须在游戏中以及官网上提供德语选择。这不仅仅是指较独特的《模拟农场》、《欧洲卡车模拟》之类的游戏,甚至是其他题材的模拟游戏比如说第一人称射击游戏《武装突袭3》或者城市模拟游戏《城市:天际线》。德国也是Steam上最活跃的玩家之一,从2009年以来高达92%的德国玩家账户都是活跃的。

英国

千万不要因为它国土面积小而忽略英国,英国玩家平均消耗734小时在Steam平台上玩游戏并且平均购买41款游戏(这分别比一般欧洲用户高2倍,比全世界用户高4倍)。所以,对于Steam来说,英国比俄罗斯拥有更大的市场即使他们的人数比俄罗斯低得多。而且英国佬很爱足球类游戏,你懂的。

中国

1d5rd2ZFuT-tUzNhDE4HFOQ

中国每个用户平均6款游戏,正版用户大多喜欢DOTA2和类似DOTA2的游戏

  中国是当前最大的盗版游戏国家,中国用户平均只购买6款游戏,而且大部分还是免费玩的。不过,正如十年前的俄罗斯一样,中国正在缓慢转变成正版游戏国家。最近上市的《侠盗猎车5》就包含了中文语言并且给中国区玩家特价(30美元,有别于正常价的60美元),而结果令人折舌——11%的销量来自中国用户,也就是22万5000份的销量,这贡献出了675万美元的营销额。

当然,正如俄罗斯玩家一样,中国玩家并不是什么游戏都买单的——付费游戏的市场依然靠造势,除非你的游戏拥有非常好玩的多人模式,否则大部分用户依然会选择盗版。但至少这证明了你无需依靠“免费玩模式”也可以在中国市场赚到钱。

日本

日本一般被视为主机市场,电脑游戏市场极之微小。这种说法是对的——只有1%的Steam玩家是来自日本。但若是你的游戏是拥有丧尸,那么这个数目会提升至4.5%,哪怕没有日语选择!所以,若是你准备开发丧尸题材的游戏,那么记得加入日语然后去日本推广吧。

无论如何,我想说的是在你公布一款游戏之前,请做好功课。你可能会发现你最大的用户群是来自于小国家。并且不要局限于英文玩家群——虽然这部分市场庞大,但也只是Steam用户的三分之一。

销售与类型

首先我要说,Steam本身的分类系统并没有什么实用价值,因为许多游戏可以归于其中的多种类型之中,而类型列表本身包含的内容也十分有限。而另一方面来说,用户标签在帮助用户找想玩的游戏时十分有帮助,对于分析用途来说则过于模糊。平均来说,Steam上的游戏销量并不可观,至少2012年前如此。虽然我们都听说某个知名游戏获得巨大成功的故事,对于普通的游戏,情况却并非如此。《上古卷轴5:天际》在Steam拥有大约860万用户,而《侠盗猎车5》在发售一个月之中就销售了220万份。但Steam上游戏的平均销量大约是多少呢?答案是每个游戏32000份。

1vNG9L-ss9CB7YqCyUZij-g

每种类型的用户数量(单位:千)但不要在意免费游戏玩家,90%的免费游戏玩家都不花一分钱。

如果检查一下游戏类型的销售分布,就会发现形势其实并非那么糟糕。角色扮演类游戏平均每款拥有55000份的销量,而早期试用版(这是Steam自行建立的一个分类)则平均每款只售出了9000份。虽说免费游戏拥有者33万的庞大客户量,而真正在游戏中消费的玩家,按照10%的转换率计算(实际正常情况应低于此数值),也只有33000位玩家愿意在游戏中解囊——与其他付费游戏相比,这也并非十分可观的数据。

152xPZ-oYycwsqg6rfinKIA

蓝色代表游戏数量,红色代表售价

  这种饱和现象也导致了许多流行类型的游戏平均价格的下跌。独立游戏,作为市场上最为廉价的游戏,平均价格为10美元每份,而付费多人在线游戏则处在20美元每份上下的区域。

1ebc7zd_1kO3SbuXFMvwVyw

黄色代表游戏数量,绿色代表平均销量。

  当然,曾经的状况与此并不相同。在2012年之前,Steam的增长速度与游戏类别的缓慢增速基本匹配,导致了平均每作销售量的缓慢增长。但是,当Valve为独立游戏打开方便之门之时,这种势头就停止了——游戏作品数量的爆炸性增长(甚至有时达到了可疑的地步)直接导致了平均每作销售量的急剧下降。要想在Steam上卖出自己的作品,单单将其在Steam上市已经不够了。现在,公关、市场运作、技术支持与其他原先只有大公司才需要在意的事务已经成为了必须。

不幸的是,即使进行了公关与市场运作,也不是进了保险箱。虽说这类运作可以十倍十倍地显著增进游戏销量,但如果游戏本身质量不过硬而导致口碑不佳的话,再多的努力也会付诸东流。

1xhk-1viicE387AVmf0QYcw

进行媒体宣传与否的对比

  我们也发现,众筹网站Kickstarter虽说在为原创游戏集资时表现极佳,在开发者试图创建系列游戏时却收效甚微。虽说许多众筹游戏的续集在玩家与媒体口中的评价都有所提升,其销量却总是不尽人意。

常见的误解

常见误解:多做手机游戏,多做针对女性的游戏,多参加免费抢先体验计划,多模仿成功的游戏,不要管媒体和玩家的评价针对在Steam上发行的游戏,我将阐述一些我在过去几年碰见的常见的误解。

12Naj0MagYOylkRnGSW1QzA

        手机游戏

针对手机的最新调查显示:大约48.8亿手机用户的手机支持游戏功能,这与仅有1.25亿用户相的Steam相比简直是个天大的市场。但是:有160万的应用只支持IOS,但却要争取同样多的用户和关注。虽然从平均上来讲,这些游戏创造了2800美元的收益,但这个数量却不是均匀分配的——iOS上的游戏普遍面对着分文未挣的局面。这不是开玩笑

那么现在看来,Steam上每个游戏平均出售32000份就没那么糟糕了吧?

1u8VhM1AVnL5jnDlksx1wIQ

女性玩家都在应用商店里找游戏,还是别在Steam上使劲了

  针对女性的游戏

尽管女性玩家是PC玩家的重要组成部分(根据调查的不同大致在49%到51之间),但她们大多不是Steam的用户。根据Alexa Internet的调查,访问Steam的用户中,大约只有18%是女性,而登录Steam的女性玩家数事实上可能更少。

1XaZhgXjt-3RUSeu2KmhcLg

探讨这个问题的原因不在本文的范围内,但相比于其它内置平台,例如Facebook和IOS,Steam上仅仅针对女性玩家的游戏似乎不大可能取得成功。

1hEQ9MOS0Swi6LUmUbtx6xg

抢先体验版本

几个月以来,开发者们对抢先体验模式交口称赞,因为在Steam上有两个版本的发布——第一个是游戏的未完成版本,第二个是最终版。稍等,我有个坏消息要告诉你们:每款游戏还是只有一个发布,如果你想在抢先体验计划上提前发布,那一天就将是发布日。

当然,某些游戏可能会像最终发布时那样吸引媒体和玩家的注意,但即使像Double Fine那样的大咖,他们的《破碎时光》也在此折戟沉沙。

1ztLQq7HwuI3r1Kx7PjMhzA

山寨未必都能成功,比如这位

  模仿好游戏

虽然在手游上模仿是个可行的策略(说实话:并不是),但在Steam上可行不通,因为Steam上的玩家对他们喜爱的类型都了若指掌。然而,你可以而且应该在其他游戏的基础上不加复制地对游戏机制和画面进行改进。

忽视评论

对于游戏开发者存在一种普遍误解,就是当出现来自玩家或媒体的反对声时就忽视他们。好游戏从来都不怕议论,不是吗?虽然这话没错,但好的反馈通常和好的销量紧密相关,也就是说如果游戏是个好游戏,人们就会向别人推荐,而游戏很糟糕时,人们就会建议别人不要玩。但是换个角度想想:就算是糟糕的声音也总比对你的游戏沉默不语要强。

柳暗花明,走向成功

虽说以上的一切听起来都不怎么乐观——平均每作销量低下,女性感兴趣的游戏市场规模小,发布游戏的机会只得一次——但是实际上其实并没有这么惨。每年都有十几作独立游戏在Steam上取得成功,你做出的游戏没准就会跻身这个行列。举个例子,说说2015年的几个成功的游戏吧。虽说它们各自不同,却都具有某些值得注意的常见特点。

1pyn-sdsIbjLolImIlIwvfw

找对市场

这个说起来容易做起来难,但想要在Steam这样拥挤的市场上获取大家的注意,可以算是必须的素质。毕竟,每年有将近2000款游戏要在Steam面市。

反正你的擅长领域也就局限在某些类型的游戏之中,何不研究一下最近有什么是大家都没注意到的盲点呢?有几个十分恰当的例子:《暗黑地牢》,一个并非复古风Roguelike的游戏(最近这种游戏多得要命)还有《城市:天际线》,一个类似模拟城市的游戏,而我们已经有十年没看到什么优质的类似游戏了。

1IBImDKqlPQO7sxHbh0WL_w

一款不是像素风格的独立游戏,多么难得

  要想查询已有很久无开发者问津的游戏类型,调查潜在的市场,可以使用Steam Spy的用户标签统计。举例来说,经典的基地建造类即时战略游戏当前算是比较冷门。

在游戏发行前,多向玩家透露信息

在Steam上大获成功的游戏,基本都是在发行前很久就已经获得了不少媒体的报道——无论是否早期试用游戏都是如此。在众筹网站上获得支持当然会有帮助作用,但即使你的游戏是完全由自己出资而不靠外来注资,也不要让它掉出媒体与玩家的视线范围。

在市场宣传的领域中,有一个流行的概念,即:要想让一个人记住你的产品名称,至少要让他听到五次以上才可以——很显然,在你游戏发行后紧接着的几个小时内,想让所有的潜在顾客都做到这一点可谓难上加难。

所以,要事先造势,广布战线,在对游戏发行进行计划之前许久,就要开展市场运作与公关。

本地化

并不是所有人都具有享受你游戏所需的英语水平。在某些国家,如果你的游戏中的文本不是他们日夜使用的语言的话,他们根本不屑一玩——无论你责怪教育系统也好,责怪传统文化也好,无论如何也无法改变这个趋势。

切记要为你的游戏进行地域性的市场调查,因为如果当地人无论如何也不会喜欢你的游戏的话,花钱进行本地化就是彻头彻尾的浪费了。你应该将注意力集中放在富有对你游戏可能感兴趣的玩家的国度。举个例子,如果将你的僵尸游戏中的意大利语换成日语,你就会发现这对你的销量有多大的正面影响了。

1yHotKWSuiHAmNztKgRlqJg

多多升级游戏并添加新mod,最好双管齐下

要打太大幅度的折扣

你是不能在Steam上提高自己游戏的价格的。呃,准确来说,是可以的,但这和夏季打折相比,玩家会更欢迎哪一种,不言自明。所以说,你所能做到的最好的状况,便是取消临时的发行折扣。

所以,不要将你的发行价设定得太低。日后想要降价总有机会,但如果以低价发行,那可是一上来就舍弃了原有的收入。

抢先体验即是正式发行,请务必做好这等觉悟

你的游戏在Steam上只得一次发行机会,所以就算你的游戏是以抢先体验的身份出现,也要具有基本的游戏功能,不带有任何令人玩不下去的bug,要确保游戏从一开始便具有一定的可玩性。

想想《暗黑地牢》吧——虽说在发行时缺失了一些内容,但游戏本身虽然挂着“抢先体验”的标签,却已经具备了一款优秀游戏的素质。我知道这听起来很不公平,但如果你要让自己的抢先体验版游戏与完成版的游戏同台竞争的话,必须做到这一点。

持你的游戏

虽说大多数游戏带来的盈利都来源于刚发行的几个月,却出现了几个由于开发者尽心尽力,使用新内容支持自己游戏(无论新内容付费免费)而大获成功的游戏,在玩家中获得了极佳的反响。

额外的支持并非只是靠着善良的意愿获取更多的销量,它更是让你的游戏在Steam和游戏界媒体上获得更多曝光率的好办法。Paradox游戏社(代表作《城市:天际线》《欧陆风云》)尤其精于此道,请务必向他们学习。

1xNuValnJgaAuer-aHaZkIw

总结

虽然Steam有着许多缺点,却不失为一个销售你游戏的极佳平台。毕竟,它还是市面上对游戏开发者最为友善的工作环境。你所需要做的就是记住几条基本的规则:研究你的竞争对手与你想要打入的市场的情况,在游戏发售之前便进行宣传,本地化,不要过早进行打折,还有支持你的用户。

有了优质的游戏,辛勤的努力,再配上一点点好运,你就会在Steam上喜获丰收。der成员不厌其烦的安装、升级、回滚、Feedback,这总算点“小福利”了。

]]>
2014年山东省医药市场数据分析 //www.otias-ub.com/archives/348164.html Mon, 18 May 2015 06:36:50 +0000 //www.otias-ub.com/?p=348164 一、山东省医疗终端总体市场规模
  根据医药市场服务平台(以下简称MMS平台)统计结果显示(以下数据均来源于样本医院数据),2014年山东医疗终端药品市场规模达310.47亿(其中化学药240.66亿,中成药69.81亿),比2013年259.01亿(其中化学药191.35亿,中成药67.66亿),共增加了51.46亿,上升幅度为19.87%(见图2-1)。
20150518_085015
  数据来源:MMS平台
  注:本部分数据包含各级医院,社区卫生服务中心(站)、卫生院等公立医疗机构,不包含各类城乡药店
  基层医疗卫生:包括社区卫生服务中心(站)、街道卫生院、乡镇卫生院,不包括私营诊所、门诊部和村卫生室
  二、山东省医疗终端中西药市场份额
  2014年山东医疗终端中成药的销售规模下降幅度不大,与2013年比较,中成药份额减少了3.64%,化学药份额相应地增加(见图2-2)。
20150518_085150
  三、化学药各大类市场情况
  随着人民生活水平的提高、保健意识的增强以及新型医疗技术的发展,不同类别用药市场份额发生了一系列的变化。
  2014年山东省医疗终端化学药各大类别市场份额都增长了,总体增长了25.77%,其中,增长最明显是“抗寄生虫药、杀虫药和驱虫药”这一类药,增长率高达108.57%;抗肿瘤药及免疫调节剂的市场份额增加最多,增加了1.71%;增长率最小的是“全身用抗感染药”,增长率为5.89%,其份额也比13年的减少了3.41%,但其市场份额仍稳居第一名(见表3-1)。
20150518_085205
  四、医疗终端化学药排名TOP10的品种
  2014年,医院终端化学药前10品种市场集中度为16.14%,比13年15.61%增加了0.53%。其中,“神经系统药物”和“消化道和代谢方面”的药物各占3个,“抗肿瘤药及免疫调节剂”占2个,“血液和造血器官药”、“心血管系统”各占1个。
  与2013年比较,总体呈上升趋势,新进入前10名的有依达拉奉和多西他赛,其他药品排名变化不大,奥拉西坦增长最明显,市场份额由2013年的1.67%增长到2014年的2.2%;依达拉奉上升四个名次,排名第7名;多西他赛上升两个名次,排名第10位,将左氧氟沙星和氨溴索挤出前10名;氯化钠下降两个名次,排名第6名(见表3-2)。
20150518_085220
  五、医疗终端中成药各大类市场情况
  随着疾病谱和用药习惯的变化,不同类别用药市场份额发生了一系列的变化。
  心脑血管疾病市场份额下降明显,比2013年减少了2.98%,但其份额仍远远超过其他类别。
  肿瘤作为难治性疾病,化学药物在治疗上存在副作用大、治疗效果不明显等缺点,生物制品和中成药在其治疗中发挥着重要作用。肿瘤中成药2014年市场份额为13.03%,比13年增加了4.03%
  在人体的各种系统中与外环境接触最频繁的是呼吸系统,近年来因大气污染、吸烟、人口老龄化及其他因素影响,使呼吸系统疾病患病率高发,带动该类别药物市场规模增长,由于呼吸系统疾病中成药在止咳、平喘方面具较大优势,该类药品在我国医院中成药市场常年保持前三位置。2014年呼吸系统疾病用药市场份额为13.03%,比13年减少1.25%(见表4-1)。
20150518_085236
  六、医疗终端中成药排名TOP10的品种
  2014年,医院终端中成药前10品种市场集中度为25.40%,比13年24.01%增加了1.39%。其中,心脑血管疾病用药占主导,前10品种中心脑血管疾病用药品种占8个,肿瘤疾病用药品种占2个。
  与13年比较,市场份额和排名变化很大,新进入前10名的有参芪扶正、丹参多酚酸盐,灯盏花素和脑心通无缘前10名。市场份额上升最快的是参芪扶正,比13年增加了1.74%,排名由第20名上升至第5名;其次是丹参川芎嗪,比13年增加了0.77%,排名第2名;丹参多酚酸盐上升了四个名次,疏血通上升了三个名次。
  市场份额降得最多的是血栓通,比13年减少了1.69%,下降一个名次;其次是血塞通,减少了1.37%,但仍位居第1名;参麦下降三个名次,排名第8名(见表4-2)。
20150518_085249
via:医药信息链
]]>
全球十大数据分析榜样企业 //www.otias-ub.com/archives/345686.html Thu, 07 May 2015 08:41:55 +0000 //www.otias-ub.com/?p=345686
06121549_4791

Burberry集团与个性化购物。Burberry正在于其商店内应用射频识别(RFID)标签以打造更丰富的购物体验。当客户手持某件商品走过显示屏幕,RFID标签将触发一个视频来展示该产品是如何制作的,并提供搭配它的其他产品。经过客户许可后,RFID标签还可以通过跟踪顾客试穿记录来创建客户档案。

 CVS Health与呼叫中心。 CVS推出了呼叫中心试点项目,Laney将之比作Match.com。CVS使用Mattersight的技术,通过将客户进行细分成大约六种行为人群而开始了“预测行为路径”试验。连锁药店也给呼叫中心客服代表打分,以把客服代表匹配给其更适合的那类客户。试运行减少了呼叫时间,提高了呼叫本身的表现,据Laney说,它非常的成功,并投入了正式运行。

可口可乐公司与产品一致性。“很多人认为世界上保存最好的秘密可能就是可乐的配方了,但它并不是,”Laney说。“其实是橙汁的配方。”可口可乐工程师鉴定了超过600(!)种可能的橘子口味,然后建立了一个专有的算法,以确保每一批橙汁都拥有一致的味道和质地。橙汁数据档案将其美汁源和Simply Orange品牌与其他产量口味每个橙子都有变化的不知名品牌区分开来。Laney鼓励商家鉴别那些需要保持外部因素一致性的地方,如供应链。

欧莱雅集团与客户参与。欧莱雅直接将产品销售给零售商,这就造成了美容产品制造商和其客户之间的间隔。这其实并没有真正伤害这一世界上最大的化妆品和美容公司,但化妆品巨头仍然希望其新的客户指挥中心将改变这种状况。使用Clarabridge的CRM技术,欧莱雅正在分析推特,Facebook上发布的信息,产品评论和新闻报道。必要时,发布内容会由内部直接转到某个指挥中心的恰当员工处,而他会直接与发布者交互。欧莱雅还没有公布数据,但它声称指挥中心“改变了如何利用品牌意识和忠诚度,”Laney说。

西太平洋银行公司与客户的360度视角。在过去的几年中,澳大利亚银行一直采用来自SAS研究所的技术建立一个名为“KnowMe”的客户360度视角程序。该程序一部分基于捕捉和集中其1200万客户的用户活动,如ATM使用情况和呼叫中心交互情况。基于行为分析,西太平洋银行将客户与新方案或产品相匹配。在九个月里,该方案就使西太平洋银行的客户参与从1%扩大到了25%,据Laney说。

Tom Farms LLC与数字业务。Tom Farms已在养殖过程中几乎每一个可能的部分都实行了数字化 – 从挂满了能够产生实时数据流传感器的自动驾驶联合收割机,到帮助监测和控制灌溉系统的移动应用程序。对于Tom Farms,拥抱数据和分析,已经帮助它从20世纪70年代的700英亩成长为今天的20000亩,据纽约时报报道。成功并不仅仅体现在面积的增加,据Laney说。汤姆农场使用技术以“减少改变作物以规避天气和疾病的需要,”他说。

Food Genius与开放数据。Food Genius是一个餐饮数据供应商。它从餐厅在网上发布的菜单上刮取数据并搜索本地发展趋势,以帮助像卡夫食品公司,甚至是阿贝兹这种全国连锁店在本地层面更智能的开发和销售产品。 “这是一个从头开始完全基于刮取互联网开放内容的一个有趣例子,”Laney说。他鼓励企业去思考开放数据能如何改进已有产品或提供新的产品给客户。

洛克希德•马丁公司与暗数据。该航空航天公司正在使用暗数据 – 企业数据,可能对一个公司有用,但相反的,对更加积极主动的项目管理来说就是封尘存储。它关联并分析数百个程序指标“以确定程序表现的领先指标”,Laney说。而且它还分析了项目人员的沟通,以确定“预测程序降级”的语言,他补充说,暗数据将程序的预见性提高了3%。

墨西哥石油公司(Pemex)与传感器数据。设备故障的一个指标就是噪音,所以石油公司开始为其炼油厂配备测量声音振动的传感器。当测量值变得异常,工程师就会收到提醒并“可以立刻去有问题的设备那里并对它进行更换或修理而无需太多停机时间,”Laney说。“他们已经能够从计划外维修保养模型变为计划内维修保养。”

加州大学圣地亚哥分校与众包。为了找到臭名昭著的蒙古统治者成吉思汗的陵墓,加州大学圣地亚哥分校向大众开放了卫星图像。该项目引来了10,000名志愿者,确定了55个有考古意义的地点。(不过到目前为止,大汗墓的位置仍是一个谜。)就像寻找成吉思汗的陵墓一样,Laney表示,企业不应该忽视像众包和游戏化这样可以用来发现新东西的技术。

]]>
Newzoo:2014年亚洲手游市场数据分析 //www.otias-ub.com/archives/334064.html Sat, 21 Mar 2015 16:06:41 +0000 //www.otias-ub.com/?p=334064 近日,Newzoo发布的一份关于亚洲手游市场BIG THREE的报告指出,中国是亚洲手游的希望之星。2014年,中国手机游戏规模从2013年的23亿美元增长至42.5亿美元。中国有望在2015年超越北美成为世界第二大手游市场。而目前中国智能手机渗透率仅为46.9%,仍有极大上升空间。

Big Three 中日韩手游市场权威报告

近日,Newzoo发布了一份关于亚洲手游市场BIG THREE的数据报告,报告指出,中国是亚洲手机游戏的希望之星。

1.中国

2014年,中国手机游戏规模从2013年内的23亿美元增长至42.5亿美元。中国有望在2015年超越北美成为排在日本后的世界第二大手机游戏市场。目前中国智能手机渗透率仅为46.9%,仍有很大的上升空间,安卓系统占据62%的市场占有率,但是应用市场碎片化严重。

0tpwebpampwxfrom373

在中国,安卓应用市场碎片化严重,第三方应用市场间竞争激烈,以下是基于应用市场用户安装量得出的中国应用市场排行榜单。

0tpwebpampwxfrom393

2.日本

  自2013年第三季度超越美国,日本已经稳居世界上规模最大的手机游戏市场,而这主要得益于日本高付费用户的贡献,在日本ARPPU非常之高,高付费用户占比也非常高,功能手机在日本市场上占据重要地位,这也能解释日本智能机渗透率低的问题,而这也是日本市场仍拥有巨大潜力的佐证。

0tpwebpampwxfrom383

 日本特色:游戏内活动活跃

  日本游戏市场活跃的游戏内活动和赌博机制并且取得巨大成功,这也促成了日本手机游戏高留存以及超高用户收益。

  活跃活动是指在限定时间内在游戏中展现特别游戏画面,角色等,并借此,开发商可给玩家带来紧迫感与刺激感。

  Gatcha赌博机制指玩家花费特定金额来获得未知随机物品的玩法,因可得到物品价值差距悬殊,也给玩家带来刺激消费的作用。

0tpwebpampwxfrom404

 3.韩国

  相比中国和日本,韩国可能是一个相对较小的手机游戏市场,但其智能机渗透率全球第二,在线游戏市场高达18亿美元,潜力巨大,最为重要的是,得益三星手机在韩影响力,韩国手机游戏市场安卓占比达85%。

0tpwebpampwxfrom424

 韩国特色:专注社交与病毒传播

  社交邀请与分享在韩国是行之有效的宣传手段,这也使得其成为韩国手机游戏发行上进行市场宣传的重点,与日本类似,公告牌与电视广告等传统营销与线下营销方式也是厂商营销的一部分。

  在韩国社交聊天应用Kakao市场占有率高达93%,这也使得其统治了韩国手机游戏发行与渠道平台,发行商无法无视Kakao进行游戏推广工作。

  开发商在韩推广还需要借助病毒传播潜力,韩国Google Play畅销榜前十的游戏中有9个是Kakao发行的,如果你不能击败它,那就乖乖的加入其中吧。

0tpwebpampwxfrom414

4.Mobile Gaming Landscape

0tpwebpampwxfrom434

0tpwebpampwxfrom454
5.地区比较矩阵

0tpwebpampwxfrom444

  Newzoo认为,亚洲仍然是手机游戏目前发展最好、规模最大的地区。中国地区的CPI水平偏低相比,相较于日本和韩国稍显薄弱。但很显然中日韩已经走出亚洲,成为全球最有吸引力的市场。尽管日本的手游发展速度较中韩已经放缓,但在IOS及安卓市场上仍然表现出强劲的增长态势,整体市场相对保持稳定。日本仍然是全球最大的游戏市场之一。韩国拥有一个规模超大的网络游戏市场,目前在世界上已经成为游戏市场第二大增长地区,韩国的智能手机普及率超高,因此其消费能力也惊人。如果,想在中日韩市场布局手游业务,全球游戏业者仍然需要在各个方面实现本地化。这里是一个非常发展空间广阔,但竞争异常激烈的市场。

]]>
鉴定图表“十宗罪”:简单十招学会用数据说话 //www.otias-ub.com/archives/332869.html Sat, 14 Mar 2015 14:00:34 +0000 //www.otias-ub.com/?p=332869 数据可视化,是一种用来将复杂信息数据清晰表述出来的强大有力的工具。通过可视化信息,我们的大脑可以更有效地合成和保留信息内容,增强对信息的理解。但是如果不正确数据可视化,它可能弊大于利。错误的图表可以减少数据的信息,甚至完全背道而驰。
这就是完美的数据可视化极其依赖设计的原因。
设计师要做的,不仅仅是选择合适的图表类型,更要以一种容易理解的方式来呈现信息,设计出更直观的导航系统,让观众做尽可能减少理解方面的麻烦,做到一目了然。
当然,并不是所有的设计师是数据可视化专家,这就是为什么大部分的图表看上去是那么糟糕,简直不忍直视。
这里有10个数据可视化的案例,包括你可能犯的错误和快速修复补救的方法。
 
错误1.混乱的饼图分割
饼图,是最简单的图表之一。不过偏偏有人喜欢把它搞得很复杂。
饼图的设计应该直观而清晰,理论上,一个饼图不应该分割超过5块。下面就是两种可以让读者的注意力瞬间集中到你要表述的重点的方法。
方法一:将最大的部分放在12点钟方位,要顺时针。第二部分12点钟,逆时针方向。剩下的部分可以放在下面,继续逆时针方向。
\
方法二:最大一块12点钟开始,顺时针方向旋转。剩余部分在降序排列,顺时针。
\
错误2. 在折线中使用不连贯的线条
虚线容易分散注意力。相反,使用实线和颜色反而容易区分彼此的区别。
\
错误3.数据排序混乱
你的内容应该以一种合乎逻辑的和直观的方式来引导读者了解数据。所以,记得将数据类别按字母顺序、大小顺序或价值进行排序。
\
错误4.数据模糊不清
确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
\
错误5.让读者自己解读
设计师应该使图表尽可能轻松地帮助读者理解数据。例如,在散点图中添加趋势线来强调的趋势。
\
错误6.扭曲数据
确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
\
错误7.在一张热力图上使用不同的颜色
颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
\
错误8.条状图太胖或太瘦
或许你的报告很有创意,非常精彩,但是记得图表设计水平也要跟上。条形图之间的间隔应该是1/2栏宽度。
\
 
错误9.很难比较数据
比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
\
 
错误10:用3D图表
虽然他们看起来很酷,但是3D形状可以扭曲感知,因此扭曲数据。坚持2D,确保数据准确。
怎么样,上述10条,你中枪了吗?
来源:中国统计网
]]>
Forbes:十分之七的营销高管计划在决策中加大对数据分析的依赖 //www.otias-ub.com/archives/322930.html //www.otias-ub.com/archives/322930.html#comments Thu, 29 Jan 2015 17:26:30 +0000 //www.otias-ub.com/?p=322930         199IT原创编译

        营销人员加大数据收集方面的力度,分析有助于了解信息的含义,这决定了广告计划的成败。根据2014年10月Forbes Insights和Turn合作的调查,55%的美国营销高管使用数据分析测量全部或大部分营销战略回报率,相比之下,只有4%的受访者从没这么做过。

184057-20

        营销人员更愿意使用数据分析在线媒体广告,有三分之二的受访者这么做。离线个性化也很重要,受访者也在现实世界中使用数据分析,46%的受访者在传统媒体广告中也使用数据分析,41%的受访者在直邮营销中使用分析。超过三分之一的受访者在电话营销中使用分析(35%),在优惠券、折扣和特别优惠等营销策略中使用分析的受访者占34%,还有27%的受访者在PR或媒体推广中使用分析。

        明年对数据分析的依赖将更大,超过十分之七的营销高管期望未来三年在营销策略中增加对数据分析的依赖,只有2%的高管计划减少,还有14%的高管没有变化。

184128-20

        根据2014年9月 Gartner 和 The CMO Club的调查,营销高管认识到数据分析的重要性,但是明年的支出却滞后。在受访者的首席营销官(CMOs)中,40%的受访者将数据分析排在增加去年管理层预期的首位,是第二高的回答,仅次于消费者体验。

        但是,当问及明年计划投资的营销领域时,数据分析却排在倒数第二位,有32%的CMOs选择,落后于数字商务、消费者体验和移动。和数据分析紧密相连的营销技术排在倒数第一(31%)。

        编译自:eMarketer 译者:孙莹

]]>
//www.otias-ub.com/archives/322930.html/feed 6
Forbes:数字分析如何改变营销活动 //www.otias-ub.com/archives/320794.html Tue, 13 Jan 2015 01:34:56 +0000 //www.otias-ub.com/?p=320794 根据Forbes Insights and Turn的调研,超过7/10的企业主管认为未来三年他们依赖于数据分析来决策的情况将会继续增强。

目前数据驱动营销被最广泛认为是获得客户忠诚(47%),获取新客户(43%)和提升客户满意度(42%)的手段。

20150111215102

数据分析在营销中的的最常应用包括改变定向策略(38%),延伸或重复营销活动(36%),调整营销活动(34%)

20150111215149

对于那些数据驱动的“领导者”而言,61%的人提高了数据驱动营销活动中获得了ROI的提升

]]>
Tableau:医疗保健数据分析的四大趋势 //www.otias-ub.com/archives/318581.html Fri, 02 Jan 2015 13:10:28 +0000 //www.otias-ub.com/?p=318581 Tableau发布了《医疗保健数据分析的四大趋势》的白皮书,动脉网将其编译如下: 

不管是承诺或是陷阱,医疗保健行业从未像现在这样专注于数据。从削减医疗开支,到检测欺诈行为,再到协调多个供应商之间的关系,不断完善的医疗数据主见成为一枚猎杀各种医疗怪兽的“致命武器”。

但在现实世界中,数据的绝对数量比以上列举的种种更加让人觉得势不可挡。从不同的电子病历(EMR)系统和医疗设备的输出,到员工时间管理、患者满意度调查、以及医疗设备跟踪,数据正以无比汹涌的速度流入你的医院。

把您所掌握的数据通过以下四个趋势加以疏导,就能激发出医疗保健数据分析的潜在的巨大优势:

1.医院楼层导诊台

2015-01-02_210750

2015-01-02_210858

“我们正在不断寻找新的方法来提高我们的质量、安全性,以及病人从入院到出院的流程。”——Drexel DeFord,西雅图儿童医院

医疗服务提供者比以往更重视提升病人体验。以价值为核心的医疗保险和医疗补助中心(CMS),使得病患护理体验措施(HCAPS)获得了2014财年度近1/3的激励资金。

但是,提供高效且有效的护理体验一直是医院追寻的目标,加快病人周转量可以帮助医院在提升入院体验的同时做到这点。约翰-霍普金斯大学和西雅图儿童医院在这方面具有丰富的经验,通过为医生、护士、行政人员、换班协调员以及护士长提供安全、可靠的导诊服务,能够优化病人在整个医院系统的流动过程。

“我们建立了一个优异的可视化系统,用以展示造成病人等待的根本原因和影响因素。例如,我们查看了病房的使用情况,发现早上的一点延迟往往带来全天候的延迟。这对于督促我们把重点放在‘准时’上大有帮助,而我们也观察到病人等待的情况得以显著改善。”西雅图儿童医院手术服务部行政主任Jason Jio说道。

有兴趣采用这种方法的医院可以利用用户档案管理基于角色或分配的意见,这样既可以提高效率,同时也能管理适当途径获取的私人健康信息(PHI)。让用户能够深入到特定的病房的过滤器也能加快用户的洞察力。选择解决方案以实现近实时的观察,并由此快速解决问题。

2.使企业以结果为导向

“如果你有一个技术平台收录数据,另一个用来记录质量,还有一个记录患者的体验,那么你工作起来将会很困难——人们不能在一个平台上获知他们需要的一切,这使得它部门之间真的很难联合……Tableau在这方面已经取得了现象级的成果,这是一个简单且品牌化的方式。供应商、行政人员、一直到高层都可以利用到它。”——David Delafield,瑞典的医疗集团(瑞典医疗中心下属部门)

改善护理成果和质量的重要性已经毋庸置疑——事实上,大多数服务供应商将此作为他们的首要任务。但在CMS医院以价值为基础的采购计划(VBP)进行到第三年,参与的医院需要面对不断攀升的基准线标准和提升质量的压力。将近一半参与医院正面临着2013财年报销减少的情况,提高成果的压力与日俱增。

另外,医疗保健的日益消费化(即患者在以价值为基础的购买决策导向下,积极地比较各个医院)使得各地联合企业以提升成果已经明显成为关键任务。

但调动整个医院专注于某些标准谈何容易。过度劳累的护理人员只能强打精神努力消化大量的机构报告。数据的多重定义或多个数据源中的潜在矛盾还会制造出混乱并耗费成本。

为了克服这些挑战,医院应规范对单一业务的智能解决方案,可以利用数据可视化的优势。根据宾夕法尼亚大学医学院研究人员的说法,人眼每秒大约能够处理10万比特的数据。数据可视化正是利用了人类的这一强大功能,为整个医院的利益相关者提供直观且易于理解的图像。

此外,智能业务解决方案可以融合不同来源的数据——从数据中心到电子表格——来为你提供一个单一且精确的数据,并确保利益相关者能通过相同的数据做出决策。

3.以病人为中心

“我去任何医院,都担心会不会有遗漏——即它们会不会疏忽我的任何信息。有人在后台运作着一切事物,他们正在收集关于我的信息。”——Mark Jackson,皮埃蒙特医疗

根据Premier2013年12月的一份调查显示,参与可信赖医疗组织(ACO)的医院预计将在2014年翻一番。这种有助于“以病人为中心”的护理模式的转变(包括但不仅限于ACO机构)同样需要一种新的获取数据的方法。

这种以病人为中心的视角得来的数据,其潜在价值已经延伸到了医疗共享服务付款领域。据估计,三种因素将提升慢性病医疗费用。除此之外,约有1/4的美国人患有多种慢性疾病,这也进一步推高了成本。

以病人为中心可以帮助院方协调护理过程、降低成本和提高成果。用以支持此种视角的一个绝佳的方式便是可视化的仪表盘,它可以快速提供病人复杂的交互情景、文件资料和治疗情况等。

这需要一种可以访问不同数据、无需编写回原始源的智能业务解决方案。ACO的参与者常常使用不同的数据的平台,因此整合此类信息的能力至关重要。

病人——尤其患有多种慢性病的病人——其数据的绝对数量令人望而生畏。我们可以选择操控面板,允许供应商迅速吸收高层次的信息,同时也提供了深度探讨数据以获取更多的信息的可能性。

即使你的医院还不是ACO的一份子,CMS也正在发送出强列的信号,表明这就是市场的走向。你的未来,很大程度上取决于你目前所使用的智能业务工具。

4.拥抱医疗机构的社会方面

2015-01-02_211010

“我们的很多拨款资助者——疾病预防控制中心(CDC)和国家癌症研究所等等——都能够看到图表。他们希望得到快速的解答,不想读20或30页的报告。他们只是想看到图,可以一目了然,飞速抓住一些重点并了解它们。”——Glen Szczypka,健康传媒合作实验室

社交医学对大多数医疗服务供应商来说是一个新领域。不久之前,通过公共论坛提供任何形式的医疗互动服务的概念不仅令人反感,而且被明令禁止。

然而现如今,患者期望通过社交平台与医疗服务供应商进行互动。在普华永道2012年的报告中,有近1/3的成年受访者利用社交媒体进行健康咨询。

虽然受保护的健康信息(PHI)仍旧受到严格的保护,供应商们还是正向着患者集中的地方转移。这对行为健康的应用来说非常有利——例如鼓励健康的运动和饮食习惯——医院正在深入到患者之中,以鼓励他们做出更好的选择。

但是,什么样的话题是你的病人们首要关心的?你怎么知道你的沟通信息他们能够接收到?你应该在什么时候发布帖子或者推特?你是否只浏览特定的网页,比如你的Facebook粉丝页面或Twitter上的粉丝,或者也会监控那些有影响力、但不太明显的网络平台上,如Yelp、Foursquare、甚至维基百科或社区论坛?

医疗数据分析正如其他行业一样转向至社交领域。选择一个能够与已经存储在系统中的交易数据链接至社交媒体数据的解决方案,以找出最有影响力的渠道。由于社交媒体的绝对数量和快速更新,你会希望你提供的方案能够聚集并提取有意义的数据,以进行更有效的分析。最后,社交媒体的更新速度是惊人的,今天的Twitter也可能会和MySpace一样成为明日黄花。确保你选择了一个有强大路线图的灵活工具,并坚定地致力于完善它的功能,这样你才不会被留在一个社交鬼城。

从现在开始准备医疗保健数据的未来

随着医疗保健行业持续推动金融的改善和患者的治疗效果,将数据应用到你的工作中成为比以往任何时候更重要的事。赋权给每个基层的医疗工作者、着眼于整个企业的影响力变化、实现以病人为中心的数据获取方式、并采用和分析社交医学等都是可以做到以上目标的方法。

via:动脉网

]]>
中国互联网薪资数据分析的报告–信息图 //www.otias-ub.com/archives/282113.html Sun, 19 Oct 2014 14:42:52 +0000 //www.otias-ub.com/?p=282113 1413603093_5095 (1)

]]>
零售O2O该如何做数据分析? //www.otias-ub.com/archives/281842.html //www.otias-ub.com/archives/281842.html#comments Fri, 17 Oct 2014 10:09:58 +0000 //www.otias-ub.com/?p=281842 文/张陈勇 
 

 

通过数据分析可以知道商业模式是否可行,评判那种推广渠道效率最高,能发现网站、商品结构、物流等各个环节的问题,能评估改进效果。
 

有哪些数据?

线上平台的数据来源有网站统计工具、ERP系统、客服回访问卷投诉等。
 
线上数据主要包含:访问量(IP UV PV)、平均浏览时长(浏览量)、新UV比例、跳出率、转化率(注册、订单、支付)、流量来源(搜索、直接、连接、地区、推广)、网页打开时间、网站热点、搜索分析等。
 
ERP数据主要包含:订单量、客单价、毛利率、二次购买率、忠实顾客转化率、顾客流失率、动销率、缺货率、商品价格变化、SKU数量变化、周转率、退货率、品类销售占比、会员注册量、注册会员转化率等。
 
客服回访问卷投诉数据主要包含:投诉分类、UI印象、品类印象、价格印象、网站功能印象、物流体验印象、售后印象等。
 
以上数据相互关联,比如分析促销活动效果时,需要分析访问量的变化,注册下单转化率的变化,促销商品和正常商品销量的变化。
 

怎么分析数据?

有的公司成立专门的数据分析部门,数据部门不仅提供数据,还要完成数据分析工作。这种工作方式,虽然基础数据准确,但分析结果可能有较大偏差。因为数据分析人员不熟悉业务,对各种信息的了解也不如市场部和运营部等业务部门。
 
比如,某个品类销售占比突然降低,这可能是因为市场部推广方式的改变,也可能是遇到季节因素。如果数据分析人员不了解这些信息,则可能简单的判断成顾客不欢迎这类商品,并且做出建议商品部门降低这类商品占比的决定。
 
更合理的数据分析方式是,由数据专员提供基础数据,由相关部门骨干人员共同分析,比如转化率降低,应该由市场部、运营部、商品部共同分析,得出是由哪些方面的因素造成的。
 
对于新项目而言,可以引入目标分析法,目标分析法是以分析“新客引入成本”和“忠实顾客转化率”为核心,设定合理目标,以此判断商业模式是否可行。
 
比如:某个投资5000万的B2C网站,推广预算是2500万元,目标是稳定达到每天5000单。忠实顾客的定义是平均每月购物一次,每天5000单的销售目标,需要15万忠实顾客。
 
如果实际经营结果数据,新客引入成本是50元,忠实顾客转化率是30%,则要达到15万会员,需要2500万推广费用。
 
通过数据分析可知当新客引入成本大于50元,忠实顾客转化率低于30%时,项目不能达到目标。如果目标和实际业绩数据相差不多,可以通过优化内功改善业绩,如果数据相差太大,则说明商业模式可能不可行,应该早点调整商业模式,并在试错过程中重复以上数据分析步骤。
 
最重要的数据,我认为是流量引入成本,新客引入成本,忠实顾客转化率。流量引入成本数据主要考核市场部,新客引入成本数据由市场部、运营部、商品部共同负责,忠实顾客转化率主要由运营部和商品部负责。
 
推广方面的分析包含流量分析,停留时间,流量页面,转化率分析。流量的增减(新UV数据)代表市场部推广工作是否有效,新客停留时间浏览页面量和转化率等数据,一定程度上代表了市场部推广是否有针对性。
 
新客引入成本分析是推广效率重要的KPI,是每个达成目标投入的推广资金。比如某个推广方法带来了10000个UV,500个注册,100个订单。而这个方法耗费了1万元资金,则每个UV,注册,订单投入的资金分别是1元,20元,100元。这个推广方法的新客引入成本是100元。
 

如何与数据分析结果match?
 
市场部的重要工作是尝试不同的推广方式,计算每种推广的投资回报率,根据数据分析结果,重点投入和侧重优化投资回报率最高的推广方式。
 
提升内功是新客引入成本与忠实顾客转化率优化的基本方法。内功包含:商品结构、促销方式、网站体验、物流体验、顾客回访投诉、会员营销等。
 
商品结构优化目的是通过数据分析了解顾客需求,不断引进和淘汰商品,使商品结构尽量符合顾客需求。建立商品维度表,综合考虑商品所有维度,比如价格、型号、外形、品牌、规格等维度,把商品根据不同维度区分,数据分析各品类各维度的销售量,增加高销量维度商品品类占比,精简低销量维度商品品类占比。
 
商品引进淘汰过程还受到很多因素影响,比如“结构商品”即使销量不好,也不能淘汰,“季节商品”需要把季节因素考虑进去。 
 
促销方式主要依靠数据分析评估效果,每做一次主题促销,就在ERP系统中建立促销单据,设置促销主题,促销商品,促销档期。通过BI工具分析促销商品销量变化,促销毛利损失,促销活动带动正常商品销量变化,促销活动带动新会员注册和老会员购物频次变化,综合评估促销效果,以此指导下一次促销活动。
 
网站体验优化可以用一个公式表达:UEO(用户体验优化)= PV / OR(站点跳出率),目的降低顾客跳出率,让顾客购物更加简单轻松。这是建立在对网站定位和顾客特点充分了解的基础之上,比如让网站的布局更加清晰,让顾客购物过程更加流畅。通过热点分析,了解顾客关注的位置,把顾客关注的内容放到热点区域。通过跳出率分析,在顾客容易跳出的页面显示推荐内容,吸引顾客继续留在网站。
 
顾客印象问卷投诉数据分析能发现顾客不满意的地方,在网站建立投诉通道,客服部门要对新、老顾客回访。对生成订单、但最后没有提交订单的顾客回访,在UI、品类、价格、网站体验、物流、售后等方面统计数据,分析那个方面最影响顾客体验,根据实际情况逐条解决。不断优化。
 
会员营销是把会员分成不同类型,根据会员特点营销。可以分为:注册未下单顾客、第一次下单顾客、忠实顾客、高价值顾客、流失顾客。
 
注册未下单顾客,如果留有邮箱,要定向发一些大力度的优惠劵,吸引顾客首次下单,直观体验服务。
 
第一次下单顾客要在包裹中放一些有提醒意义的礼品,比如印有广告的鼠标垫,随时提醒顾客,增加顾客二次下单机会。第一次下单顾客可能不清楚我们网站的主要卖点或优势,可以通过包裹或者邮件向顾客灌输这些信息。客服部门要对第一次下单顾客回访,了解他们的感受。
 
忠实顾客是多次重复购买顾客,通过数据分析了解忠实顾客的所需所求,有针对性的做一些推荐,如果有足够的毛利空间,可以为忠实顾客寄送VIP卡,维护忠实顾客。针对忠实顾客,发挥积分的作用,向忠实顾客推荐一些积分换购礼品,把忠实顾客发展成口碑推广员,如果忠实顾客邀请了新会员,要对忠实顾客做积分奖励。
 
对流失顾客要针对性营销,了解顾客流失的原因,对流失顾客发优惠劵。高价值顾客购买频次不高,但客单价高,商品毛利高,对这类顾客要推荐高价值商品,如果用对待普通顾客的方式对高价值顾客营销,可能会有反效果。

来源:天下网商

]]>
//www.otias-ub.com/archives/281842.html/feed 1
Twitter 1.34亿美元收购数据分析合作伙伴Gnip //www.otias-ub.com/archives/265351.html Tue, 12 Aug 2014 14:37:58 +0000 //www.otias-ub.com/?p=265351 header-slide-03-0763fa29

2014年8月12日Twitter在近期公布的季度财报中表示,该公司以1.341亿美元的价格收购了数据合作伙伴Gnip。Twitter于今年4月宣布将收购Gnip,而这一价格中大部分为现金,少部分为股票。

这并不是Twitter到目前为止规模最大的一笔收购。该公司去年以3.5亿美元的价格收购了移动广告网络MoPub。不过这笔收购表明,Twitter有意在消息分析领域扮演更重要的角色,从而帮助广告主更好地了解用户信息。

Gnip是少数几家能获得Twitter完整消息流的公司。在收购完成时,这其中包括每天约5亿条消息。Gnip对这些信息进行分析,并出售分析结果。该公司的主要客户是希望了解消费者如何看待自己的商家。

这一价格给Gnip的投资方带来了良好的回报。该公司至少已融资660万美元,投资方包括Foundry Group、SoftTech VC和First Round Capital。

分析Twitter和Facebook等社交媒体上的全球对话已成为一项庞大的业务。除了类似Gnip的公司之外,多家软件公司也提供了数据挖掘解决方案,以了解用户的“情绪”,或他们的职业和位置。

苹果去年宣布收购数据提供商Topsy Labs。消息人士表示,这笔收购的价格超过2亿美元。

Twitter在提交给美国证券交易委员会(SEC)的10-Q文件中表示,该公司以5550万美元现金加股票的价格收购了其他4家公司。此外,该公司还同意向被收购公司的特定员工支付5780万美元的现金加股票,吸引这些员工继续留在Twitter工作。

]]>
利用数据分析卖女性内衣bra的电商网站 //www.otias-ub.com/archives/262264.html Sat, 02 Aug 2014 17:35:31 +0000 //www.otias-ub.com/?p=262264  

    近日知名媒体Inc的编辑Jill Krasny发布文章,分析了女性内衣电商行业的发展,以及背后数据分析的作用,文章如下:

  在网上买内衣是一个痛苦的过程,痛苦的程度堪比网购泳衣。而在Inc内部绝对不止我一个人有这个想法。于是我对女士内衣电商这个领域做了一个调查。

  根据市场研究机构Ibis World的报告,全球女士内衣市场的总规模有130亿美元,每年成长3.3个百分点。虽然这个行业竞争激烈,但是维多利亚的秘密仍然是最具规模的,上个季度的营收达到了17亿美元。但是很多人都像我一样,并不喜欢维多利亚的秘密。

  这也给了这些新电商成长的机会。他们的目标就是更好的利用数据,让这个私密的在线购物过程更加的人性化。但是对于这些新电商们的前景,很多人并不看好,比如分析师Mulpuru就表示,他不认认为用户迫切的需要另一个品牌,但是如果有人能够采用创新性的方法,进行产品的设计和广告,那还是有成功的机会的。下面就是这类新创公司的代表:

  位于旧金山的True&Co公司采用数据分析的技术,为他们的客户寻找合适的bra。公司的创始人Michelle Lam之前从未想过从事这个行业,但是她表示自己在线购买bra的经历确实太痛苦了,于是她决定自己动手,而她需要的是大量的数据。用户登录True&Co之后,需要先花两分钟的时间来回答一份问卷。之后就能得到相关的产品推荐,这些品牌都是他们经过挑选的。点击查看相关报道

  

        从2012年创立至今,True&Co已经获得600万美元的风投,并积累了700万份的用户数据。对于消费者的需求有了很多的理解,而这样需求分析还从未停止,他们会跟踪用户浏览了哪些产品、选择了哪些等等。

  当然还有一些用户习惯根据图片做决定,对于这些人他们可以选择Third Love公司,这家新创电商由Heidi Zak创办,她之前是谷歌数字市场营销方面的负责人。Zak和她的团队开发了一款iOS应用,用户可以通过它对着镜子拍摄一张照片,有了这张照片,Third Love就能看到具体的尺寸。她们的产品售价57美元,其实并不便宜,但是确提供了更好的质量。Third Love从知名投资人那里获得了560万美元的投资。

  而另外一些新创公司认为垂直电商才是好的出路。比如有Lauren Schwab和Marissa Vosper共同创建的Negative采用了工程师的角度进行设计,而且设计非常时尚。她们非常在意材料的好坏,从日本和法国进口,争取达到舒适的体验。

  而另一家法国电商AdoreMe则采用了另一种套路,她们遵循维多利亚的秘密的方法,这家公司成立于2011年,却已经获得了1150万美元的融资,可以说是这个领域中成长最快的公司。

  其实每个公司都有自己立足的方法。但是时尚界的分析师Cohen称,除了这些具体的问题之外,让用户相信自己的能力也非常的重要。消费者的负面评价总是比正面评价传播的快。所以所有的这些公司都在采用各种方法留住用户。而Cohen认为,最重要的就是要跟消费者充分的沟通。让消费者相信在线的方式可以完胜实体店的感觉。

]]>
360:2014年世界杯APP足球游戏数据分析–信息图 //www.otias-ub.com/archives/259518.html Sat, 26 Jul 2014 03:51:07 +0000 //www.otias-ub.com/?p=259518 世界杯虽然过去了,但余势未了,伴随世界杯决赛退散的除了大量的伪球迷,挤满天台的“赌球”彩迷,还有在世界杯前信誓旦旦想要捞一把块钱的国内手机游戏从业者们,国内手游渠道360日前放出世界杯期间足球游戏APP数据报告,准备跳天台的手游CP们还是先来研究研究,吸取教训再接再厉吧。

  东——东风

360世界杯APP数据报告 足球游戏的东风破

  世界杯是火热的,世界杯的东风也是无数众多手游厂商想要借来耍耍的,没想到世界杯的东风在手游行业却成了东风破,2014年Q2新增近千款与世界杯相关应用(游戏),其中6月新增世界杯应用达到顶峰,相关应用是五月份150多倍,相关游戏应用增长显著。

  新增世界杯游戏占比15.96%,题材多聚焦在足球上,类别分散,体育竞速占比56%,休闲益智占比39%

  风——风险

360世界杯APP数据报告 足球游戏的东风破

  世界杯的火热,引发相关APP竞相追逐,足球类游戏APP风靡一时,但是成功者寥寥。世界杯之后足球游戏APP热潮迅速降温,基本回到之前的下载水平。

360世界杯APP数据报告 足球游戏的东风破

  破——破解

360世界杯APP数据报告 足球游戏的东风破

  360也在报告中尝试破解世界杯为何没能给CP带来现实利益的困局,报告显示,世界杯期间,世界杯和足球关键词搜索有所增长但增长总量很少,增长后不及某热门亲子类综艺节目关键词的十分之一,玩家总体关注数量少,此外终端设备的局限性也限制了足球类手机游戏的表面,手机设备的局限导致铁杆球迷不爱玩,玩法缺乏新意这些都阻碍此类游戏兴起。

]]>