大数据公司 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Wed, 22 Mar 2017 06:02:07 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 这家数据公司为什么能成为数百万企业的选择? //www.otias-ub.com/archives/574268.html Wed, 22 Mar 2017 05:57:24 +0000 //www.otias-ub.com/?p=574268 今年年初,Oracle发布了一份大数据变化趋势报告,报告中指出,越来越多的企业将用户分析甚至是企业应用同大数据加以结合。从AI支持型应用到Megabox等数据流客户端,各家企业都将迎来自己的大数据转型及下一代数据驱动型应用。Oracle亚太客户体验策略及转型部门总监Krisi Mansfield也表示:“预见并了解了客户的意向,并相应地采取行动之后,就可实现个人化(Individualization)”

目前,国内一批大数据企业都开始致力于此项技术的研究和探索——即围绕用户的使用过程来打造一对一的体验。从已掌握的、能体现用户在某个特定过程的数据入手,厘清这些数据将在接下来的哪些互动环节提供支持与帮助,从而据此制定具体的互动体验。因此,这一过程也将改变企业开展业务的方式——从反应式到主动式和预测式。

大数据在量级、实时性、多样性三项维度上的进程

图片来源:https://www.salesforce.com/hub/analytics/how-to-use-big-data-analytics-tools/

但总的来说,该项大数据应用还面临着许多较大的技术难题。随着数据渠道来源的多样化、量级的巨幅提升和对实时性效果的需求增强,各家大数据公司该如何规划技术演进的具体细节、技术架构又该如何设计和搭建……带着这些问题,我们采访了第三方全域大数据服务提供商【友盟+】COO叶谦,他也以【友盟+】的发展和技术演进为例,分享了合并后统一技术架构的一些经验,阐述了当下大数据行业的痛点、难点和未来大数据的发展趋势。

【友盟+】COO 叶谦

1为什么叫“全域数据”?

“全域数据”是否意味着“线上”、“线下”数据概念的模糊化?从PC端到移动端,从线上数据到线下数据,数据在不断扩张的渠道中逐渐变得分散,只有把这些数据有效打通,才能让大数据发挥其价值。

在叶谦看来,大数据时代,大家越来越多的发现A场景下的一些数据,在B场景也非常有用,所以数据的范围在延伸,意味着企业也要将探寻数据的触角进行拓展。这是全域大数据的基础。但大部分时候,某一家企业或某一个组织,只拥有一部分或一方面数据,因此又很难把多个方面的数据收集、串联起来。

于是,如何多渠道收集数据、如何实现跨屏数据打通、如何解析更多形式的非结构化数据等问题,正使全域数据面临着许多不言而喻的挑战。

移动互联网刚在国内兴起之时,企业对数据的认知或需求还处于初级阶段,大多数只关心诸如留存、日活、新增量这类数据,一些规模较大的企业可能会附加更多维度的分析需求,比如对“各个渠道所带来的量是多少”、“日活人群都是哪些类型”等不同程度的用户细分需求。发展到今天,企业在任何一个用户分区的维度上都希望获取针对其用户的、更细粒度的数据分析,如年龄、喜好、访问频度、地理位置等一系列用户属性。因此,【友盟+】现在的趋势也在由数据统计、数据分析逐渐拓展到数据智能分析和数据深度挖掘。

那它基于一套怎样的模型实现?这里我们以U-DIP(【友盟+】数据智能平台)的运作原理来举例。

目前,【友盟+】的数据源主要来源于PC端、移动端、线下数据这三支渠道,而每一支渠道采集的数据种类又不完全一样。比如PC端数据会更多的聚集于页面跳转、浏览时长、浏览器信息等,移动端数据包括使用APP应用的各类信息,而线下数据更集中在地理位置、移动路线等。这些数据会作为原始日志进入存储平台中。第二步就是通过预定义的规则抽取数据中的特征信息,这些特征信息都和设备(或人群)相关,并能通过一个大ID关联库进行打通。

另一方面,【友盟+】从各类信息中(网站信息,社交网络信息,应用市场信息等)构建关于APP和网站的知识库。这些信息在第三步“深度加工”时,被输入到机器学习算法模型中,得到各种类型的人口学标签和兴趣标签。这个过程中,海量数据还可被利用,进行设备质量和用户真实性的识别工作,例如判断哪些设备是风险设备(非正常用户使用的设备,可能是作弊设备或者是虚拟机)。

北京大学新媒体研究院教授刘德寰也曾提出过,现在存在的很多标签实际上都是伪标签,未来进行有效大数据运算会有两种路径:第一,未来数据分析就是分析人,完善人的纬度。第二个路径,对物的纬度探测,基于人的认知习惯。

2与业务并进,技术该如何更新?

在业务的演进和纵深的情况下,需要技术在背后予以很大的支撑,同时也需要技术能与业务并进。【友盟+】在以下三方面进行了技术上的调整和优化:

数据采集端的演进、后端计算的优化

在数据采集端的持续积累和演进上,它从之前较为简单的采集方案、采集协议,演化成今天所具备的如虚拟机探测方案等较为完善的反作弊方式。同时,随着数据量级的扩增,后端计算也经历了类似的演进,从最初较小体量的计算,到拥有上千台机器的大规模Hadoop集群,再逐渐迁移到阿里云的StreamCompute、MaxCompute大型云计算平台上,【友盟+】根据数据量大、计算复杂等特定情况进行了大量优化和改造。

不断发展的过程,数据量也开始呈现指数型增长态势,每年平均会翻好几倍,再加上计算任务复杂程度和任务个数的提升,导致了后端计算的巨大压力。早期时采用的是当时较为成熟且使用广泛的一些开源框架,比如Hadoop、Storm、Kafka、Spark、Elasticsearch等。随着业务的扩展,【友盟+】更多的采用了阿里云方案,由于稳定性和成熟度等优点,阿里云技术体系也在逐渐取代其曾经的开源系统。

将数据挖掘结果用于技术方案的优化

在数据累积的过程中,【友盟+】开始将数据挖掘的结果用于其自身的计算体系及技术体系优化。针对采集的海量网页内容,技术团队建立了一套数据模型体系,来区分哪些设备、哪些网站和哪些流量存在异常,比如监测出涉及作弊作弊的流量和客户端 。对于电商、支付平台、O2O及互联网广告系统来说,反作弊在本质上发挥着反欺诈、杜绝虚假买卖、保证广告主利益等作用。但作为一项核心技术,几乎所有的公司都会对自己的反作弊技术讳莫如深,研发一套反作弊规则和系统也需要很深的技术积淀。

这一点上,【友盟+】的母公司阿里巴巴在电商反作弊已形成了一整套监控预警、识别分析、处罚管控的多维度监管机制,特别是在对虚假交易的数据监控和算法识别上就应用了大规模图搜索技术。因而【友盟+】在这方面有一些技术优势和先天基因。去年的双十一当天,【友盟+】监测到的广告投放量达34亿多,通过反作弊进行流量过滤后识别出约七千多万条的异常点击。而这一过程也相当于为广告主节省了三千多万广告投放费用(按照0.5元一次点击计算)。

3多条业务线同步推进的情况下,如何统一技术栈?

【友盟+】在业务方向和技术架构上做的规划和统一,同样具有一些借鉴意义。

叶谦说,2017年【友盟+】将主要在三个维度上做新的业务规划,一是互联网应用数据业务,二是拓展新零售数据业务,三是发力广告营销数据业务。 技术方面的调整则会围绕着技术栈统一来展开,主要有四点:开发语言统一,开发框架的统一,通用技术组件的统一以及底层平台的统一。统一的结果不仅能使开发效率提升、稳定性增强、运维成本降低,同时也能在一定程度上缩减核心硬件成本。

以统一开发语言为例,之前所采用的开发语言非常多,比如Python、Java、Scala、Ruby、PHP等。而统一后,所有研发团队会独立使用Java。在叶谦看来,Java是这几种语言中相对最成熟,因而也会围绕Java开发语言来选择较为成熟的开发框架。例如,会统一使用Spring Framework作为前端开发框架。另外,在技术组件的统一上,【友盟+】也选择了经过阿里集团多年双11检验的、能够承载大数据量高吞吐和高并发,具有极高稳定性和较大可扩展性的通用技术组件。2016年双十一期间就用到了阿里集团提供的能支撑庞大数据量的一些通用组件,如:阿里云的MaxCompute。

但总的来说,统一技术栈这件事在任何公司都不可能一蹴而就、一帆风顺。在这个过程中,各技术团队势必会经历一定程度上的心理斗争。因为对于任何技术人而言,改变他所习惯的语言、开发框架,就是对其舒适区的挑战。如何让不同的团队成员走出原有的固定模式,认可技术栈统一的价值,形成统一的认识,是推动技术向前、个人成长的一个最重要的契机。

叶谦认为,当大家逐渐认识到技术栈统一的价值之后,后续的研发推动才能顺理成章,比如:大家一起来选择更成熟技术方案、更成熟的技术体系和更成熟的组件等。

4用数据为客户提供真正的价值

谈到未来大数据的趋势,叶谦认为主要会围绕三点来进行。一是数据与垂直行业越来越紧密的结合,二是数据放开程度会提高、数据交换量会大大增加。当然, 在这一点上还需先解决数据安全提取的问题,这也是目前困扰大数据行业的难点之一。三是与人工智能的结合产出,会更多的基于历史数据对未来进行预测。

这三点同样是【友盟+】发力的主要方向。叶谦希望,不管自己和团队能走多远,还是要回到原本的初心上——真正能用数据为客户提供核心价值,解决他们在利用数据时遇到的困难。

提起印象最深刻一件事的时候,叶谦说起在去年【友盟+】的一个客户,其数据指标曾出现了5%的波动,双方先进行了半个多月的排查和异地讨论,工程师直接到现场和对方一起工作、找出可能的原因点,回来再跟内部人士围绕可能的情况加深分析,才得出了那个细微的导致问题产生的根源。虽然流程之繁琐,但叶谦始终奉信“使命必达”,即使问题再棘手、再特殊,也需要做到客户第一,最大程度上解决他们的需求,从而才能反省和提升自我。

放在团队中,叶谦也更多的在企业文化中植入工匠精神,有意识的在工程师群体培养“客户第一”的理念,鼓励每个人发挥自己的主观能动性,能执着、专注、踏实的在行业耕耘。“越是多变、浮躁的互联网,越需要对业务和技术深挖,把根扎深,这样才能找到自己的核心竞争力。对企业而言,也是如此。”叶谦如是说。

]]>
硅谷大数据【上】:什么是 “改变世界” 的大数据公司 //www.otias-ub.com/archives/465441.html Sat, 23 Apr 2016 15:08:36 +0000 //www.otias-ub.com/?p=465441 1461424086-8165-23112733lrtt

硅谷的这一个月,我在 startups demo days 和各种大公司一日游中度日,以为会逃脱国内各种会上各种 “大数据” 和挖掘机的梗,但万万没想到这里更甚。Hi~ 本文发自仅次于五道口的宇宙中心硅谷,与你分享大数据在这片土地上的真实生长状况。

什么是 “改变世界” 的大数据公司

近两周硅谷两场规模比较大的 demo 大会上,就有十多家自称做大数据的 startups,有做消费者行为的,有做体育分析的,有做 NGO 融资的,有做环保的,有做 UX 的,有做信贷评级的,当然还少不了做移动端广告的。乍看都是高大上的产品,但仔细琢磨一下会发现一些没那么高大上的细节。

比如,有一家介绍时候说”Brings big data to teams, media and fans”,用的是Moneyball作引子。展示结束后询问他们是如何分析视频以得到各种数据的,demo 的哥们表示他们请了一些人看视频的。没错,是人工。自然地,下一个问题就是:未来如何扩张以应对来自不同体育项目大量的全长录像?他的回答也很简单,雇佣更多人。听完我懵了一下,问,那打算如何利用收集的数据呢?答曰:开放 API,自己不做分析。

那么,说好的大数据呢?难道有数据就叫大数据公司了?如果庆丰包子留存有这半个多世纪以来的购买者和交易记录它就得叫大数据公司了?

是,但也不是。

先归纳了一下硅谷 “大数据公司” 的类型,有补充或修正的请拍砖:

数据的拥有者、数据源:特点是业务优势能收集到大量数据,就像煤老板垄断一个地区的矿一样。其实大多数有能力产生或收集数据的公司都属于这类型,比如 Vantage Sports 和收集了 PB 级数据的包子铺。

大数据咨询:特点是非常技术,提供从基础设施规划建设维护到软件开发和数据分析等的服务,但不拥有数据,比如Cloudera这家不到 500 人的 startup 是最著名的 Hadoop 架构咨询公司。

做大数据工具的:比如 AMPLab 出来的Databricks和 Yahoo 人主导的Hortonworks。

整合应用型:特点是收集拥有或购买一些数据,然后结合 AI 来解决更多实际的痛点。

所以回答之前的问题:是,因为包子铺只要收集的消费者数据量够大就能成为数据拥有者,有那么大的数据就有得到洞见的可能;不是,因为可能从真正意义上来说,大数据公司应该只属于第四种类型:AI。

对,我相信未来是 AI 的,而 AI 的食物是数据。就像很多产业链一样,最困难且最有价值的创新往往发生在接近最终用户的那端,比如 iPhone。大数据行业最有价值的部分在于如何利用机器去处理数据得到洞见,影响组织和个人的行为,从而改变世界。收集和整理数据在未来会变得标准化和自动化,而利用 AI 进行分析的能力会变得更为关键。

再看硅谷主打 AI 的公司,现在大致可以分成以下三类了:1. 分析用户行为,改进产品和营销的,比如 LinkedIn 的推荐系统和用 iBeacon 实现店内营销;2. 统筹大量分散个体,利用大数据实现精确有效的预测和规划的,比如 Uber 和前段时间出现的 Amazon Fresh 及 Grub Market;3. 分析识别各种类型的数据,开发更智能的设备和程序,比如 Google 大脑及无人车和以 Nest 为代表的智能设备等。

这些产品都有一个很明显的共性,就是在努力尝试把机器变得更智能以减轻人类的工作量。这个目的与科技发展的动力相符合,因此认为之前所说的第四种类型的公司是最有希望改变世界的。

这样的大数据公司需要什么样的人

那么大数据公司,或者说到真正可以改变世界的大数据公司需要什么样的人才呢?这里要介绍一个在硅谷被炒得很热的高频词汇:数据科学家。

这个职位出现的原因并不是因为数据量变大了需要更好的方式去存取,那是数据工程师的活。那产生的原因是什么呢?正是为了匹配上面第四种公司的需要。数据是 AI 当中不可分割的一部分,而且量越大越好,从数学上来说,数据越多则我们越能够有信心把从样本分析出来的结果推论到未知的数据当中,也就是说机器学习的效果越来越好,AI 越来越智能。

由此诞生的数据科学家是一个非常综合型的职业。它所要求的知识范围包括分析数据的统计学,到算法的选择优化,再到对行业知识的深刻理解。这群人是开发数据产品的核心。硅谷大部分 startup 已经把它当成是必需品了,以至于刚入行的新人也能领到差不多 $100K 的薪水。而模糊的定义和误解也让有的人戏称,data scientist is a data analyst living in the bay area。

值得一提的是,数据本身的飞速发展从另一个侧面其实也给数据工程师们的大数据处理带来了许多挑战。主要来源于以下的两个方面:

数据量的急速增长。如今,数据的产生变得异常容易。社交网络,移动应用,几乎所有的互联网相关产品每时每刻都在产生众多数据。传统的集中储存计算方式显然无法处理如此庞大的数据量。这时,我们就需要新的储存方式,如云储存,以及新的处理方案,如 Hadoop 这样的分布计算平台。

数据本身的非结构化。在传统的数据处理领域,我们处理的主要是结构化数据,例如,Excel 表格可以显示量化数据等。而如今我们面对着越来越多的非结构化数据,如社交网络的评论,用户上传的音频视频等。这些数据存在于包括文本、图片、视频、音频等众多的数据格式中,这些数据中隐含着众多有价值的信息,但这些信息却需要深度的计算才可以分析出来。这就需要我们利用智能化分析、图像识别等等一系列新的算法来进行数据挖掘,这也就是 “大数据” 的挑战所在。

目前硅谷的创业公司正在探索新的应用领域和方法,比如说物联网这块。现在智能设备们才刚刚起步,Nest、被 Nest 收购的Dropcam、Iotera、emberlight等等都属于少部分人的玩具。待到家家户户都安装了智能冰箱、智能灯泡、智能桌子、智能沙发等等的时候,大数据的威力才会伴随着巨大的使用规模而发挥出来。

另外一个角度就是人。如果把之前谈的设备全部置换成个人的时候,他们的相互关系在各种维度上的交错会产生一张巨大的网络,其中的每个组成部分都由大量的数据组成。分析理解预测这些社会关系将会是大数据另一个有趣的应用方向,即Social Physics。不过按照从硅谷到全国的速度,感觉不管哪一方面的普及起码得等上五年以上的时间。

展望一下未来的话,如果参照以前的技术革命和行业发展来看大数据,那么大数据的底层设施将会逐渐被隔离,被模块化和标准化,甚至是自动化,而在其上的中间层和应用层将成为各大公司的数据工程师们激烈攻克的主战场。

硅谷公司的大数据运行现状

目前硅谷各个公司的数据处理水平和模式差别还是蛮大的。除 Facebook 等几个很领先的公司外,大部分公司要么还没有能力自行处理数据,要么就是正在建立单独的数据处理部门,主要负责从数据基本处理到后期分析的各个环节,然后再送到公司内部的其他部门。

对于这些公司来说,建立一个单独的数据处理部门可能还有还路漫漫其修远兮。举个例子来说,Facebook 有一个超过 30 人的团队花了近 4年 的时间才建立了 Facebook 的数据处理平台。如今,Facebook 仍需要超过 100 名工程师来支持这个平台的日常运行。可想而知,光是大数据分析的基础设施就已经是一个耗时耗力的项目了。LinkedIn 大数据部门的建设也已花了整整六年。

普遍来说,各公司自主建立数据处理平台存在着几个难点:

没有足够优秀的数据工程师来组建团队

没有足够能力整合数据

没有易于操作的基础软硬件来支持数据分析

这几个主要难点使得大数据分析越来越专业化、服务化,以至于我们渐渐看到一条 “硅谷数据处理产业链” 的出现。从数据的储存,数据分析平台建立,到数据分析,数据可视化等等各个环节的成本越来越高,这使得本身技术能力很强的公司都还是使用专业数据处理公司提供的服务,而将更多的人才和资源放到核心业务的开发上。

另外,就是各个公司对于数据处理的要求也越来越高。不仅仅需要有效的处理结果,也需要数据处理可以 self-service、self-managing、保证数据安全性、完善实时分析。这些诸多需求也使得专业化团队的优势更加突出。而这样一条整合服务链的行程,也给众多的大数据公司提供了机会。

硅谷是非常神奇的地方。科技概念在这里也不能免俗会被追捧,被炒得很热。但这种激情和关注某个程度上讲正是硅谷创新的动力。即使存在很多投机贴标签的人,即使一片片的大数据 startups 被拍死在沙滩上,即使 Gartner 预测大数据概念将被回归现实,但相信会有更多的人投入到大数据这个行业,开发出更智能,更有影响力的产品。毕竟,大数据本身,不像一个单纯的 pitch 那样,它能够保证的是一定可以中看并且中用。

硅谷大数据【下】:硅谷四巨头如何玩转大数据

]]>
亚洲前十的大数据公司都在做些什么? //www.otias-ub.com/archives/339034.html //www.otias-ub.com/archives/339034.html#comments Sat, 11 Apr 2015 11:22:00 +0000 //www.otias-ub.com/?p=339034

 5f81ceeb-a84a-4bf0-a5bf-7fc574b4d76f

互联网时代,大数据分析已成为IT、电子商务、零售业、银行业和保险业最至关重要的工具之一,可以帮助他们正确锁定客户群,为客户提供个性化的定制解决方案。使用分析工具的公司已在客户招揽、保留和促进销售上看到了巨大的改善。

亚洲的很多大数据公司都在海外市场书写了成功故事。不过,亚洲市场正成为大数据业务的主战场,因为世界总人口的60%都居住在亚洲,且亚洲上网人数在不断上升。

这里为您列出亚洲大数据分析领域十强:

 Aureus Analytics:总部位于新加坡的大数据分析公司Aureus Analytics为企业提供集成的大数据分析平台,使企业不用再为理解客户需求、分析业务风险和找出运营低效之处而网罗多种分析工具。它的ASAP统计与分析平台被设计为能跨越多种数据仓库类型和数据结构类型的集成分析平台,无论结构化或非结构化数据、内部数据或外部数据、大型数据仓库或小型数据源,都能用这个平台进行统计分析。这家公司最近刚在在线交易平台LetsVenture上筹集到85万美元资金。

 Mu Sigma:位于印度班加罗尔的Mu Sigma公司成立于2004年,帮助企业利用大数据建立数据驱动的决策制度。它在诸如市场营销、风险控制和供应链等关键领域解决业务问题,为企业客户提供融合了技术平台、过程和人力的生态系统。公司声称拥有超过3500名决策学专业人士和75家财富500强客户。

截止目前,Mu Sigma已从红杉资本和泛太平洋资本集团一类的风投公司筹集到超过2亿美元资金,并正在与投资者商谈另外2亿的新鲜资金注入。

Mu Sigma在全球各地都设有办公机构。

 Fractal Analytics:Fractal Analytics组建于2000年,为企业(消费品公司、零售商和金融机构)提供理解、预测和培养消费者行为,及改善市场营销、定价、供应链、风险管控和索赔管理的工具。

其旗舰产品‘客户基因组’帮助营销人员在个体级别掌握复杂的客户行为。客户基因组从每笔交易和包括社交媒体在内的客户互动中学习客户特征,帮助营销人员建立关于单个客户的完整视图。这家公司的解决方案也可以用于预测经营业绩。

Fractal的背后是私募投资公司TA Associates,自2013年起已接受其2500万美元投资。去年,多伦多证券交易所上市公司Aimia也对Fractal进行了投资。

Fractal拥有职员800多人,客户遍布一百多个国家。其总部位于美国,但在伦敦、孟买、新德里、新加坡和迪拜等地都设有办公机构。

Manthan Software Services:位于班加罗尔的Manthan软件服务公司为企业提供商务智能和大数据分析解决方案。Manthan成立于2004年,结合先进的预测分析、可行性分析和客户知识帮助零售商分辨和抓住成长机会。

这家公司受富达(印度)成长基金和诺维斯特风险投资支持,总部设在班加罗尔,在美国、英国、菲律宾、新加坡和巴西都设有办公机构。

 Crayon Data:Crayon Data成立于2012年,总部分别在印度钦奈和新加坡。与常规的以人为本的分析模式不同,Crayon通过融合企业、公众、外部网络和社交数据打造能产生真正的业务解决方案的工具。

Crayon Data的旗舰产品‘简单选择’为企业带来大数据与分析的巨大力量,使客户能够增加他们的销售转换,从已有帐户上增加收益。这家公司主要面向酒店业、金融业、零售业和技术行业。目前为止,已从Jungle Ventures和Spring Seed Capital募集到550万美元天使投资。

 Heckyl Technologies:成立于2010年,为经纪公司、短线交易员、投资者和基金经理提供实时新闻与数据分析平台。其集成解决方案可以提供信息、可视化效果、情绪热点图和市场数据以帮助交易员在市场中找到交易机会。

与传统的解决方案不同,Heckyl在它的平台里引进了社交媒体因素。它还准备为金融机构和对冲基金开发一款大数据挖掘平台。2013年12月,由国际数据集团创业投资公司和Seedfund Advisors种子基金引领的第二轮投资中,Heckyl获得了350万美元资金。这家公司在孟买和英国设有办公点。

Spire Technologies:总部位于班加罗尔的Spire Technologies为企业管理他们的人才需求提供上下文搜索引擎。Spire成立于2008年,为供应链管理、客户关系管理、欺诈信息、人才成长管理和前瞻性人才信息提供多种解决方案。同时,它还通过从文档、电子邮件、短信息和评论中抽取数据构建欺诈监测工具。2013年12月,这家公司从不知名的投资者手中募集到8百万美元的首轮投资。

 Altizon Systems:Altizon是基于大数据的物联网初创企业,其主要关注点在工业互联网上。它为制造业厂商提供可以打造智能连接设备并从云端进行控制的平台。这家初创公司有一套传感器数据设备和软件开发包,可以从工业设备的传感器里将数据提取到它的Datonis平台进行大范围数据摄入和聚合。

去年9月,Altizon吸纳了数额未公开的种子基金,提供者是印度一家专注大数据投资的早期基金Hive India,风投公司Infuse Ventures和Persistent Ventures也有参与。

TookiTaki:TookiTaki是一家专注于受众发掘与预测的市场营销情报初创企业。 它正在打造一个软件即服务(SaaS)平台,为企业和媒体机构提供受众行为的可行性分析。作为其分析基础的预测模型结合了公众数字信息与突出投资回报率的反馈环。

TookiTaki在新加坡和印度都有办公机构。今年1月份从风投公司Jungle Ventures、Rebright Partners和Blume Ventures募集到一百万美元的种子基金。

 Corporate360:成立于2012年,为企业提供IT销售数据分析服务。有四种产品:Tech SalesCloud(为技术产业设计的数据解决方案,可提供公司概略、技术安装情报、联系人数据和预测分析);DataFactory(以数据即服务模式运行的B2B市场营销数据软件,提供公司概略和联系人情报);Peep(社交媒体可视化应用程序,聚合并形式化社交媒体个人资料/联系人数据,将之在统一的窗口中呈现出来);SataStudio(数据服务,提供精选数据服务、数据挖掘、预测性分析和社会情感分析)。

Corporate360办公机构分布于加利福尼亚、利物浦、马尼拉、新加坡和印度。最近,这家公司收获了20万美元的天使投资。

]]>
//www.otias-ub.com/archives/339034.html/feed 1
亚马逊已进化成一家大数据公司 //www.otias-ub.com/archives/274970.html Wed, 17 Sep 2014 07:49:26 +0000 //www.otias-ub.com/?p=274970 分析称亚马逊已进化成一家大数据公司

亚马逊如今并非商务公司,而是大数据公司。它拥有着日益增长的云基础设施、海量数据流和内容。

以下为文章主要内容:

如今对亚马逊的威胁越来越感到担心的不仅仅是零售业,还包括企业巨头,它们正更多地关注亚马逊的一举一动。电商出家的亚马逊如今正酝酿在大数据和企业市场拥有同等强大的影响力。

这也是2013年将是该零售和计算巨头的意义重大的一年。它拥有着日益增长的云基础设施、海量数据流和内容。市场研究公司Constellation Research分析师雷·王(Ray Wang)将这称之为“矩阵商务”。

雷·王称,亚马逊并不是家商务公司,而是一家大数据公司,其开发出的云基础设施处于盈利状态,可以资助零售业务的运营。它拥有的移动设备和内容可以通过用户网络进行传播。

他说,“这关乎通过大数据统治矩阵商务。在矩阵商务领域,网络渠道、来自大数据的需求信号、来自物流的供应链情况、来自各个接口的支付技术、来自数字签章的无缝促成因素等等,它们就是未来。”

零售商们所处的市场,曾带给它们高额利润。而亚马逊则采取规模和低利润率战略,对于通过亚马逊网络服务(AWS)提供的基础设施产品,它也是采取同样的战略。

“零售顾客希望获得廉价产品和快速的配送服务,而AWS客户则想要获得可靠性和速度,”亚马逊CEO杰夫·贝佐斯(Jeff Bezos)在AWS re:Invent大会上表示,“长期来看,我们对这些业务的投入将持续获得回报。人们不可能会说‘我喜欢AWS,但我希望它少一点可靠性’。”

正如2012年所做的,亚马逊2013年将继续做一些新事情。今年,该公司继续投资建设配送中心,继续在纽约、旧金山等大城市附近建仓库。它甚至开始在零售商店部署电子储物柜,让购物者能够自己提取网购商品。

AWS今年在在线分析引擎Elastic Map Reduce的基础上推出了两款全新的大数据服务。DyamoDB是驱动亚马逊消费网站的NoSQL产品,从2007年开始进行内部部署。RedShift则是AWS在AWS re:Invent大会上推出的在线数据仓库服务。AWS连接企业数据中心,能够运行关键任务程序。它将继续与SAP等企业合作运行商用软件。

亚马逊还亏损出售Kindle硬件,它这么做,是因为它能够借此售出更多地电子书,巩固其在该市场的主导地位。它还利用这些设备进军出版市场。

连接亚马逊在线零售、云服务和平板电脑业务的共同要素就是数据。对亚马逊而言,硬件并不重要。它的目标并不在于通过出售时髦消费电子产品和昂贵设备获利。通过效率,亚马逊能够在零售、出版和企业服务领域进行尝试。

然而,AWS并非绝对可靠。由于多次出现故障,它让竞争对手有了足够的余地来实现差异化。低利润率并不意味成功,它会对营收和公司股价造成影响,这些都是不容忽视的因素。

亚马逊并不是商务公司,而是大数据公司,这也是亚马逊过去一年的成功和未来一年的成功显得不同的原因。

当日送达服务不会给竞争对手带来帮助,研究亚马逊才是更好的策略,在利用自己的基础设施提供数据服务和最低价格方面它有很多可以借鉴的地方。

]]>
每一家公司都是大数据公司 //www.otias-ub.com/archives/230760.html Sun, 25 May 2014 15:26:31 +0000 //www.otias-ub.com/?p=230760 canstockphoto19653809

每天都有许多企业在搜集有关顾客和所在行业的数据,用作开展业务的依据。昨天,在马萨诸塞州剑桥市举办的麻省理工学院(MIT)斯隆管理学院CIO研讨会上,我参加了一个有关大数据的小组讨论,结果让我有一种茅塞顿开的感觉:原来每一家公司都是大数据公司,只是有人明白这一点,有些人不明白。

在有关云计算的问题上,流行着这样一种说法:诞生于云端的公司比正在向云端转型的公司具有优势,原因是前者深刻领悟了云计算的运转机制,这是后者所不具备的一种能力。这就像是与生俱来就在利用数据推动自身发展的公司,与正在寻找办法来实现这种转型的公司之间的区别。

小组讨论成员、NuoDB创始人兼CEO巴里·莫里斯(Barry Morris)表示,作为商业经营活动的一部分,一些企业正利用数据进行商业决策,并且他多次提到电动汽车制造商特斯拉,将其树立为典型案例。在如何利用数据的问题上,这些企业并没有刻意为之,而是一切顺其自然。

正如莫里斯所说,特斯拉并没有设立一个专门委员会,用于研究如何利用数据。相反,特斯拉只是在不断分析那些通过汽车本身传递给他们的数据。这种数据会告诉他们,刹车片何时会老化失效,人们距离下一个充电站有多远,以及兴建下一个充电站的最合理位置。特斯拉会监控他们所能搜集的每一个数据,虽然该公司不销售数据,但仍会将数据作为企业经营不可或缺的一部分。

在听完TriNet CEO伯顿·戈尔德菲尔德(Burton M. Goldfield)的一席话后,我对数据作为商业决策依据这一概念的理解更为深刻。TriNet的业务是处理与人力资源有关的监管和法律问题,客户都是小企业。

据戈尔德菲尔德介绍,TriNet已与9000家企业建立了合作,这些企业的员工总数超过24万。TriNet会负责处理合作企业的员工薪水、福利和其他服务,由此对小企业的健康状况和福利问题有着极为深入的了解。

TriNet每个月都会就小企业就业市场现状发布一份报告。目前这种服务都是免费、便捷的内容营销活动,用以宣传TriNet擅长的业务。戈尔德菲尔德表示,由于把握了小企业的脉搏,TriNet可以生成这种报告,无论他们是否选择从这种服务中创收。

戈尔德菲尔德还向我举例说明了他们能从这种数据中读出什么信号。例如,TriNet曾发现2008年风险投资家的奖金支票都花没了。他说,TriNet当时并未意识到这意味着什么,但事后看来这显然是经济危机日益加深的征兆。

就在本周,亚马逊发布了有关全美20座最爱读书城市的报告。亚马逊在一份声明中描述了制作这一报告的方法:“汇编了2013年4月至2014年4月间所有图书、杂志和报纸印刷版和Kindle格式的销售数据,而且是基于对人口超过10万的城市的人均计算结果。”与TriNet一样,亚马逊也会发布例行报告,提供讨论的素材,充分利用他们在调查图书和期刊销售行为时所搜集的数据。

布莱恩·利利(Brian Lillie)是Equinix CIO,这家公司提供数据中心服务。利利表示,他们会将数据作为商业经营活动的一部分,这有利于分析数据中心正在发生的事情,寻找最有效的数据中心运行方法。“我们会利用数据对一些问题进行预估,做到未雨绸缪。”利利告诉我说。

某个零部件何时会出现问题?他们又如何能减少制冷成本?所有此类信息都能在业务层面为企业带来帮助,因为越早理解这种信息,越有效地进行运营,他们就越有可能获取更大的收益。这具有良好的商业价值。

利利表示,作为商业经营行为的一部分,Equinix曾经讨论过如何将搜集的数据当作产品使用,但至少在近期还不会推出这种产品。利利指出,Equinix肯定发现了数据的价值,而且正在研究如何使用。

目前有一件事已经很清楚了,那就是每一家公司都将数据搜集作为商业运营的一部分,无论他们是否会以这种方式考虑问题。这些企业能以各种方法来利用这种数据,无论是作为内容营销实践活动,用于调整自身业务的内部规范,还是基于搜集的数据来推动新型业务模式的建立。

无论如何,如果企业能利用数据进行决策,更好地理解客户需求,那么它们将会成为更明智的企业。用棒球运动的行话来说,就是看到球,击到球。对于一些企业来说,这意味着搜集数据,利用数据。这其实就是让你明白自己是干什么的,然后按照商业经营活动的一部分,充分利用你搜集到的信息。

如果你能做到这一点,那意味着你正走在成为大数据公司的道路上,因为最终每一家公司都是大数据公司。只是有些人明白这一点,有些人还没有领悟。

via:techcrunch

]]>
VentureBeat:10家大数据领域的出色公司 //www.otias-ub.com/archives/73741.html //www.otias-ub.com/archives/73741.html#comments Wed, 17 Oct 2012 16:27:55 +0000 //www.otias-ub.com/?p=73741 “大数据”近几年来可谓蓬勃发展,它不仅是企业趋势,也是一个改变了人类生活的技术创新。在大数据的帮助下,警察可以通过犯罪数据和社会信息来预测犯罪率,部分科学家通过遗传数据预测疾病的早期迹象。可以说,现在整个行业都非常看好大数据。最近外媒VentureBeat列出了10家大数据领域的炫酷公司(编者注:大部分为创业公司),当中涉及了医疗、政府、科研等领域。下面我们来对他们了解一下。

数据服务:Metamarkets

在过去的一年里,Metamarkets得到很大的发展。这家公司对tweet、支付、签到和一些与互联网相关的问题进行了分析,为客户提供了很好的数据分析支持。今年春季,这家总部位于旧金山的创业公司得到了投资者的青睐,最近一笔融资金额高达2300万美元。

CEO Michael Driscoll决心要做大这家创业公司,他同时希望大数据能够帮助人们更好的完成工作,通过数据分析为客户(比如说英国《金融时报》和美国在线)挖掘更大的广告价值。

数据可视化:Tableau

数据化创业公司Tableau一直被媒体和行业视为大数据领域中的重点关注对象,他们的精力主要集中于将海量数据以可视化的方式展现出来。最近的一笔融资金额为1000万美元。

Tableau为数字媒体提供了一个新的展示数据的方式。他们提供了一个免费工具,任何人在没有编程知识背景的情况下都能制造出数据专用图表。这个软件还能对数据进行分析,并提供有价值的建议。

CEO Christian Chabot指出,Tableau的使命是帮助客户查看数据,并理解数据背后的意义。

企业版Hadoop:Cloudera

面对这庞大数据的存储和处理,NoSQL可以做得很好,而Hadoop可以利用一些价格低廉的硬件完成大量的数据分析。创业公司Cloudera就采用这两种技术,目前获得了7600万美元的融资。

该公司的创始人Jeff Hammerbacher曾经在Facebook工作过,当时他利用了Hadoop来分析用户行为。现在他已经把相应的技术转移到了Cloudera之中。

这家公司采用大数据来改善大众的健康,而整个卫生保健行业也会因为受到大数据的驱动而催生更好的创新和服务。Hammerbacher指出,公司一个重要的客户就是Explorys Medical。他们通过采集病人数据,从而揭示疾病治疗、护理和药物测试等方面的见解。“我们要处理各种各样的医疗数据,比如说医生处方、图像、医生笔记等。消费者可以通过分享这些数据而推动医疗行业的变革。”

大数据分析:ParAccel

在整个数据行业里面,ParAccel是久负名气的。自从他们向美国执法机构提供了数据分析之后,公司得到了更好的发展。他们通过了一些渠道获得不少犯罪数据,并对15000个有犯罪前科的人进行跟踪,从而向执法机构提供了参考性较高的犯罪预测。

可以说,他们是犯罪的预言者。去年ParAccel协同SecureAlert对形式犯罪数据进行了校准。通过使用ParAccel所提供的分析工具,SecureAlert能够识别犯罪行为,并向相应的机构发出警告。

ParAccel颠覆了Hadoop的神话。ParAccel的CEO Chuck Berger指出,太多创业公司陷入了“大数据=非结构化数据的大数据=Hadoop”的逻辑。除了非结构化数据和半结构化数据以外,结构化数据也在快速增长。

商业智能领域:QlikTech

QlikTech旗下的Qlikview是一个商业智能领域的自主服务工具,能够应用于科学研究和艺术等领域。这家公司是在90年代后期建立的,并从互联网危机中存活下来。这家公司在2010年的时候顺利上市,目前用户数量为2600万,公司估值超过20亿美元。

目前这家公司正在和Google合作,以便于开发者更好的利用大数据。最近Google发布了Google BigQuery,方便开发者获取大量数据。为了帮助开发者对这些数据进行分析,QlikTech提供了对原始数据进行可视化处理等功能的工具。

QlikTech的副总裁Jeff Boehm指出,处理大数据需要专业技能和技术水平,一般的人并不具备这种能力。公司的使命就是让普通用户也可以有效利用大数据,并将之融入到生活里面。

数据科学:Kaggle

Kaggle希望通过“数据科学运动”来挑战世界上最好的科研人员和统计学家。他们希望以聚集天才的方式,在大数据的辅助下进行协同工作甚至直接竞争,以研究出最复杂的算法和解决方案,从而进一步理解人类。

比如说Kaggle会为全球顶尖的科学家举办竞赛活动,让他们通过网络的方式提交数据和问题,从而获得其他科学家所提供的解决方案。最近Merck公司向他们提供了一种分子结构,而Kaggle顺利地预测出这种化学物质的毒性。

商业类型:GoodData

在很早以前,GoodData就希望帮助客户从数据中挖掘财富。这家创业公司主要面向商业用户和IT企业高管,提供数据存储、性能报告、数据分析等工具。他们在最近的C轮融资中获得了2500万美元,其领投者是Andreessen Horowitz。

这家公司目前拥有6000个企业用户,其中包括了Groupon、Zendesk和Mint.com等。在今年第二季度的时候,他们的预订量同期增长了280%。

电子商务数据:TellApart

TellApart是由Google前员工Josh McFarland和Mark Ayzenshtat所建立的,他们正在和电商公司进行合作。他们会根据用户的浏览行为等数据进行分析,通过锁定潜在买家方式提高电商企业的收入。目前这家公司已经获得了1775万美元的融资。

TellApart正在建立核心系统去解决大数据多带来的挑战,从而为客户带来更大的收入。CEO Josh McFarland表示:“公司要打造一个可以自我学习的算法系统,藉此更充分利用数据,并挖掘他们的价值。”

社交媒体数据:DataSift

随着像Twittter、Fcacebook等社交网络媒体的爆发,越来越多的品牌也会受到他们的影响。DataSift主要收集并分析社交网络媒体上的数据,并帮助品牌公司掌握突发新闻的舆论点,并制定有针对性的营销方案。目前这家公司已经获得1500万美元的融资。

这家公司还和Twitter有合作协议,使得自己变成了行业中为数不多可以分析早期tweet的创业公司。举个简单的例子,DataSift可以根据Twitter的数据对两届奥运会进行横向对比,从中了解并分析公众对当时新闻和事件的反应。DataSift的前景逐渐明朗,现在客户数已经超过了10000个。

创业公司新秀:Datahero

Datahero已经获得了100万美元的融资,其任务是将复杂的数据变得更加简单明了,方便普通人去理解和想象。创始人Chris Neumann曾经是Aster Data的员工。

在一次寻求融资的电话中,Foundry Group的Brad Feld递给了Neumann一份数据文件,目的是要测试他们公司对数据的处理速度。除此之外,他们还要求并要求Neumann创建与之相关的可视化的数据图表。最后Neumann出色地完成了任务,并给Feld的工作带来很大帮助。这家公司的另一个目标是微软的Excel。很多初级分析师在使用Excel处理数据的时候需要花费一天甚至更多的时间,而他们希望能够打造一个比Excel更加便利快速的数据处理工具。

Via:venturebeat

]]>
//www.otias-ub.com/archives/73741.html/feed 2
大数据公司Attivio获3400万美元投资 整合结构化及非结构化数据提供企业搜索服务 //www.otias-ub.com/archives/73116.html Sun, 14 Oct 2012 14:55:53 +0000 //www.otias-ub.com/?p=73116 企业数据每天都在不断膨胀,无论是邮件、文档、还是数据库中的结构化数据。而利用这些数据并从中挖掘出信息才能更好地帮助企业做出正确决策。最近Attivio这家为企业提供智能检索和分析的大数据公司获得了3400万美元的A轮融资。

Attivio的核心产品是AIE(Active Intelligence Engine),一个智能引擎。这个AIE将企业的结构化和非结构化的各类数据整合起来,形成统一的信息接入平台,让企业人员可以方便地检索和分析信息。这就弥补了原先企业商业智能只分析结构化数据而忽略非结构化数据(如邮件及各类商业文档)中大量有价值信息的缺憾。

Attivio创始人及CEO Ali Riaz认为当(企业)用户发送一条查询请求时,得到的应是有洞察性的信息,而不是罗列链接或是仅给出一张图表。要解答出“为什么”而不仅是“是什么”,比如要能分析出销售下降是因为市场需求下降还是因为销售人员表现不够突出等。Ali Riaz曾是提供企业搜索解决方案的公司Fast Search & Transfer的COO和CFO,Fast在2008年被微软以12亿美元收购。

Attivio这轮3400万美元融资由Oak Investment Partners领投。UBS、Cisco和德国电信等都是Attivio的客户。Attivio同领域的竞争者有Autonomy和Endeca,Autonomy在2011年被惠普以百亿美元收购,Endeca也在同年被甲骨文以11亿美元收购。但CEO Ali Riaz曾表示不会出售Attivio,会一直把它当独立公司来运作。

source VBmasshightech

文章来自36氪
]]>