维基百科 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Thu, 03 Apr 2025 15:04:09 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 维基媒体基金会:人工智能爬虫导致维基共享资源带宽需求激增 50% //www.otias-ub.com/archives/1748818.html Thu, 03 Apr 2025 15:04:09 +0000 //www.otias-ub.com/?p=1748818 维基媒体基金会是维基百科和十几个其他众包知识项目的管理组织,该基金会近日表示,自 2024 年 1 月以来,从维基共享资源下载多媒体的带宽消耗激增了 50%。

该公司在周二的一篇博客文章中写道,其原因并非源于渴求知识的人类需求不断增长,而是源于想要训练人工智能模型的自动化、数据饥渴的抓取工具。

帖子写道:“我们的基础设施是为了在高关注度事件期间承受来自人类的突然流量激增而建立的,但爬虫机器人产生的流量是前所未有的,并且带来了越来越大的风险和成本。”

维基共享资源是一个可自由访问的图像、视频和音频文件存储库,这些文件可在开放许可下使用或属于公共领域。

深入研究后,维基百科表示,最“昂贵”的流量(即就所消费内容类型而言资源最密集的流量)中,近三分之二(65%)来自机器人。然而,只有 35% 的整体页面浏览量来自这些机器人。根据维基百科的说法,造成这种差异的原因是,经常访问的内容在其缓存中更靠近用户,而其他不经常访问的内容则存储在更远的“核心数据中心”,从那里提供内容的成本更高。这是机器人通常会寻找的内容类型。

“虽然人类读者倾向于关注特定的(通常是相似的)主题,但爬虫机器人倾向于‘批量阅读’大量页面并访问不太受欢迎的页面,”维基百科写道。“这意味着这些类型的请求更有可能被转发到核心数据中心,这使得我们的资源消耗更加昂贵。”

总而言之,维基媒体基金会的网站可靠性团队不得不花费大量时间和资源来阻止爬虫程序,以避免对普通用户造成干扰。而这一切都是在考虑基金会面临的云成本之前。

事实上,这代表了一种快速增长的趋势的一部分,这种趋势正在威胁开放互联网的存在。上个月,软件工程师兼开源倡导者Drew DeVault 抱怨人工智能爬虫忽略了旨在抵御自动流量的“robots.txt”文件。而“务实工程师”Gergely Orosz上周也抱怨说,来自 Meta 等公司的人工智能爬虫增加了他自己项目的带宽需求。

尽管开源基础设施尤其处于风口浪尖,但开发人员正在以“智慧和报复”进行反击。一些科技公司也在尽自己的努力解决这个问题——例如,Cloudflare 最近推出了 AI Labyrinth,它使用人工智能生成的内容来减慢爬虫的速度。

然而,这更像是一场猫捉老鼠的游戏,最终可能迫使许多出版商躲在登录和付费墙的后面——这对当今使用网络的每个人都是有害的。

自 中文业界资讯站
]]>
维基百科15岁:创始人身价仅仅100万美元 //www.otias-ub.com/archives/430930.html Mon, 18 Jan 2016 16:49:46 +0000 //www.otias-ub.com/?p=430930 130464733

创始人吉米·威尔斯

1月15日,维基百科迎来15岁生日。这一免费的网络百科全书,现存超过3800万篇文章,有290种语言版本,是世界上最大的单一知识储存库。

2015年底,英文版维基百科的文章数量超过500万篇(维基百科85%的文章是非英语的),是全球访问量第七高的网站,吸引了24%与教育有关的网络流量。

在维基百科之前,世界最大的百科全书据称是中国1408年成书的《永乐大典》,全书有22937卷手稿。

每月平均5亿人次访问

我们说某事“改变世界”,通常都是夸张。但对维基百科而言,这是个事实。

2001年,吉米·威尔斯创办这一网站的初衷是让用户分享、学习知识。维基百科诞生15年后,每月平均有5亿人次访问网站,8万名志愿者定期编辑页面;每天增加7000篇新文章;每小时出现1.5万次编辑。

维基百科集中了各国用户的集体智慧,是全球被链接次数最多的网站。教师、学者、记者和学生以它作为参考,研究人员还利用它的访问数据,预测票房、股市、流行病的前景。

虽然一部分人在维基百科上编纂文章的动机不纯,比如政客和公务员倾向于修改真相,不过总体而言,多数用户是出于分享知识的无私动机。比如,一名前IBM员工对“com prised of”一词已经更正了4 .7万次,因为它语法不正确。

在这15年中,维基百科无疑发展成人类历史上最大的合作项目。它实时、动态地记录历史,意味着什么都不会被遗忘。

去年11月13日巴黎发生恐怖袭击时,一名伦敦用户马上撰写了概述事实的条目,两个小时内,这篇文章被其他用户编辑了上百次,引用了10个不同来源的消息。这就是开源、群策群力的力量。

维基百科庆祝15周年之际,创始人吉米·威尔斯表示,维基百科的目标是成为“人类所有知识的集大成者”,为人类历史提供“高质量的记录”,“让地球上每个人都能免费获取所有知识”。

拒绝广告靠捐款运营

根据吉米·威尔斯在维基百科上的词条,他现年49岁,来自阿拉巴马,是一个无神论者,身家100万美元,结过3次婚。意外吗?这个举世闻名的互联网大腕并没有成为亿万富翁。

与谷歌、脸谱或苹果公司不同,维基百科不是日进斗金的互联网巨头。其他公司通过高大上产品或服务赚取巨额利润,苹果2015年盈利高达2337亿美元。维基百科一直是简朴、廉价、基于文本的网站,其网站设计几乎一直未作改动。

维基百科是由“维基媒体基金会”运营的非营利组织,依靠志愿者驱动,主要靠全球庞大社群的捐款维持运作。多数款项来自公众的小额捐款,而不是富豪的一掷千金。

维基百科一直坚决反对在其页面上植入广告、赞助商页面或网站链接,以它的用户数量来看,接商业广告肯定会大赚特赚。但维基百科无论是过去还是将来,都坚持捐赠模式,尽管这条路并不好走,却也正是它身份认同的一部分。

看看脸谱的马克·扎克伯格和微软的比尔·盖茨,会不会感到后悔?

吉米·威尔斯说:“我不后悔。我的生活很有趣,可以见到形形色色的人,可以做任何我喜欢做的事。我一生中做的事情,比如游说政府官员,我都觉得非常有趣。我不是一个被金钱驱动的人。”但他也不反对人们赚钱。事实上,他非常欣赏好友扎克伯格,认为后者终将像比尔·盖茨一样有更大成就。

谈及在维基百科的领导角色,吉米·威尔斯说:“我更多的是一个象征性角色,并不掌握多少实权。”他说维基百科“更像一个现代城市,而不是一个公司”。他目前已脱离网站的日常运营,一年有150天在路上,到处发表演讲,游说政府。

冲击传统模式

维基百科的核心非常简单:知识。它本身并不赚钱,但它的迅速崛起颠覆了一系列社会和商业模式。

2012年,《大英百科全书》停止印刷,时任出版社总裁乔治·高祖告诉记者:“《大英百科全书》与维基百科的体量相比,简直是微不足道。我们就做不到为每一个卡通人物、名人和运动员撰写词条。”

当然,摧毁百科全书的印刷业务,电脑也起了至关重要的作用。

但维基百科证明,它比门槛过高的传统百科全书更能造福数百万人的生活。

以有关正规教育的条目为例,全球70个国家的师生贡献了8 .8万多篇新文章,许多学生编辑或创建新的维基百科条目,而不是做传统的家庭作业。

主攻发展中国家

如果维基百科想实现其远大目标,让世界上每一个人都能获取知识,当务之急是要适应移动技术的发展。

由于移动设备的普及,搜索和学习已经从个人电脑转到移动客户端,我们希望知识在手机上垂手可得。

维基百科下一波十亿用户将来自发展中国家,他们第一次上网将是用手机上网。吉米·威尔斯表示:“我们将投资移动技术,因为我们需要为他们服务。”

最好还能提供产品扩展,比如将一个按钮集成到音乐或新闻app,方便用户立即查询大卫·鲍伊的音乐或量子理论。维基百科将成为互联网的即时注释工具。

吉米·威尔斯理应为他的成就感到骄傲,不过,他表示,在接下来的15年里还有更多的事情要做。

“维基百科在发展中国家的拓展,是我个人的首要目标,因为我的梦想是惠及地球上的每一个人。”

“那么,”他说,“我们还有很长的路要走。”

档案

维基百科的小秘密

1你用16年时间才能读完英文版维基百科上的所有内容,而且你要一刻不停,不眠不休。

2维基百科不只是百科全书,还有免费教科书、免费辞典、学习工具、旅游指南等,你知道吗?

3维基百科的机器人软件bot在幕后做重复性的工作,以减轻志愿者的工作量。

4 2007年,维基百科跻身全球十大网站,这是排名居前的唯一的非营利性网站。

5维基百科的作者被称为“维基人”。和来自全球各地的人合作,建立世界上最大的数据库信息,这一工作颇具挑战性。“维基人”撰写了规则、指导方针、论文,帮助新手了解如何做一个合格的“维基人”。

6英文版维基百科被编辑次数最多的条目是美国前总统小布什的,被编辑不下4 .58万次;WWE职业摔跤选手紧随其后,被编辑超过4.28万次。

7英国“打不死的战士”AdrianCartondeWiart爵士的维基百科条目是大热门,在推特上被转发超过3500次。

8“维基人”为争议和骗局也撰写了条目。比如,一篇文章称拜伦勋爵养了鳄鱼和蜜獾当宠物,虽然他养了猫、狗、马、熊、狐狸、猴子、鹰、乌鸦、猎鹰、孔雀、獾、鹅、苍鹭和山羊,但经“维基人”查证,他养鳄鱼和蜜獾却是假新闻。

9通过研究近3年的维基百科搜索数据,洛斯阿拉莫斯国家实验室的研究人员能够对登革热在巴西的传播以及流感在美国、泰国、日本、波兰的传播,做出非常准确的预测。

10美国程序员沃德·康宁汉姆(见下图)设计了wiki,全球首个允许多名用户同时编辑文档的互联网平台。wiki来自夏威夷语,意为“快点快点”。

]]>
2013年1月维基百科移动页面浏览量突破30亿次 占到总页面浏览量的14.5% //www.otias-ub.com/archives/93614.html Mon, 04 Feb 2013 00:25:45 +0000 //www.otias-ub.com/?p=93614 据国外媒体报道,维基百科(Wikipedia)称,1月份该公司移动页面浏览量突破30亿次,占到总页面浏览量的14.5%,比上年同期增长4.6个百分点。2010年12月份,维基百科移动页面浏览量首次突破5亿次(占总页面浏览量的4.1%),2011年10月份和2012年4月份分别突破10亿(6.9%)和20亿次(12.6%)。

WIki1 520x143 Driven by developing countries, Wikipedia passes 3bn monthly mobile page views, aims for 4bn by June

有趣的是,随着维基百科移动页面浏览量的增长,英语版和非英语版的差距在不断缩小,1月份达到了52:48。部分原因是维基百科的“Wikipedia Zero”计划,让部分贫穷国家用户免费访问。去年10月份,全球逾2.3亿人免费访问了移动版维基百科,目前这一数字为3.3亿。

维基百科基金会移动合作业务部门高级经理阿米特·卡普尔(Amit Kapoor)今天发表博文称,目标是“本财年底”——今年6月,移动页面浏览量达到40亿次。分析师指出,如果考虑到过去12个月移动页面浏览量的增长情况,这并非是一个不切实际的目标。

卡普尔说,“2012年移动页面浏览量增幅超过75%,桌面页面浏览量增幅不足20%,这清楚地表明维基百科的增长主要来自移动业务。推动维基百科移动页面浏览量大幅增长的因素有两个,其一,拥有移动互联网连接的用户可以随时随地地访问维基百科;其二,许多发展中国家用户没有宽带连接,只能使用移动设备访问维基百科。”

卡普尔表示,“过去15个月,维基百科月移动页面浏览量由10亿次增长至30亿次,而总页面浏览量仅增长了33%,这表明许多老用户都通过移动设备访问维基百科。2年前维基百科移动页面浏览量达到5亿次时,英语版占到流量的71%,目前这一比例已经降低至52%,这表明通过移动设备访问维基百科已经成为一种全球性现象。”

]]>
维基百科:2012年最受欢迎日语维基条目:AV女优列表 //www.otias-ub.com/archives/87697.html Sat, 29 Dec 2012 15:53:48 +0000 //www.otias-ub.com/?p=87697 维基百科日前公布了维基百科不同的语言版本中最受欢迎的条目,英语版维基百科中阅读最多的条目是Facebook日语版是AV女优一览,荷兰语版是华山(是的,就是中国华山),中文版是百度。下面我们为大家提供英语版、日语版的维基百科阅读最多的条目Top10:

最受欢迎的日语维基条目:AV女优列表
英文版维基百科最受欢迎条目

最受欢迎的日语维基条目:AV女优列表
日文版维基百科最受欢迎条目

 全部榜单:http://toolserver.org/~johang/2012.html

]]>
compete:维基百科流量分析 //www.otias-ub.com/archives/66246.html //www.otias-ub.com/archives/66246.html#comments Fri, 31 Aug 2012 01:15:41 +0000 //www.otias-ub.com/?p=66246 对很多人而言,维基百科仍然是一个非常重要的知识查阅网站,compete对此进行了研究分析发现如下:

1、维基百科的用户年龄多为中年男性,收入相对较低

Demographics of Wikipedia.org

维基百科40%的流量来自35-54岁的用户,男性相对较多,而且看起来收入较低的群众使用该站要多于收入高的群体,但这可能反映了互联网人口结构的特点。

2、过去两年,维基百科不断吸引新的用户,但最近的独立访客有一些跳水。从总PV走势来看,PV在下降,但PV/UV仍然保持在4页左右,表现OK.

Unique Visitors vs. Page Views - Wikipedia.org

Pages per Visit for Reference Sites

 

3、下面是维基百科的搜索流量来源

Daily Search Referrals to Wikipedia.org

]]>
//www.otias-ub.com/archives/66246.html/feed 1
BusinessInsider:社交问答网站Quora会取代维基百科吗? //www.otias-ub.com/archives/66027.html //www.otias-ub.com/archives/66027.html#comments Wed, 29 Aug 2012 15:43:09 +0000 //www.otias-ub.com/?p=66027

社交问答网站Quora是硅谷的最受人关注的创业公司之一。有一种观点认为,这个高度灵活、功能强大的问答网站将在不久的将来完全取代维基百科。

实际上,除了一个庞大的信息数据库,Quora还可以向用户提供更新、更相关的内容,将来吸引更多用户访问也是水到渠成的事情。同时,4亿美元的估值也体现了华尔街对它的认可程度。

那么,Quora究竟凭什么取代维基百科?

首先,Quora能向用户提供更新、更相关的内容,这让科技界人士羡慕不已。这也没什么好奇怪的,毕竟Quora的创始人曾经供职于Facebook。无论何时访问Quora,用户几乎都能看到与他们的问题相关,或是感兴趣的内容。

其次,Quora拥有一个庞大的信息数据库,从科技公司到监狱生活,话题几乎无所不包,这与维基百科非常相似。虽然维基百科在这方面做得也不错,但是它缺乏一个挖掘新内容的有效机制。维基百科之所以在创立早期表现突出,是因为它上面的每一篇文章都会有许多链接,可以让用户读到更多相关内容,从而让他们流连忘返。

第三,就内容品质而言,维基百科难以赶上Quora的发展速度。根据维基百科发布的报告,该网站的编辑人数2007年达到最高峰,此后增长就陷入停滞,去年甚至开始下降。

如图所示,根据comScore公布的数据,维基百科的访问量增长已经开始停滞,而Quora却增长迅猛
如图所示,根据comScore公布的数据,维基百科的访问量增长已经开始停滞,而Quora却增长迅猛

Quora的运行机制是:当你关注一些话题时,Quora的引擎会自动抓取与你的问题相关的答案。而答案的排名可以根据用户投票上下浮动,最受欢迎的答案最为显眼。

尽管如此,Quora的算法仍然让人有点摸不着头脑——有时你会发现答案所获得的投票只有1到5张,但它仍然与你的问题相关。因此,Quora的内容搜索引擎是其最大的财富。

值得注意的是,虽然Quora的流量与维基百科相比仍然相形见绌,但是它后劲十足,增长稳定,未来不可限量;而维基百科的增长已陷入停滞,被Quora取代并非不可能的事情。

本文编译自BusinessInsider

]]>
//www.otias-ub.com/archives/66027.html/feed 1
信息视图:大英百科历史回顾 //www.otias-ub.com/archives/28291.html //www.otias-ub.com/archives/28291.html#respond Tue, 08 May 2012 14:45:49 +0000 //www.otias-ub.com/?p=28291 大英百科宣布停止发行印刷版,从1768年在苏格兰出版了第一卷到今年,大英百科全书已走过了244年。对美国家庭来说,拥有一套大英百科全书是件相当自豪的事。3月14日,大英百科全书公司宣布将停止发行印刷版,而往后,人们只能在线阅读这个大部头了。

存活244年之久的大英百科全书宣布停止发行印刷版,我们分析认为启发有几点:1、传统百科出版无法满足数字时代的人们知识需求;2、数字百科知识海量全面;3、数字百科查找索引方便,阅读便捷;4、知识准确,众包模式自纠错机制必然超越一屋子闭门造车的学者

]]>
//www.otias-ub.com/archives/28291.html/feed 0
分享:科技如何改变生活?-数据信息图 //www.otias-ub.com/archives/19912.html //www.otias-ub.com/archives/19912.html#comments Tue, 13 Dec 2011 03:46:11 +0000 //www.otias-ub.com/?p=19912

转自:36Kr

]]>
//www.otias-ub.com/archives/19912.html/feed 2
维基百科月访问量达4.2亿排名全球第五 //www.otias-ub.com/archives/17879.html Thu, 03 Nov 2011 16:46:59 +0000 //www.otias-ub.com/?p=17879 2011年11月3日维基百科联合创始人吉米·威尔士(Jimmy Wales)周三表示,维基百科的月用户访问量达到4.2亿。

维基百科已经在印度建立了美国以外的首个办事处,威尔士表示,他们希望借助在新德里建立的办事处加强在北印度的服务,印度现在拥有逾20种当地语言。为了吸引阿拉伯用户,维基百科正在考虑向中东、北非扩张。

为了保持在线百科全书免费、无广告的运营模式,目前负责维基百科运营的非盈利组织维基媒体基金会(Wikimedia Foundation)从2005年开始就募集资金。该基金会通过法语、日语、德语、希伯来语、阿拉伯语、世界语和俄语运营维基百科网站。今年1月他们曾计划在50天内筹资1600万美元,结果超出预期,使其年度总预算达到了2040万美元。

威尔士说:“我们的愿景是希望用户拥有自己的母语百科全书,而不是第二语言。我们对下一轮筹资感到十分乐观,现在也不存在财务危机。虽然确实需要钱,但我们正有条不紊的运作中。”

威尔士还表示,维基百科的网站流量仍在大幅度攀升,目前的月访问量达到4.2亿人,高于两年前的逾3.4亿人。“读者就是我们的大部分收入来源所在”,威尔士说。

根据互联网监测机构ComScore发布的数据,从访问量来看,维基百科现在是全球第五大网站,排在谷歌、微软、Facebook和雅虎之后。

]]>