文章详细页面

数据驱动新闻——大数据时代传媒核心竞争力
在线阅读 收藏

时间:2012年7月17日

地点:上海交通大学闵行校区陈瑞球楼

主讲人:祝建华

主持人:我们今天请到的嘉宾是香港城市大学的祝建华教授。祝建华教授在网络研究方面非常有建树,常常走在研究前沿,今天他将和我们一起探讨大数据时代传媒核心竞争力——数据驱动新闻,这是一个新兴的话题,也是祝教授研究的最新成果,我相信在座各位对此非常感兴趣。让我们以热烈的掌声欢迎祝建华教授。

祝建华:我们先对刚刚结束的首届全球新闻大奖——DDJ新闻大奖中的一些得奖作品做一个非常简单的浏览,加强我们对这个发展的理解。任何一个新的潮流,都不会是天上掉下来的,它不仅有当代的技术、社会、文化的背景,还有自己的历史,这个历史,不是500年,也不是50年,但也有二三十年。我们讲人类的知识是积累起来的,现在很多对传媒研究用的工具、方法,也是在对互联网以前的实务、经验和理论进行研究的基础上建立的,所以我会先讲一下它的来龙去脉,以帮助大家理解。虽然DDJ是个非常新的概念,但实际上,它也是站在前人的、巨人的肩膀上建立起来的。也许在英国有少数学校已经开设了DDJ的课,但据我所知,中国在这一方面最领先的是汕头大学长江新闻学院。今天主要是讲什么是DDJ,讲讲为什么要用DDJ。21世纪的第二个十年半中,新生事物层出不穷,新概念每天都在涌现出来,昨天的新概念也不断地成为过眼烟云。那么DDJ是否也是一个类似这种炒作的概念呢?我觉得我们每个人都应该对这个新概念做一个了解。

今天的社会需不需要,或者说我们的传媒实务有没有需要DDJ?我想从大家现在所处的Web2.0这种媒体生态来讲。从古登堡的印刷术算起,大众传播媒介有三四百年的历史。从那个时候到Web2.0或者社会媒体兴起之间,虽然技术在不断地进步,内容在不断地更新,规模在急剧地扩大,但是它所运用的、所遵循的商业模式和工作流程一直没变。那它所基于的是什么呢?它基于的是经典经济学的核心原则,亚当·史密斯的“劳动分工原理”,社会发展到近代,各种工作开始有专业人士专门从事。大众传播的发展就是这样,这个模式是韦斯特利·麦克莱恩在1957年提出的。我曾经翻译过一本书叫《大众传播模式论》,里面就有这个模式。怎么来看呢?第一个是在远古时代,第一就是以前讲受众,X代表世界上正在发生的客观事实,远古时代大家都是直接接受来自于自然和社会环境的信息,那是年代很早时候的,我们不讲。随着世界的演化,就产生了一种新的人叫做A。A是什么?就是所谓的消息灵通者——意见领袖。他从一个村旅行到另外一个村,然后带回一些新的信息,这样就构成了新的人际交往。到了近代,也就是400年前左右,开始出现了邸报,不过这都不成规模、不成系统,人类的现代化大众传播媒介从印刷术的发展开始形成。从现代报纸开始,又出现了第二种新兴的职业,媒体从新闻、从现实生活中搜集到正在发生的事件,然后报告给受众。其实A也没有退出历史舞台,在媒体的兴起之下A就变得更加专业化,即现在讲的专业公关人员。当然,越来越多的信息来源于爆料,从国外到国内,很多媒体都大量地采纳群众提供的爆料并给予奖励,这就形成了叫ABC模型。大家仔细想一下就可以发现,ABC模型实际上就是劳动分工,我们每个人都无法接触社会或者自然发生的所有事件,或者说绝大部分事情我们都没有办法获得第一手消息,我们依赖于一批专业的记者编辑利用最现代化的传播工具来采集和发布这些信息给我们。媒体也得依赖一批专业或者业余的消息来源。400年来,这个模型运营得非常好,有效率,有专业人士,有一定或者相关高的专业技术,还有伦理道德和专业精神等等。在Web2.0兴起以后,这一切虽然没有一下子全被打乱,但实际上已经受到了严重冲击,现在大家大概都在用这个东西,但是怎么把我们现在面临的新媒介生态放到我们已经知道的劳动分工这个框架里去思考呢?我觉得我们多了一些A,也多了一些C。A是什么?可以分两类,一类是草根,人人都是媒体,人人都是记者,人人都是编辑,人人都是制作人,人人可以通过自己的博客、SNS、Microblog等方式,来制作和发布新闻;另一类是政府机构、商业机构甚至社会组织,也纷纷利用社会媒体,搜集制作和发布信息。所以,原来的A1演化出来了现在的A2和A3,A1也还在。在中国的有些政府部门、机构自己是不开博客的,这个问题可以供大家来思考一下,为什么有的政府部门发生事情就一定是召开记者招待会,依赖于传统的媒体C1来发布新闻?但有一些机构可能是比较具有超前意识,两三年前已经开始利用社会媒体直接发布新闻,他们就变成了A2。光有A2和A3其实还不足以撼动我们已有的传统媒体,即C1。为什么?因为网上有数以万计的草根媒体,也许有几十万甚至上百万机构的网站在发布消息。我们的B,即用户,没有办法直接去找到最有价值或者是最可信的信息来源。这个时候,就有一种专业的工作,就是我们熟悉的搜索引擎,这个搜索引擎不仅是指像Google、百度这样综合性、全面性的,还指很多专业的搜索引擎,比如博客搜索,还有现在很热的微博搜索等。这个流程其实大家每天都在参与,我把这个流程用已经很熟悉的劳动分工模式来做比较,我希望这能比较理性地帮助我们认识现在媒体的危机在什么地方。有了A2,最主要是有了A3,但是如果没有C2,A3只能在那边自娱自乐,不会有影响力,很难持续的。当然光有C2没有A3,C2也不过仅是政府或者机构或者媒体的传声筒而已。最近我们在做的研究其实主要是想看,站在B的角度讲,现在的信息来源有直接从现场观察得来的,有从传统媒体来的,也有从官媒或者官网,或者从A1来的,也有直接从草根来的,甚至也有从搜索引擎来的,我们以后再做这方面研究。在得出一个完整结论前,英国最近发布的一个研究报告,说英国用户的信息来源,20%来自于新闻、社会媒体,30%的是来自搜索引擎,传统媒体是剩下的一半还不到一点。这种格局在欧美其他地区大同小异,在中国我们正在研究,我们有各种零零碎碎的研究,但是没有把所有的渠道作为竞争渠道去研究,所以得到的结论多多少少是有误差的。也许大家还会看到这样的报告,如在中国80%的人都去看电视,大家仍然把电视作为新闻的主要来源,这个时候它不是有竞争性的,每次问大家看不看新闻,大家说看,问来自媒体、来自电视还是来自报纸,最后的结论是电视第一,但实际上,电视机的开户率还是挺低的。这是比较枯燥的一个理论框架,但是我想讲这个问题的出发点,没有这样一个大背景,任何新概念很难判断它到底是不是代表着明天。

这是一个非常具有前瞻性的方向,怎么判断?主流媒体正在或者已经边缘化,这是一个共识,特别是在你们这些未来领袖们当中,因为你们基本上不看电视,而且很少看报纸,所以完全能认同。当然,这个大讲堂里面会有一些来自于传统媒体或者主流媒体的老总们,对于“已经被边缘化”他们可能不认同,但是他们承认正受到“被边缘化”的挑战。中国正处于一个急剧发展变化的社会,每天都有非常离奇、非常重要或者非常富有争议性的事件发生,绝大多数事件在主流媒体上没有报道,这难道不是变化吗?那怎样来避免这种边缘化?我相信老总们现在也在苦苦冥思。

大部分的第一线记者,都觉得最大的核心竞争就是要贴近新闻现场,但实际上这一条路在全球都一样,不过在中国走得特别艰难,因为在走向新闻现场的路途中太多的禁区无法进去,所以这一条基本不通。另外一个传统的强项,媒体不能跟草根制作者竞争,比如新闻的跨度、多样性、原始状态,但是媒体具有一大批专业的新闻记者,劳动分工具有依据事实背景提供的专业的、精辟的分析意见,但光靠这个其实还不够。从西方媒体来讲,我们今天大部分讲的是报业,报业受到的冲击比电视更大。以美国为例,从2004年、2005年开始,报业就进入了萧条期,到2008年、2009年,在金融危机的打击下,报业基本上遭遇了灭顶性的灾难。在这种大的背景下面他们在寻找出路,怎么拯救报纸?汕头大学传媒长江新闻学院的院长范东升教授出过一本书叫做《拯救报纸》就记录了整个这个过程。怎么拯救呢?当时的方向还是多元的,报道民生、贴近现实、提供专业见解,但是已经开始有了新的想法,就是用技术手段做数据驱动新闻。随着一年多来的实践,这条路其实虽然没有被完全证明成功,但实际上在逐渐地展现它的生命力。怎么来看?比如说现在一些比较领先的媒体,报纸、电视新闻中经常出现一些专业制作的DDJ,这些新闻到底给你带来了多少新的用户,这是个非常重要非常核心的问题,这些问题其实是难以测量和检验的。《纽约时报》是一个做DDJ的比较领先的机构。大家知道,《纽约时报》不出印刷版,专做网络版,而且还是收费的,它建立了“收费墙”。它有普通用户和付费用户,付费用户可以直接看到DDJ的新闻。当然所有的新闻大部分还不是DDJ的,那么凭什么知道新增加的用户是来自于看DDJ而不是看普通新闻?据我所知,两年前有一个技术可以记录用户来了以后看哪个网页,会从什么网页跳到另一个什么网页,据说这种技术手段可以分清哪些用户是专门冲DDJ来的。利用这种技术进行6个月的研究后发现,用户在不断增加,点击率在6月当中翻了好几倍,总的算起来,1/3的点击率看了DDJ的内容。这是比较早期的一个研究发现,在传媒当中也是被广泛被引用的。我相信随着DDJ产品的不断开发改进,读者对这种形态的使用和喜欢程度会增加。现在一个现象是首先付费的不是年轻人,而是年老的,中老年人对DDJ这种动态的、炫丽的表现形式,多多少少还不太满意,但是随着年轻人不断加入这种付费用户,DDJ的成果会更高。我就想用这么一个案例来说明,DDJ不光是一个学者或者少数技术人员在炒作的概念,它实际上已经在西方媒体当中日益被广泛使用,并且已经展现出一定的实际效果,当然更多的效果有待于接下来的验证。

接下来进入到主题,什么是DDJ?它是用来分析和过滤海量数据的工具,目的是来制作新的新闻。新的新闻的意思是在传统的文字、照片、视频的基础上,产生的一种新的内容。它里面有几个关键词:一个是Analyze,一个是过滤,还有一个是Open data。早年做新闻采访当中的一个流派,叫Investigative Recording,即调查新闻,就是去挖掘政府内部的东西甚至是乔装改扮。DDJ不做这种Undercovered的事情,它都是公开数据,工具尽量用免费软件,所以这相对来讲是一种低成本的路线,不是高端派的。现在另外一个技术的发展趋势,就是视频上面的3D,3D是富人玩的游戏,DDJ是富人和贫民都可以玩的。这种用公开的软件挖掘公开的数据最后希望得到什么,我强调一个词叫Patterns,把一些隐藏的规律、趋势与背后的事件的关系挖掘出来呈献给读者。有人用这么一个流程图来表述整个过程,从数据开始,然后是过滤,之所以要过滤是因为网上的数据是海量的,内容上是良莠不分、真假难辨,或者各自互相之间看上去杂乱无章、毫无关联。DDJ和3D已经成为新媒体技术上并行的两个新的发展。3D是新闻不是3D动画,我前天看到上海有一个3D频道,因为电视机是2D的,所以我看到两个屏幕,左边一个、右边一个,同样的一个人在左边右边出现,我估计是3D频道。我刚才讲3D是富人俱乐部的游戏,贫民型或者普及型的就是DDJ。DDJ主要是少量文字配上大量的图片,不是照片而是人工做的图片或者是动画,在这个基础上形成我们最后的产品。

也有人用传统的倒金字塔来说这个模式,当然倒金字塔的内容不一样。以前讲倒金字塔是要将最重要的放在前面,次重要的放在其后,最不重要的放在最后。现在的做法是Compile,首先是把公开的、现成的数据收集、整合起来,这个工作不是太累甚至现在很多可以自动做。然后Clean,把当中的很多噪音给去掉,这个工作需要你对新闻事件的判断、对社会现状的了解以及对更多技术手段的掌握。接着Context,是给这些数据提供其历史社会背景。作为老师,我看了很多历史的发展过程,其实现在这些东西都是以前演变传承下来的,Combine把现代发生的历史背景和相关事件整合起来;最后来Communicate,Communicate是通过共同参与社会媒体的互动的方法;Humanise,要给予人情的,以前的新闻价值的要素中很重要的就是人情味;Personalise,讲故事一定是从个体讲到整体,具体来说从某个人、某个家庭、某个作坊开始讲起;Utilise指的是观众甚至受众这种概念,能够采用新产品里边的内容。学术上现在有三派。第一类是Data first,Story second,数据为王;第一类是Data with news,数据和新闻同等重要;第三类是Data for news,数据仅仅是故事当中的调味品、点缀品。现在讲的新流派,其实就是第一种——新闻主要由数据来激发,由数据来带动,讲的就是数据。Digital Curations,你在一个经典的艺术博物馆或者历史博物馆里,可以借那个数码耳机听。那里面叫做Digital Curations。Digital Mining,技术对数据的理解。Digital Narrative是讲故事的。News Visualization这个词也许大家见的越来越多,人发的微博也是Visualization或者是Visualize news,这些东西其实都是从DDJ上面学来的。Infographics是一个非常专业的词,但是现在做的DDJ里面有1/3到一半的工作做的就是Infographic的事情。Analytic Reporting或者Analytic Journalism里面讲的Analytic不是我们传统上讲的理性分析,讲的是定量分析。Investigativee Reporting、Investigativee Journalism、Explanatory Reporting这些概念已经有好多年的历史了。Structured Journalism和Data Journalism互为表里的一个概念。什么是Structural Journalism?网上来的数据都是杂乱无章的,要把它整合在一个故事里面。Web Analytics是干什么的?监测DDJ新闻吸引多少人,就是从网站流量上计算出来的,实际上如果把新闻看成是一个产品的制作,所有产品有研发、生产、销售、评估的阶段,评估就是用Web Analytics来检验的,所以,对一个生产产品的普通企业来讲,它是最后检验你的产品是否成功的非常重要一个关口。

我选了几个公认的最前卫的媒体来帮助大家进一步地理解DDJ,如英国的The Guardian,美国的New York Times,其实电视做的也非常多,电视有它们的强项,像英国的BBC、CBS和其他的几个大电视网都做得也都不错。学术界、商业研究、民间研究机构对DDJ也是非常重视的,美国有个Poynter Institute,它是一个媒体设立的媒体研究院,几年前就开设了DDJ的培训课程。斯坦福大学有一个专门的项目叫Data Journalism。The Guardian有几条经验是他们自己总结的。有两条基本原则:第一条是所用的数据都是来自公开渠道,这当中包括自己收集数据,如网上调查,也包括整合别人的数据,如分析搜索引擎工具所抓取的数据;第二条是所用工具大部分都是免费的。我们每个人电脑上都装有Excel,我们平时用到的Excel大概是它所提供的所有功能的5%甚至只有3%。打开记录中一个数据,Excel可以用来做很多分析和可视化的东西。当然Excel做新闻分析过滤也不是非常专业的,所以他们还会用到像IBM开发的Manyeyes。Timeteic是另外一个商业公司开发的,它其中也有一部分可以专门对新闻事件做分析,是免费的。它对上面搜集的新闻数据作专业角度分析,如果没有这一点的话,所有的工作不就是计算机专业或者是图片设计的人都能做的么?讲的故事最后还是新闻故事,发布新闻的主要平台是他们的博客,叫Data Blog。Data Blog的影响非常大,中国很多学做DDJ的人都把自己的Blog叫做Data Blog。

The Guardian有一个产品是得了奖的,其中有一个报道,做的是去年英国伦敦的骚乱,全世界媒体都在报导,它在整个媒体报道当中是以数据和可视化为依托的。大家可以想象,在一个城市里面,你用文字报道,哪怕你用摄像机报道,与你用地图在街区跟街区之间发生的暴乱背后的关联展现手段所得到的看法是不同的。伦敦的骚乱有各种角度的报道,The Guardian是以地图和GRS这种数据的整合展现这个故事。它建了一个非常详尽的库,叫做世界政府数据,当然它说的世界还是局限在澳洲、美国、丹麦、新西兰、英国等政府的数据,它不是一个连接而是将这些数据整合起来,国家与国家之间是具有可比性的,在根据这个数据再不断做分析。比如说现在欧洲地区的危机,大家非常关心这几个国家所谓的“猪”,它们的问题是什么?它们的问题是政府的债已经远远超过了GDP的好几倍,像这种东西本来就是金融专家和经济学家们研究的,记者只能根据这些专家们说什么就是什么,它把所有这些信息整合起来,研究一个国家的债达到GDP的多少会出现什么状况。美国的国债比例没西班牙这么高,但日本更高,从没有人担心日本的经济会崩溃,记者根据这些数据分析写报道,读者直接到数据库去看。这完全是一种互动的工作,是一种开放式的新闻。那什么是开放式的新闻?记者的素材来源是公开的,而不是被记者有意的选择了之后再讲一个故事,好像这个故事是唯一的真理。The Guardian在报道奥运会时候,建立奥运数据库,大家可以比较它的报道和其他报道的异同。

关于《纽约时报》,我放一个它们自己介绍的项目Cascade。Cascade是英文里面的一个什么词呢?它是同时在不同的空间里展现的。大家如果用Excel,可以同时开好几页的View,如果在Windows下面点一下,它可以有几个展现每一页的方法,一种方法是Cascade,如果你点Cascade的话,它每一页都叠起来的同时也可以一眼看到展开叠式。Cascade已经泛化了,它的数据是来自于像Twitter这种社会媒体,社会媒体上经常有突发事件,有了突发事件后它就会追踪突发事件产生的这个过程。另外,在微博上也有这种小工具,大家看这条新闻谁是原发谁是转发,谁是演变过来的,这个是平面的。但Cascade就是通过立体的视频的方法把地理位置放进去,所以是一个很炫的东西。这产品跟我刚才讲的DDJ主要都是放在防火墙内做的,现在付钱的大多还是中老年,但对于他们,这么炫的东西可能要看两三遍才知道在看什么,对年轻人来讲虽是喜欢,但是现在年轻人很少愿意钻到付费墙里面去,看出它们从内容到推广到使用还是有很多工作要做。这说明什么呢?这不是一个3D动画,它展现的东西并不美,非常复杂,但它提供的是一个互动的内容。如果你对故事本身内容的任何一个环节有怀疑或者有兴趣,你都可以点击进去找到这个源头,从这个源头配上它的地理位置、空间、时间标注,就能知道这个故事的发展过程是什么一个状况。以温州动车事故为例,如果让它来处理这个事情,首先它会按时间轴,再把地理位置放进去,然后再把发布的关于铁道部、现场目击者的、家属等所有信息放进来,你可以在任何一个地方停下来深入挖,这样的表现方法,传统的文字实现不了,电视做不了,因为电视很难做成这么一个空间时空大转移的工作,它最多是派两三个记者到现场切换一下画面而已。只有通过Visualization这个方法,才能让一个复杂的时间空间上面涉及面非常广,时间方面可以把以前很多事故都连进来,可以把日本等高铁发达国家怎么处理的手段引进温州动车事故的报道中,可以想象这应该是一个非常丰富、非常深入的东西。这就是所谓DDJ,跟已有的东西非常不一样,非常具有前瞻性。

DJA2012在2012年5月份发的第一次评奖,大概有400多部作品参赛,最后选了6个,我用表格方式展现,这本身也是我想学习或者实施DDJ的意义。原始的报道是6个包,所有信息都来自于它,但是我把这个名单按照1、2、3、4、5、6排列出来,你不一定看得出是背后的Pattern,所以我把它做成一个表给大家看这6个奖是怎么分的。它分成三类,一类叫Data-Driven Investigations,这些深入调查报告是纯数据挖掘得来的线索,按照数据分析的指示再从事工作;第二类叫Data Visualizations and Storytelling,它能得奖是因为它的表现手段;第三类是它的一些Data-Driven Applications,就是把各种原理用来解决一个个个案。这三类奖根据新闻的地理范畴分成是全国或者全球的大新闻和本地的小新闻,就变成了一个2*3的矩阵,我希望这种方式比List好。虽然这看起来是雕虫小技,没什么新奇,但实际上反映出来的是对Visualization、对Storytelling的设计思想。

DDJ这种新的形势也不是一天诞生的,不是天上掉下来的,也许现在在从事DDJ的有专业人士、有数据分析师、有网站管理者等。谈到DDJ的“前世今生”,可以从80年代的Precision Journalism开始,到90年代的Computer-Assisted Reporting,进入2000年前后有一段时间叫Database Journalism,现在叫Data Journalism,我觉得这个词也许很快又会被哪个名词替代。他们讲的挖数据,还是在几万、几十万这样的规模里面,现在讲的大数据,是在几十亿、几百亿甚至几千亿的数据基础上,而且应该很快会收到大数据新闻的。我还从来没看到谁在讲这个东西,按照我对大数据挖掘的理解,这很快就会把DDJ工作者们吸引进来。Philip Meyer是美国一个教授,他早年写过一本书叫做Precision Journalism,中文改写的叫做《精确新闻学》。它首先讲传统的社会学调查方法,包括抽样原理,如何问卷设计,之后再讲记者怎样报道这些调查结果,抽样误差是怎么回事,怎样写在新闻采纳这些科学研究尤其是社会调查的结果。早年在美国教书的时候,我们没有专门的Precision Journalism课程,但我们有关于社会科学研究方法的课程,在讲这个课程时,因为都是本科生,大家对研究方法并不很感兴趣。为了加强大家对这种工具的应用,我们专门利用一两个星期来讲述Precision Journalism。到了90年代以后,讲Precision Journalism时会越来越多地用到软件的操作,除了分析以外还有写作。很早以前就有用电脑来修改新闻报道,检查新闻,写得越短越好,结构越简单越好,这就需要一些检查可读性的工具。早年的Microsoft Word就有检查文章可读性的功能,所谓的可读性就是易读性,这个功能到了后期不知道从Word哪一版开始就消失掉了。美国、欧洲都有专门的研究机构到现在还在训练这些东西。Database Journalism是在21世纪网络数据越来越多的情况下出现的,很多媒体到现在还在做。当然,从Database Journalism到Data Journalism只是一个概念上的跳跃,实际大家所做的工作很多还是一样的。所以,Data Journalism就是在Database Journalism基础上放到Social Media这个大的背景下而言的。

如果大家和我一样相信它是有巨大的生命力和前瞻性的话,那现在开始学做这个东西也并不晚。内地的报纸我看的不多,不过我看到《南方都市报》等报纸在做这方面的尝试。总的来说,大家更多的精力还是放在可视化,这些故事的内容其实有点为了追求形式而形式。怎么做?它涉及各方面的知识,具体涉及三方面:科学、技术、艺术。讲到这我突然想起1979年的那一版《传播学原理》教材书,里面有句最经典的话:“Communication is science,technology and arts”这句话什么是什么意思呢?其实在这里面就已经展现出来了,什么叫Science?是定量研究方法,没有定量研究方法你就没法透过数据看到背后的故事。数据挖掘是技术问题,利用计算机辅助的工具去抓回各种各样的数据,然后进行清理、整合、艺术化处理,那就是可视化。每个做DDJ的团队构成大体应该分成研究组、设计组和发布组,但组织关系也许不是像这样分。在研究方面,要能抓数据,能把数据挖掘出来做经典统计分析。统计分析是我们社会科学的,而数据挖掘、数据搜索都需要掌握相当的计算机能力,文字编辑和可视化是制作功能、设计功能。我的观点是你只会其中任何一项可能也都没法融入到这个团队。因为你和其他人是无法沟通的,大家不可能整合到一起做出一个故事来,再说大部分媒体的规模都不可能大到每一方面都有一个人负责,所以一个人一定要能同时做几项工作。网站发布不是贴一个东西,而是管理,包括流量的分析也要会做,移动应用做成能够用移动终端下载的东西。

嘉宾:祝老师您好!我想问老师一个问题,现在我们可以看到很多电视台都在做一些数据方面的探索,大多是来自微博,他们会在微博上做问卷调查或者在自己的网站做一些问卷。我不知道从老师这么专业的角度来讲这个的可信性有多少?因为网民的意见不是覆盖总体的。

祝建华:这是经济新闻学很早在讲的一个东西,你报告是一个调查,你关心的是这个调查的代表性。如果仅仅是网民,你要告诉读者这是网民的意见。在中国,网民大概只代表了30%多的人,还有60%多的人,他们的想法可能跟调查的内容不一样,这个你要提醒你的读者。

嘉宾:祝老师您好!我的问题是关于搜索引擎的。刚才您提到英国调查显示,现在30%的信息来自搜索引擎,现在我们也越来越依赖搜索引擎,比如做DDJ的话我们的数字搜索很依赖搜索引擎,但是现在有的国家的搜索引擎是被商业所操纵。因此我们得到的数据来源会不会有些被遮蔽?谢谢。

祝建华:这个问题也很好,也一直是在被辩论的,我只谈谈我的看法。我曾经在一家大型搜索引擎实习过半年,为什么我会选择去一个搜索引擎网站实习?因为我认为搜索引擎是整个互联网的核心。以前我对搜索引擎的了解也跟大家一样,只是作为一个用户的认知。我觉得我要花一定的时间去详细了解,这将会有助于我对互联网的了解,也有助于我自己的学术研究和教学研究。所以,我觉得我对搜索引擎的回答也许是比大家更专业的回答,从理念上讲我们用户获取的新闻主要就是通过搜索引擎,要不然你怎么找到新闻?在微博上,大家看似非常主动,但其实微博是一个被迫式的功能,从理念上来看这是一个倒退。你关注了人家后,一直等人家来关注。当然我知道你们有些人也会在微博上搜一下。昨天我在宾馆里看BBC报道朝鲜发生了重大人事变动。于是我就很好奇,在微博上搜索发现没有相关消息,今天早上就看到有人在转了,所以搜索是非常重要的。接下来,你很关心的一个问题是:搜索会被少数商业机构垄断,这种担心肯定是存在的,但是根据我的了解,搜索公司是商业公司,因为是商业公司,最后是受市场制约的。这个世界上能够对新闻产生影响的是商业利益、政治利益、宗教利益,当然我们希望能再增加公民的影响,公民的影响到目前来讲实际上是次要的。这三大影响里面,相比之下商业影响是最受公民影响的制约,因为商业面向的对象用户。如果某一个搜索引擎太受商业影响的话,大家就觉得这不好玩不好使,大家就会去找另外的东西,那立刻会有人想办法取代你。所以你要相信市场的力量,虽然市场的力量不是无敌的,不是十全十美的,但相比政治利益、宗教利益要好,另外我希望商业利益受到公民的制约。

嘉宾:祝老师您好!刚才老师举到像《纽约时报》《卫报》这种国外的例子,我也关注了国内的一些网站,比如说对“两会”的报道也使用了微数据、微地图来追踪不同地区代表的提案。我想问一下,对于DDJ,在传统媒体如电视媒体和广播媒体上,如何利用它?它是否能成为这个传统媒体的救命稻草?

祝建华:你这个问题太大了,我看的不多,我相信这种形式国内比较敏感的和前卫的媒体都在普遍使用。我建议在座各位有兴趣的话可以做一个系统的搜集,把这些方法跟国外的方法做一些比较,看看哪些是我们的强项或独创,哪些是有待于改进的。我刚才讲过了,现在有一种片面追求可视化的行为,可视化是非常重要的,但为可视化而可视化是没有生命的。

帮助中心电脑版