初审编辑:
责任编辑:孙华飞
山东社科理论专家系列茶座第四场在省社科联七楼会议室举行
山东社科理论专家系列茶座第四场在省社科联七楼会议室举行
大众网3月7日济南讯 (记者 王雅淇)3月7日下午,以 “大数据战略与社会科学发展”为主题的山东社科理论专家系列茶座第四场在省社科联七楼会议室举行。超星集团副总经理、中国科技期刊编辑学会副理事长汪新红女士作题为“社会科学工作者如何享用大数据”的精彩报告。而山东省委党校管理学教研部副教授杜艮芝、山东社会科学院政策研究室副研究员孙晶则分别就社会科学如何实施大数据战略阐述了自己的观点。
汪新红认为,随着“互联网+”的提出,大数据的应用越来越广泛。中国计算机学会、中国通信学会先后成立大数据委员会,研究大数据中的科学与工程问题。在大数据环境下,科研资料数量的快速增加使得文献资料的数量大大超越了传统阅读方式所能承载的数量。随着科研方法中引入大数据分析,计算机生成数据对于人文社会科学有着重要的支撑作用,弥补了传统人文社会科学研究方式中资料不足、采样不全面等缺陷。汪新红还从打造新型知识服务空间、建设新型智库等方面,对山东社会科学数据中心建设提出了意见和建议。
在专家对话交流环节,杜艮芝、孙晶分别对社会科学如何实施大数据战略阐述了自己的观点。杜艮芝认为,大数据的重要特征是预测,为我们看待世界提供一种全新的方法,政府、企业甚至个人决策将日益基于数据和数据分析作出,而并非基于经验和直觉,大数据将使人类更加“少谋善断”。在社会科学领域,大数据带来的变革和挑战将是颠覆性的,显著特征就是人类社会的数字化生存,人们的社会生活、行为态度、互动关系都可以被数据记录并保存下来,这为社会科学研究和预知社会产生了革命性影响。
孙晶则认为,大数据不仅是一个数据集,更是一种“以数据为大”的方法论,是在密集计算基础上所获得的崭新的认识世界、理解世界、改造世界的能力。通过对大数据集合进行采集、存储和关联分析,可以从中发现新知识、创造新价值。大数据为社会科学研究带来发掘利用海量信息的方法和服务。这种服务模式,既应该是信息供应服务机构为社会科学工作者提供基础研究信息的方式,也应该是社会科学工作者服务社会、提供社会科学决策咨询服务的模式。
据悉,以“大数据战略与社会科学发展”为主题的山东社科理论专家系列茶座共有六场,后两场将分别于3月14日、3月21日举办。
专家对话:
杜艮芝:有一个科学家对世界进行过这样的划分:生存的世界划分为物质的世界、精神的世界。物质世界需要精神世界的指引。知识世界在一个既不存在于有分子和原子的物质世界,也不存在于精神世界。他进一步提出精神世界是演习物质和知识的桥梁和纽带。互联网会对这三个世界产生什么影响,互联网的本质是什么,简单说,一个是链接,一个是联网。互联网是链接这三个世界的桥梁和纽。过去知识世界主要是在书本里,有了互联网后,“内事”可以问百度,“外事”可以问谷歌,这也成了知识世界的一种表现形式。
互联网又是联系物质世界和精神世界的桥梁和纽带。比如大众点评网,就是对人们对美食的需求和精神需求结合在一起。互联网通过数据化实现连接和融合,原子转换为物,物联网就是通过DIS把物质的数据库和互联网联合起来进行传输。有人认为整个互联网发展经过了几个阶段:第一个是信息网通过人连接,第二个是信息网是在知识层次把互联网连接起来。精神世界是人的意识活动,我们上网、浏览网页包括在搜索引擎搜索关健词,其实是人的意识在互联网留下的数据,把这个数据记录下来形成数据集合就是大数据。
数据集合是指在获取包括存储管理、处理等方面远远超过现在数据库存在的能力。有一项研究,计算了从人类文明出现到2003年间留存下来的信息量总和,相当于我们现在两天的数据量。所以说,网络成为大众的浏览方式,数据库存呈爆炸式增长。一般认为大数据来源,一个是来源于传感器,比如手机;再一个来自于互联网,现在谷歌每天要处理的24个TB,最后一个来源于社交网络,比如腾讯每天有200G到300G新增数据。 阿里巴巴累计的数据已经超过了100多平方米,这些数据就是人们在网络上的痕迹,大数据的本质是预测。
爱因斯坦曾经说过一句话:上帝不会主宰。任何事物的发展都是有规律的,都不是偶然的,只是人们没有认识到而已。大数据就是通过海量的信息来发现知识、发现规律,探索数据背后隐藏的某种关系、趋势和模式。大数据的用处是解释社会现象,并预知社会发展的规律。谷歌利用人们在搜索引擎的关健词,比如感冒、咳嗽、发烧和头疼等关健词,通过建立数据模型,根据美国数据相关性可以预测某个地区流感的发生。在2007年,就曾预测过甲级H7N1流感的发生,这个事让官员感到非常吃惊,怎么做到的?实际上我们对于整体这种群体和个体来说,是没有规律的。但把大量的数据累计起来,就可以里面有隐藏的规律性的东西。
从中学时期,我们学到分子是不规律的物质,但是由分子所组成的物质是有规律性。这方面的案例非常多,比如婴儿用的尿布和大人喝的啤酒,通过大数据分析这两种东西放在一起搭配来卖,效果非常好。这是因为,一般家庭中都是母亲在家里照顾婴儿,让爸爸出去给孩子带尿布,而爸爸们出去顺便就把啤酒带回来了,这其实是一种数据模型。大数据时时刻刻在发生变化,但是规律不会变。当前信息技术发展非常快,信息量呈爆炸式的增长。在自然灾害,海啸、金融危机等方面的有用的信息能让政府采取及时的决策,以避免或使灾难发生滞后。大数据隐藏着巨大的科技、经济和社会效应,发达国家把开发利用大数据作为金融领域的抓手,特别是云计算发展。大数据和云计算发展非常快,因为不仅数据大,特别是云计算的发展为大数据的应用提供了可能。总体来说,大数据为我们判断世界提供了一个全新的方法,过去依靠经验将来依靠数据分析,不管个人行业或者政府也好,运用数据分析,可以说谋在数据、成事在人。
因为大数据会带来一些社会问题,现在最主要的就是大数据安全问题,对个人来说包括隐私等问题。这次两会有一个湖南的代表提出一个提案:大数据安全,安全包含个人、行业及国家层面,对此,汪总有何建议?
汪新红:大数据统计方面给我们带来便利的同时可能也出现一些问题,杜老师刚才说的个人层面、企业层面和国家层面,可能有些是不能泄露,更是不允许泄露的,所以在企业进行大数据分析的时候。我们在做这个事的问题从三个层面来考虑,第一个从国家法律层面,法律层面上你是哪些可以公布,哪些不可以公布。 第二个从国家的政治层面社会发展的层面,作为一个企业必须要有的一种使命感。第三个从尊重人权保护隐私来说,我愿意公开的可以公开,不愿意公开就不公开。
孙晶:今天我要谈两个方面的设想,第一我觉得这个大数据对我们社会科学研究带来新的科学认识,这个从我们学界来说,一般不论自然科学还是社会科学,都认识到实验科学理论科研和计算科学大数据现在可以称为第四种科学方式,大数据是一种以数据为大的方法论,是认识社会、了解世界、阐释世界、改造世界的一种能力。科学革命的实质从某种意义上来说,每一次科学范式又带来许许多多的科学,大科学开启了大数据的时代,大科学最典型的就是发现大数据。
这段时间以来,我也看到我们社会科学自然工作和自然科学工作中的一些不足。有的时候会得出比较空洞乏味,甚至不可理解并无法解释的的单调的图表和数据,或是缺失伦理的判断,继承、集成和创新。大数据改变了我们以往社会科学不能做的这种试验的方法。
大数据最主要的是理论科学的发展和集成方面,但这种归纳不仅是有一个数量的变化,归纳的基础和数量更多,而且还有一个突破。大数据不是完成确定性结论和因果关系,而是允许一个概率性的结论,而这个结论事实上也是非常有价值的,在没有提出大数据之前,而是广泛使用的。现在每个人的寿命也是无法具体的预测,包括疾病等在内。过去,通过保险、精算师已经精算出来了,把资金集合在一起最终就可以解决这个问题,实际上这个时候就已经运用了概率的计算,我们现在有一些软件大家去乘坐飞机的时候,从哪儿飞那儿,准点率怎么样这也是概率。另外,大家经常使用的电商平台里面的商铺,或者用户之间大家会关注的信用评价、信用指数、信用度这其实也是一个概率的计算。
最后,我们也关注了一个问题,自然科学家相对来说,比较更容易掌握大数据的方法,来介入社会科学的研究。我想这是一件好事情,但是也提醒我们社会科学工作者尽快地掌握科学的方法,关于数据的垄断有可能会形成一个数字鸿沟。我们知道大数据的来源是物联网、互联网的自媒体数据,大量的业务数据,应该说这几个数据我们都不太容易掌握,该如何突破瓶颈?不要让新的数字鸿沟出现,我想山东省社科联大数据的中心建设是一个非常好的设想和探索。
第二方面我想说说我的一点设想,汪新红作了一个非常好的设想。超星提供的内容既有数据、也有知识,社会科学工作者,社会科学家基于数据和信息在这个基础之上,应当进一步开拓和生产出新的知识和智慧,那么尽管在这个类别上有所不同,但是超星这样的知识服务平台还是有很多值得我们学习借鉴的地方。第一,在理念上,平台建设应考虑以共享促共建,集结大一批社会研究成果的使用者和即使不拿工资也愿意给我们工作的员工。就像很多互联网的大佬会讲:“天下武功为快不破”。怎么会快?一是坚定收购用钱换时间,二是唯有共享共建。第二,从整个研究交流的流程来讲,我们有可能在选题上改变过去以社会研究者从自身出发,设想社会需要什么样的问题研究。今后在选题时或许是这样的一种模式:从数据出发,从服务商出发,从自己社群来出发,真正变成一种以问题为导向,以用户为中心的研究选题模式,在科研过程中,大数据促进公平公正和良性的科研竞争优胜劣汰。我想确实像超星的这样的服务商一样,我们也应该说根据社会科学成果的需求者、爱好者、包括研究者的需求的偏好,过往的行为以及他们的定制来分享他们的智慧。当这个平台建成之后,我社会科学的研究者,因为创造出了新的知识和智慧,分享了新的知识和智慧,可以获得更加有尊严的生活。第三,大数据科研的选题,我们看到当今时代以信息技术为代表的新一轮的科技和产业变革。大数据的深刻影响,社会分工模式的创新,催生新业态,升级改造传统,促进优胜劣汰,降低生态成本,缓解资源环境和人口老龄化的压力,解放了劳动者,降低社会总的劳动时间,释放了巨大的创造力,当然也满足了更多的人们的需要。在供给侧这个问题上,我想大数据大有可为,可以说是把需求和供给很好地连接起来,精准地进行匹配和对接。
因此我觉得社会科学工作者,在大数据的广阔天地大有可谓。一在立法和标准制定方面,应该有法学家的参加,我们对于国家组织和个人采集、存储,乃至交易处理数据的这些标准以及集中参与者的权利和义务,有明确的法律规定。再就是更具体的说个人的隐私,以及数据怎么脱颖,这些都需要制定行业的标准国家的标准,对于大数据知识产权的保护,当下的我们法律当中有一席之地。第二我们山东省社科联在做的,大数据的科普和工作,大数据和社会各个学科之间一定会产生新的增长点和交叉学科和边缘学科那么它的理论研究和学科的构建也等待着社会科学家去努力。
现场交流:
孙晶:我问两个比较偏技术点的问题。一是我们如果打一个字让超星来搜索,是基于词汇的搜索,还是单语种,还是多语种的搜索。
汪新红:首先是基于词汇,也有基于语义,但是是浅层的,是多语种的,比如,当我们要搜国外的英语网站,甚至是西班牙语网站时,后面有一个叠加技术,有一个翻译技术,中英文内容相关的都出来了。
孙晶:超星数据库的基础数据的来源,在最初建设的时候,是来自出版社杂志社的吗?这个构成的比例大体是什么样子的?
汪新红:超星域搜集是基于全世界的互联网。采用的数据是基于读者和学者的所使用书籍的词表库,这个词表库关联着整个世界,这是第一部分;第二个来自一千多所大学的图书馆原数据的馆藏;第三来自于正规的出版社。
初审编辑:
责任编辑:孙华飞
因为幼儿园配套建设涉及城镇规划、城镇基础设施建设规划、城镇土地利用规划、城镇交通建设规划、城镇学校布局规划等诸多方面,还牵涉城镇土地使用性质、建设资金来源等一系列问题,幼儿园同步配建政策往往难以落实。[详细]
大活人眼睛里频频“抠”出石子,且已有6年之久,您说这事稀罕不?别不信,有图为证。[详细]
记者从济南市食药监局获悉:3月15日上午,济南市食品药品监督管理局将联合济南市委政法委在历下区佛山苑广场开展《食品安全法》与食药科普知识宣传进社区活动。[详细]
不计得失,面向全国315个人出借315万元,发起诚信挑战。“对于如期还款的借款人,除500元现金奖励之外,还有一个意外的惊喜,将在‘诚信挑战’活动后揭晓,充分体现全社会‘诚信无价’的社会价值观念。[详细]
临沂罗庄的李某为非法获取利益铤而走险,用手机与四川成都毒贩林某联系购买大量冰毒,通过快递公司邮寄到临沂进行贩卖谋取暴利。[详细]
山东省物价局局长陈充在发布会上说,山东省蔬菜目标价格保险试点文件于2014年11月底出台,去年相继在济宁金乡、枣庄滕州、泰安肥城、济南章丘等地,开展了大蒜、马铃薯、大白菜、大葱等目标价格保险试点,目前保险周期已经结束,理赔工作全部完成。据统计,山东省承...[详细]