[中图分类号]G23 [文献标识码]A
伴随数据的爆炸式增长,“云数据”一词遭到了愈加多的关注,不少范围已经开始应用云数据。云数据技术不只能应用于数字出版中,在传统的纸质出版中也有应用前景。本文拟以医学出版为例,探讨云数据年代下,医学出版选题策划的思路转变,与面临的问题与挑战。
1、云数据年代素描
“云数据”是大家给信息爆炸所产生的巨量数据起的一个简单的名字。一方面,这类数据蕴藏着巨大的潜在价值,大家迫切需要更一流的技术,对其进行实时处置;其次,技术的进步,包含云计算、分布式计算等办法的应用,很大地提高了信息处置能力,提供了广阔的研究空间,使云数据剖析成为可能。
不少人觉得“云数据”就是指数据量大,这是一个误区。云数据的本质是发现和理解了信息与信息之间的关系,是思维的变革,而这种变革主要表目前以下三方面。第一,云数据强调的不是随机样本,而是全体数据。为了达成“全体数据”,需要大家尽量多地搜集、保存与行业有关的各类数据和信息。第二,云数据年代,大家不再一味追求精准,而是承认混杂性。因此,大家需要对于非结构化数据给予更多的关注。也就是说,大家不只要关注图书销售量、读者群构成、直接反馈;也要关注鼠标点击、驻留在一本书的时间,后续购买、关联购买状况,购买地址等。这类看上去杂乱的信息,可能蕴藏着巨大的商业机会和价值。第三,云数据不再追求因果关系,而是关注事物之间的有关性。比如,沃尔玛通过数据剖析发现,在飓风到来的季节,不只手电筒的销售量增加了,某一种牌子的蛋挞的销售量也增加了,因此,沃尔玛在飓风季节到来时,将库存的蛋挞摆设在挨近手电的地方,以增加销售量。在医学出版中,大家也可以通过数据剖析,找出与读者的购买行为或阅读需要有关的要点。
2、云数据在医学出版选题策划中的应用前景
1. 教程出版
每个出版社都非常看重教程出版。无论是新编教程还是修订教程,调查都是启动撰写的基础。教程调查,需要先搜集开设本专业学校的名单,逐个寄出调查函。学校的名单主要源自有关掌握、教职委、行职委提供的资料,但需结合前一版教程或有关书本发货的省市分布数据,有的时候这两者有较大出入。比如,提供的名单中,河南没学校招生,但出版社前三年的发货资料中,河南每年的教程发货数非常大。另外调查函发出后,收购也存在肯定困难,一般只能做到部分收购。正由于学校的名单非常难搜集齐全,调查函也不可以全部收购,这种传统方法上的调查,虽然力求全方位,但仍是一种抽样调查,非常难涵盖整个行业的样本量和全部信息。
在云数据年代,所有都可以被数据化,云数据强调的不是抽样样本,而是全体数据,因此将数据剖析引入教程调查,可以对网络上有关专业的开设省份、招生学校、招生人数等信息进行剖析,得出更全方位的数据剖析报告。在教程修订、搜集反馈建议时,也可以通过搜集平台、网上购物机构的销售记录、读者评论等,剖析需要增加、删减及修改的内容。在遴选主编、副主编及编者时,编辑同样可以通过剖析网站上的会议状况、会议日程、发言频率和题目、各范围专家的专业专长,确定其学术影响,与在教程中合适担任的角色,并将这类信息形成剖析报告,供决策者参考。
2. 学术专著
在传统出版模式下,学术专著的选题方法是经验型,由策划编辑提出选题,报出版社选题会讨论。选题委员会由社领导、资深的老编审、生产及销售部门负责人等组成。选题会上讨论的依据主如果以往选题的销售状况及市场反馈,目前市场相同种类书的状况,与其他出版社类似图书的销售状况。这种选题论证方法所参考的数据,只不过整个出版市场数据的一部分。而借助云数据,大家可以获得整个医学图书市场的书目信息、销售状况,并进行剖析。通过数据剖析得出的报告,可以形象地理解成一批有无限经验的策划编辑、生产职员和销售讨论后得出的结论。理论上,这种论证模式更客观、更有说服力。
现有些医学有关互联网社区、数据库的资源已经十分丰富,通过对诸如丁香园医学平台、中国期刊网(CNKI)、PubMed等的搜索记录、浏览记录、用户留言,与对亚马逊、当当网的专业图书购买记录的剖析,可以筛选出每个专业范围的热门,并对有关用户的地点、年龄、职称等信息进行剖析,准确定位读者人群,并预测市场容量,为图书选题提供参考。
3. 应对出版
应对出版对于医学出版社来讲是一个非常重要的部分,在遇见较大的公共卫生事件或异常天气时,公众非常需要专业出版社出版的有关预防书本普及防范常识,医师也需要专业书本补充有关常识,专业出版社有义务为他们提供优质的出版物。比如人民卫生出版社在2003年“非典”暴发时紧急出版的SARS诊治、防范等方面的图书,与在2013年出版的《实面“霾”伏――“雾霾”中的生活与健康》。假如等到公共事件或异常天气已经暴发再组织撰写,出版时间容易滞后。
云数据剖析在应对出版方面将会有明显的优势。比如,Google公司通过对检索词条的剖析,提前几周时间预测甲型H1N1流感爆发。这个案例对于应对出版是一个非常不错的启示。编辑可以通过类似的数据预测方法,如在流感暴发前,即组织撰写流感预防及治疗有关的书本。再如,假如可以通过互联网的搜索关键词条,或者同诸如中央气象台等单位合作,共享数据库,提前预测会有紧急雾霾天气出现,就能提前组织专家撰写,为书本出版取得宝贵的时间。同时,可以通过搜索频率预测印刷册数,防止过多的库存。
3、医学编辑应付云数据年代的方案
1. 医学编辑应做好基础工作
一是立足自己,做好医学编辑出版的云数据基础工程建设。比如进一步达成互联网化、电子化和标准化,为达成云数据的应用打好基础。只有将出版物互联网化、电子化,才能使与出版有关的信息和数据成为可以搜集的资源;云数据技术可以剖析杂乱的数据,数据的规范化可以为数据剖析提供更多便利。
二是学习借鉴,打造基于云计算等先进信息技术的新型工作模式。比如民生银行开发的小微金融数字地图平台,通过这种地图将数据可视化,由此提供相应的信息剖析、推广实务等服务。出版社假如打造类似的平台,将销售数据可视化,就能为选题策划工作提供更多的服务。
三是寻求协作,引接信息产业界力量。比如一些新兴的提供数据剖析技术服务的公司,同它们积极合作拓展云数据剖析研究工作,推进研发基于云数据的智能选题策划系统。
2. 整理全行业数据
只有数字化的资源和数据剖析技术还不足以达成云数据。对有关的出版数据进行剖析,还需要一个尽量涵盖全行业信息的平台。比如沃尔玛企业的数据剖析平台涵盖本公司所有些数据,因此能对本企业的销售状况进行剖析;Google企业的搜索引擎几乎涵盖了全球的搜索信息,因此能对搜索记录进行云数据剖析。同样,要达成出版行业的云数据,需要整理全行业的资源,尽量将国内医学行业的所有专家资源、数字图书、销售途径等资源集中在一个平台上,如此才能达成前文所述的针对教程、学术专著与应对出版的云数据剖析。