找回密码

毛泽东思想旗帜网

毛泽东思想旗帜网 首页 焦点述评 查看内容

北大为何买不起“知网”?数据库涨价并不是根本原因

2016-4-19 08:42| 发布者: 草原| 查看: 949| 评论: 0|来自: 新京报书评周刊

摘要:   【摘要】数据库服务商获得大量数字版权许可后,在便利传播的同时,自己也成为一个新型垄断者。信息技术使每一次使用数字作品的边际成本趋近于零,但为了维持一个平稳的利润率,有必要将信息这种非稀缺资源通过人 ...

  【摘要】数据库服务商获得大量数字版权许可后,在便利传播的同时,自己也成为一个新型垄断者。信息技术使每一次使用数字作品的边际成本趋近于零,但为了维持一个平稳的利润率,有必要将信息这种非稀缺资源通过人为方式变得稀缺,以便定价和谈判。

  “不是每个老司机都看得起论文!”这是近来学术圈的一句流行语,源于一则“连北大都买不起知网了”的新闻。

  原来,最近学术圈炒得沸沸扬扬的一件大事是:中国知网订阅费逐年猛涨、北大等几所高校图书馆无奈暂停续订,正在和知网进行交涉。这一事件除了在学术圈掀起风波外,也震惊了公众--连最高学府都支付不起学术数据库了,当今的学术数据库到底有多么“傲慢”?

  实际上,高校与学术数据库此类纠纷不是第一次出现。商业化学术数据库逐年提价的行为由来已久,也广受诟病,国内一些大学图书馆甚至组成了价格谈判联盟,试图通过集体谈判的方式阻止学术数据库服务商的涨价行为,但结果不尽如人意。大众媒体隐含的倾向性意见是,商业数据库服务商的“垄断性”和“逐利性”是导致这一现象不断产生的主要原因。

  在批评商业学术数据库不断提价之外,我们更应当思考的是,这些数据库为何能够一而再、再而三地涨价,甚至成为垄断性的学术资源平台?不难看出,随着信息技术的发展,数据库平台开始成为影响学术研究和教育活动的重要主体,这种影响既体现在它背后的量化学术评价体系,也体现在通过大数据来绘制知识图谱的尝试。价格的纠纷不过是新利益相关者与传统教育和学术界碰撞的一个缩影,而此中更值得教育界和学术界关注的是:在信息时代,数据库究竟对学术研究和教育活动产生了多么重大的影响?而更重要的是,对此现象,我们能做哪些应对之策让学术资源更自由更开放?

在数据库面前大学丧失主导权,作者利益被窃取

  北大和知网的谈判结果仍未可知,我们不妨先看看大学图书馆和数据库的价格谈判中谁占优势。

  购买数据库是大学图书馆对教育经费合理使用的重要预算之一,几乎可以说必须购买,这相当于在价格谈判中把底牌提前亮给了对手。图书馆不会像企业那样在精确核算的基础上参与谈判,即使数据库价格逐年攀升,只要仍在经费预算以内,大多数图书馆还是会接受数据库开出的一揽子协议。

  国家的学术管理政策与机制也推动了大学对数据库的需求。例如国家在各类学科建设评比中对SSCI和SCI论文的强调,使得购买国外英文数据库便直接关系到一个大学的官方声望和各类荣誉。再比如对社会科学研究规范化和引证率的强调,都催生出对一个相对客观的数字统计平台的需求,这一需求无论如何也不可能由传统学术组织来满足。随之而来的量化考核等管理机制都可以无缝切换到数据库上面,在这一过程中,大学作为学术组织正在逐渐丧失其自主性和主导权。

  我们也可以说,传统学术组织无法按照市场机制对拟购买数据库客观估价并有效参与谈判,此外还要遵守国家对学术管理的政策规定,这些都帮助商业学术数据库攻城拔寨,成为无法摆脱的中间人。

  我们再倒推一下涨价的原因,来看看数据库和期刊编辑部的采购谈判中谁更占据优势地位?“核心期刊”体制的存在和边际上的动态调整使得少数杂志(及其背后的学术组织)获得巨大的寻租空间,它们在谈判中享有较高的自主权,数据库服务商为获得 “独家资源”需要向它们支付价格不菲的使用费,并将部分成本分摊到议价能力较弱的普通期刊和图书馆身上,这也是导致数据库价格连年上涨的因素之一。普通期刊的授权使用费甚至无法涵盖其向作者支付的稿费。

  尽管水涨船高,期刊编辑部在缓慢地提升面向作者的服务(如提高稿费、举办活动加强联系、提供单行本等),但学术论文仍然无法像其他出版物一样通过市场定价。很多科研人员也并不指望通过发表本身从编辑部获得金钱收益,而是希望自己的作品能够被更多的同行阅读,获得声誉和心理满足感。这种需求和数据库试图为数字作品定价的尝试格格不入,以至于数据库向编辑部施压的时候,价格谈判本身对作者科研影响不大,也没有集体发声。

  结合前面的分析,这也意味着,非商业化的劳动成果通过数字化形态的转换进入市场领域,获得了增值,但增值的主要部分成为少数核心期刊和数据库厂商的利润,作者仍然无法从中获得可见收益。换句话说,学术研究作品的商业化过程嵌套在一个非商业化的学术生产机制上,大部分编辑部和普通作者贡献出低成本的劳动,却不能获得劳动的增量部分。

学术成果的商业化VS生产机制的非商业化:作为公共资源的学术研究被商业数据库倾轧

  学术研究作为一种公共资源,一个重要目标是:确保学术资源能够在一个学术公共领域生产和自由流通,允许研究者从中获取养分,开展更多的研究、并将其成果回馈学术共同体。学术传统和脉络也是在这个过程中不断积累和形成,通过教育和阅读加以传承。

  在互联网时代,这一目标通过信息技术平台得到进一步实现,便利研究和创作的流通,甚至扩大了学术公共领域的范围。然而,相伴而生的风险是,数字化的学术资源开始受控于少数垄断性平台。数据库服务商表面上看帮助传统的纸质杂志快速数字化,有助于形成一个公共资源池(commons)。但是,这一公共资源池实际上以商业化手段形成,并在获取数字化学术资源时,使传统学术组织反过来依赖于数据库——松散的教育机构与学术组织很难对抗统一的数据库平台。

  有意思的是,互联网也加强了学术数据库以外的各种类型的公共资源池,虽然有些存在的合法性存在疑问,另一些则是维系传统学术公共领域的努力,它们在一起共同构成了丰富的学术资源生态圈。

  像百度这样的公司也在进军学术文献服务领域,“百度学术”不仅通过搜索引擎技术抓取散落在各个网站的学术研究成果,也试图通过用户自愿贡献分享的机制打造按照互联网模式运作的学术数据库。这种模式目前无法和传统数据库竞争,也尚未进入大学视野,但它试图向所有网民(而非仅仅是在校人员)提供免费的文献服务,和收费的数据库服务商形成了鲜明的对比。这一模式面临着严重的版权问题(但也会使用“避风港”原则自保),同时通过用户协议试图获取这些期刊论文电子版的永久使用权。这无疑又让人们看到一个蠢蠢欲动的、更黑暗的平台帝国。

  鉴于期刊编辑部的非商业化运作,中国学术界基本保持了一个允许作者自由传播已发表作品的氛围,这是对学术数据库的重要补充,也有诸多学术类网站以非营利的方式转载学术作品。如前所述,自由转载实现了作者精神权利,获得非金钱收益。而即使作者和编辑部签订了出版合同,编辑部在事实上也并不阻止这种未经授权即转发的实践——保留署名的转载至少是文科学术界默认的规范。期刊编辑部从未成为强有力的版权所有者,反而刺激了互联网上公共资源库的形成,尽管是松散的,这同时也为百度学术一类的服务提供了机遇。

  学术界本身开始自觉利用互联网推动学术公共领域的发展。例如国内外一些大学、编辑部纷纷建立打造自己的开放存取(OA)学术期刊,建立网站,或定期推送有价值的文献。另一个更广泛的趋势是大量科研人员纷纷加入在发表之前即与同行分享交流的在线社群(如SSRN、arXiv预印本、Academia. edu等),这些社群仅依靠捐赠维持,再次证明了学术生产和分享的非营利特征。

  在西方国家还出现了针对垄断性数据库服务商的大规模盗版实践,即攻破后者的服务器,超出合理授权范围下载批量论文并免费向有需求的人员提供。尽管在严格版权保护下这类黑客行为被禁止,然而这多少反映出国外数据库服务商和传统学术组织之间的矛盾和冲突。

  如何利用信息技术打造一个更加开放的学术公共资源池,保证学术资源流动自由和自主,是数字时代高等教育的一大挑战。从策略上看,大学可以利用其对期刊编辑部的影响,获得更大的议价权利,或者推动各类期刊向OA期刊转变;期刊编辑部可以采用非排他授权模式,确保数据库之间的竞争,并努力为作者争取更多权益;作者也可以采用知识共享(Creative Commons)这样的自主授权模式,使分享自己的作品合理合法。当然,将每个编辑部甚至每名作者真正推向市场未必是最好的解决办法。更为根本的方式可能是逐渐取消核心期刊制度,让所有杂志都有公平的议价权利和自主性,不再以低成本补贴少数期刊。同时,在商业化的封闭数据库之外,应该注意保持一个更加开放和有活力的学术公共资源池。

学术自主性的未来:谁有能力掌控人类知识的脉络?

  人们开始达成共识,学术自主性不能依靠自上而下的诸多指标进行评价,而应由学术共同体自发形成有约束力的传统和学术规范。从历史上看,各类学术数据库的兴起多少实现了依靠指标对学术产出进行量化考核的意图,只要量化指标依然存在,数据库平台就有存在的必要性。但是即使没有商业化平台,公共数据库仍然可以实现这一功能。从这个意义上说,除了上文说的信息流通层面外,科学地制定评价标准是影响学术自主性的另一个层面。

  前面介绍的游离于传统核心期刊的研究分享实践为新型学术评价机制提供了新前景。和通过大数据进行网络信用评级类似,在信息快速生产和流通的条件下,仅仅依靠引证率无法准确测量学术影响力,而像Google Scholar和SSRN这样的服务通过用户分享和讨论的程度提供了更加多元化的评估方式。任何尝试开发此类评估算法的机构都是在拥有大量数字作品的基础上进军更有价值的评估领域的,从这个意义上说,数据库服务商(也包括互联网公司)正从信息提供者转向分析平台,向大学提供更加专门的分析服务。

  我们面对的问题就从单纯的文献获取问题转向谁更有能力掌控人类知识脉络的问题。一旦通过某种智能算法分析出不同于传统学术传统的知识演进脉络,势必能在某种程度上对科研人员进行相应指引。在此,为了某种学术以外的目的或利益生产,在产生新知识增量的同时进一步消解传统学术组织的自主性,可能更值得警惕。

商业化学术数据库的兴起

  在中国,过去二十年间商业化学术数据库发展十分迅速,像知网、维普、万方、超星等公司快速崛起,通过不断扩大收录期刊规模,向越来越多的高等科研院校提供电子文献服务。比起纸质学术期刊时代,数字化的信息服务一定程度上便利了学术研究,解决了纸质学术资源有限的问题。同时,也加速了学术作品传播,从而使更多研究成果的影响力显著提升。

法律上的运作流程

  其运作流程在法律上并不复杂:作者通过向期刊编辑部社投稿,接受将信息网络传播权让渡给期刊编辑部的出版合同,随后期刊编辑部按照与数据库服务商的合同,一揽子将论文数字版权在合同期限内以排他或非排他的方式授权给后者。这两个合同确保了全国大部分学术期刊的文章能够迅速地在出版后汇集到数据库平台,出现在每一名研究者的电脑桌面上,成为重要的学术空间入口。

发展初期:模糊的版权

  数据库服务商既购买正版,也收录未经许可的作品(往往是年代久远的杂志)。在信息网络传播权尚未纳入法律保护范畴的时候,发生的纠纷往往起因于作者认为数据库侵犯了其数字版权,直到编辑部出面在出版合同中统一授权,这个问题才在形式上得到解决。

发展早期:数字资产的原始积累

  “规模效应”使得越来越多的大学图书馆参与进来,接受数据库定价(尽管每年的价格都以一个比率上涨),购置数据库越来越成为图书馆建设的常规支出。因为学术期刊本身不是营利性质的出版物,很多编辑部缺乏动力和资金将大量过刊数字化,于是以低廉的价格将数字版权转让给数据库服务商,由后者帮助制作电子版,并期待通过这一在线学术入口扩大自身的影响。类似地,超星公司和Google Book在发展早期也是通过与图书馆合作对纸质书籍的扫描完成数字资产的原始积累,加上扫描行为本身的法律性质难于判断,为这类数据库服务的日后推广和谈判奠定坚实基础。

地位稳固:生产链条形成闭环

  一旦数据库服务商的地位变得稳固,在面对众多订阅者的谈判中就可以占据主动。期刊向数据库源源不断提供生产资料,后者加工处理后再卖给大学,最终提供给教师和科研人员。同时,数据库服务商试图将更多新型作品纳入进来,如优秀学位论文、会议论文、报纸,并在此基础上开发新服务(如重复率检测)。毫无疑问,前面提到的两个合同能确保这一过程的形式合法性,从大学这一教育活动和学术活动的主体中汲取充足养分,形成一个完美的闭环,图书馆和杂志社的影响力逐渐消逝。

后果:打击盗版,成为新型垄断者

  数据库服务商获得大量数字版权许可后,在便利传播的同时,自己也成为一个新型垄断者。信息技术使每一次使用数字作品的边际成本趋近于零,但为了维持一个平稳的利润率,有必要将信息这种非稀缺资源通过人为方式变得稀缺,以便定价和谈判。例如,通过IP地址锁定,限制大学用户(及关联人士)使用的空间;创造独家阅读软件,为文献的传播和阅读制造壁垒;通过技术手段禁止批量下载论文,确保是人而非机器使用;尽可能获得排他授权,增加入口价值;按照论文下载次数给予编辑部不同的价码等等。当数据库服务商可以获得更多正版内容的时候,打击盗版,保护自身版权就变得更加义不容辞。

影响:奠定新的学术研究传播模式

  数据库服务商兴起的过程是一个将纸质文献数字化并广为传播的过程,也是一个通过版权和技术措施维护平台新兴利益的过程。在这一过程中,少数几家数据库服务商游走于各大科研院校之间,通过合纵连横的方式维持寡头式的竞争,在整体上确保了数字平台的优势地位。尽管可能有部分期刊因不满收录价格而退出某一学术数据库,也会很快被另一竞争者谈下。学术研究只有通过“核心期刊-大型数据库-图书馆”的方式得以传播已经在学术界达成共识。


握手

雷人

路过
1

鲜花

刚表态过的朋友 (1 人)

最新评论

Archiver|手机版|小黑屋| 毛旗网<所有文字仅代表个人观点,与本站立场无关>

( 京ICP备17031636 )

返回顶部