SCI:SciHub效应:最新研究指出,能在SciHub上下载的论文,更易高被引

鱼羊发自凹非寺量子位报道|公众号QbitAI

嗑盐的你,用过Sci-hub吗?

作为一个能免费看论文的学术搜索引擎,Sci-hub是科研人员的秘宝,同时,却也是学术出版商眼中的大瘤。

现在,有人站出来,用统计数据为Sci-hub正名:

能通过Sci-hub下载的文章的被引次数,是Sci-hub上下不到的文章的1.72倍。

也就是说,Sci-hub的下载量,已经成为论文影响力的重要指标。

这个结果一公布,立刻引发了网友的共鸣:

我总要先能看文章,然后才能引用啊。

Core Scientific希望以660万美元的面值甩卖比特大陆的优惠券:1月28日消息,已申请破产重组的比特币矿业公司Core Scientific本周提交了一项紧急动议,希望以660万美元的面值甩卖比特大陆的优惠券;大多数优惠券将于3月22日到期;仅适用于新购买的产量较低的蚂蚁S19s矿机;只能用于支付比特大陆30%的新购买费用。 (BlocksBridge)[2023/1/29 11:34:22]

Sci-hub,让文章更具影响力

这项针对Sci-hub影响力的研究,被研究人员们公开放在了arXiv上。

研究人员认为,Sci-hub作为一个闻名全球的项目,对于学术体系中的所有人都影响深远。

因为它能绕过大多数学术出版商的付费墙,实际上增强了论文的潜在影响力。

他们希望通过数据证明,Sci-hub的下载量与论文未来的引用量是正相关的。

加密矿企Core Scientific3月份比特币月开采量达1143枚:4月14日消息,Arcane Research数据显示,3月份,在主要的比特币矿商中,Core Scientific的比特币月开采量最高,约达1143枚BTC。排名第二的是Riot Blockchain,其在3月份开采了511枚BTC,不足Core Scientific的一半。其次分别是Marathon Digital Holdings(436枚)、Bitfarms(363枚)及Hut 8(345枚)。[2022/4/14 14:24:47]

数据集

研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。

加密矿企Argo Blockchain和Core Scientific签署矿机互换协议:3月14日消息,加密矿企 Argo Blockchain 和 Core Scientific 周一宣布签署矿机互换协议,该协议将使 Core 接收 Argo 现有的 Bitmain Antminer S19 比特币矿机,这些矿机已经在 Core 托管。由于 Antminer S19 的最大哈希率是95 TH/s,这意味着 Core 将接收大约 10,000 台矿机。另一方面,Argo 将接收 Core 先前订购的比特大陆 Antminer S19J Pro 比特币矿机,总容量为 967 PH/s。由于 S19J Pro 的最大算力为 110 TH/s,Argo 将收到大约 9,000 台。据悉,Argo 目前正在德克萨斯州建造一座 800 兆瓦的设施“Helios”,建造成本可能高达 20 亿美元。这些 S19J Pro 矿机将在现场投入使用,将占公司总采矿能力的 60%。为了减轻 Argo 的任何暂时性哈希率损失,矿机的交换将在机器交付时分阶段进行,预计在2022年5月至7月之间进行。[2022/3/15 13:56:28]

第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。

公共矿工Core Scientific在1月份生产了超过1000个比特币:金色财经报道,Bitcoin Magazine发推称,公共矿工Core Scientific在1月份生产了超过1000个比特币。[2022/2/9 9:39:32]

第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。

并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。

对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。

Core Scientific扩展矿机至77000台:12月17日消息,加密货币挖矿运营商CoreScientific宣布已与比特大陆签署新的矿机购买协议,该购买协议将使CoreScientific的总矿机增加至77000台,包括新购买的59000台S19和S19Pro蚂蚁矿机。如果矿机完全交付,CoreScientific的总算力将达到7.26EH/s,同时使用大约250mW的电能。

此前报道,CoreScientific在本月宣布获得加密货币行业巨头DigitalCurrencyGroup(DCG)旗下加密矿业全资子公司Foundry的2300万美元挖矿设备投资,并达成合作关系,将为CoreScientific及其客户购买挖矿设备。另外,DCG承诺在2021年将向Foundry再投资1亿美元。[2020/12/17 15:35:48]

研究结果

根据引文统计分布,文章引用次数超过2000次的论文被视作离群值。

研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。

在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍。

并且,Sci-hub下载量越高,论文的被引次数也越高。

在所有选定的期刊和涉及的学科中,Sci-hub的影响都很明显。

另外,结果也表明,图表丰富的论文更容易被引用。

研究人员认为,这样的Sci-hub效应具有多重意义。

第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。

第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。

在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。

不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。

影响全球学术界的Sci-hub

Sci-hub创建于2011年。创始人是一位来自哈萨克斯坦的研究生AlexandraElbakyan。

△科研女神,在线挥手

她的初衷很简单——天下苦学术出版商久矣。

毕竟,学术出版商是这样定价的:

对于一家上市公司来说,赚取多少利润合适,答案是“看市场能承受多少”。

以Elsevier为例,其订阅费每年都在上涨,到了2018年,加州大学系统平均每年要向Elsevier支付约1100万美元的订阅费用。这还没完,在协商签订新协议的时候,这家出版商还要求继续提价。

而早在2012年,Elsevier公布的利润率就已经超过了40%。赚钱能力甚至超过了苹果、微软等科技巨头。

这样的巨额收费,一直被认为是在阻碍科学开放、知识民主。

而Sci-Hub不仅包含Elsevier,还提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆盖范围非常广。

所以,不仅是中国、印度这样的发展中国家给Sci-hub提供了大量下载量,Science网站2016年发布的一份报告显示,在2015年9月到2016年2月期间,美国本土就有115万次Sci-hub下载请求,仅次于俄罗斯位居第五。

这无疑动了学术出版商的蛋糕。单纯站在法律角度,也确属违法。

2015年11月,在Elsevier的控告下,Sci-hub域名遭到封锁。从此Sci-Hub开始了流浪之旅,迁移到美国无法管辖的地方,网址频频更换。

创始人Elbakyan也为了避免被引渡到美国,开始四处躲藏。Science网站评价她是“可敬的利他主义抑或大型犯罪者,而这取决于你的立场。”

但无论如何,学术出版商利用长久以来积累的名望,使科研人员们不得不为职业生涯考虑,接受其昂贵的订阅收费服务,甚至被限制在论文发表后公开免费放出论文,这样的现状,负面影响正在慢慢显现。

正如这项研究中谈到的,对论文的访问限制,可能会导致科学研究无法充分发挥其影响力。

你觉得呢?

传送门

论文地址:https://arxiv.org/abs/2006.14979

—完—

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:15ms0-4:580ms