本文章翻译自 online tech tips 官网,原作者 Aseem Kishore。所有权归原网站及作者所有,原文点击这里

编按: 绕过付费墙行为本身会给媒体网站带来不必要的利益损失,但往往我们在开通会员后,花费在其媒体网站上真正阅读的时间并不多。虽然一些媒体网站也提供一种较为人性化的阅读方式,如果彭博社、纽约时报、Medium 提供计量的免费阅读,游客或免费用户可以每个月免费阅读固定数量的(付费)文章。

事实上,我们对媒体的(付费)文章的依赖比较弹性需求,除非是某个职业的需要才会阅读某个媒体网站的所有文章。于是,便有我们今天这篇文章的主旨,如何解锁媒体网站的付费墙文章。

注:我个人是倾向于推荐读者为文章付费,这不仅是尊重作者的版权,也是一种自我素养的提升。在这里,我推荐来自荷兰的媒体网站 Blendle,该网站采用了一种更为前沿的付费墙模式「阅后付费」,按用户阅读文章数量计费。

目前 Blendle 给新用户账号赠送 2.5 USD(新户政策由官方统一说明),赠送余额用于其网站上的付费阅读,如若用户不满意文章 / 内容可以申请退款。此外,需要知道的一点是 Blendle 本身不生产内容,而是一个聚合网站,像是华尔街日报、金融时报的内容都可以在其网站上付费阅读。


前言

绕过华尔街日报,商业内幕,纽约时报等媒体网站的付费墙应该只有付费用户才能实现的事情。这也是设置付费墙的主要目的:付费用户可以享受访问特定内容。

有趣的是,通过了解现有的付费墙之运作模式,我们可以更加清楚的知道「解锁付费墙」背后的工作原理。正是如此,我们有的时候发现透过简单的浏览器技巧就可能解锁付费墙文章。

在常见的两种的付费墙类型中(硬付费和软付费),一般而言,能够被解锁的是软付费类型。「软付费」就是我们能够看到付费内容的一部分,而「硬付费」则是没有内容预览或者限制免费用户访问,通常情况下需要账号登录或者预先付款。

原作者注:我们不建议使用付费墙解锁插件,因为其插件的使用会导致对应媒体带来不必要的收入损失。这种损失模式与广告拦截插件类似,借此,我们应该正确且合理地去使用,并明确知道付费墙解锁插件会对媒体网站产生一定的影响。


如何解锁付费墙

你可以尝试下面多种方法来绕过 / 解锁媒体网站的付费墙。其中有一些方法可能会失效,但肯定的是总有一两个是可以解锁你将要访问的媒体网站。

1)Bypass Paywalls 插件

Bypass Paywalls 是一款 Firefox/Chrome 扩展插件,破解原理是通过各种前端方式来绕过媒体网站的付费墙。主要适用于外媒网站,如 Bloomberg、WSJ、Denver Post、the Baltimore Sun、Inc.com、The Herald 及其它外媒网站等。目前该插件仅能在 GitHub 页面下载进行手动安装。

注:Chrome 浏览器可能无法直接安装,将下载文件改为 zip 格式,然后解压到同一文件夹内,之后再通过「加载已解压的扩展程序」导入即可。

Bypass Paywalls
Bypass Paywalls

Bypass Paywalls

该插件最大的好处就是无需设置任何选项,用户进入媒体网站后,就会自动解锁付费墙。当然,用户还可以单独对网站进行禁用该插件(如你已经付费的媒体网站)。


2)在其他地方查找存档

通过复制文章的标题然后在搜索引擎(推荐使用 Google)中寻找分享文章。这也是解锁付费墙的最简单方法之一。很多时候,对于一些热门文章,读者们愿意在其它网站分享全文,(部分)官方也支持这些行为,它有利于网站的知名度。

搜文章时,使用空格和双引号,可以精准的匹配搜索结果。

注:空格就是多个关键词,加双引号就是搜索结果中必须有双引号中的内容。


3)使用爬虫来抓取完整文章 / 阻止页面完全加载

在部分网站中,为了提供网站在搜索引擎的权重或者让文章被及时收录,通常该文章会出现两种情况,一是该页面提供给访问者,这个页面设置了前端形式(css 或者 js)的付费墙,即用户直接在网站打开阅读会被付费墙阻止,另一个是提供给爬虫,如 Google、Yandex 这些搜索引擎,搜索引擎通过后端访问获取,没有付费墙的阻止。在后者的抓取上,搜索引擎往往提供了缓存机制,这种缓存机制往往能够绕过付费墙的全文,即直接抓取全文。以端传媒的文章为例,用户直接访问文章会被限制在付费墙;但通过搜索的缓存,可以获取全文。此外,你也可以通过后端抓取其源代码重新生成本地网页,同样可以解锁付费墙阅读全文。

使用爬虫来抓取
使用爬虫来抓取

使用爬虫来抓取完整文章

如果你听不懂也没关系。由俄罗斯开发者开发的 telegram bot:Статей читалка,便是利用这种原理,用户只需发送原链接即可获取全文(上图)。

实现原理:通过后端形式访问页面,在付费墙结构生成时,页面就已经完全加载了,所以能够绕过付费墙。大概意思就是只要我跑得够快,付费墙就追不上我。


4)Unpaywall Chrome 插件

Unpaywall Chrome 插件是用于解除学术文章的付费墙。工作原理是 Unpaywall 会自动在 2000 万免费合法 PDF 索引中查找副本,然后为用户提供查找到的免费副本的链接。

Unpaywall
Unpaywall

Unpaywall


5)重置浏览器 Cookie

对于计量免费阅读的媒体网站,删除浏览器 Cookie 或使用隐身模式就可以绕过付费墙。一些网站的付费墙模式允许用户阅读一定数量的文章,然后才会出现付费墙,如 medium、纽约时报等。通常这种模式的付费墙是通过存储用户 cookie 来实现工作原理的,即,利用网站的 cookie 功能来跟踪用户阅读了多少篇文章。

重置浏览器 Cookie
重置浏览器 Cookie

重置浏览器 Cookie

删除浏览器或者网站的 Cookie ,又或者通过网站隐身模式来躲过 Cookie 功能,就会以「新用户」的身份出现在网站上,进而实现解锁付费墙,「增加」免费文章的数量。


6)使用 Outline.com

在 Outline.com 中输入文章的 URL。Outline.com 是一家提供纯净阅读的网站,其工作原理,同样适用于解锁付费墙。

Outline.com
Outline.com

Outline.com


7)删除付费墙的弹出窗口

一些网站使用最基本的付费墙机制,通过弹窗模式提示用户付费阅读。虽然这种弹窗没有关闭按钮,但是我们可以通过页面审查功能来删除该弹窗。

删除付费墙弹窗
删除付费墙弹窗

删除付费墙的弹出窗口

例如,在 Chrome 浏览器中,鼠标右键单击「付费墙」消息,然后选择检查。使用工具左上方的鼠标指针选项查找「付费墙」的源代码。找到它后,右键单击并选择删除该审查元素。

如果该网站的付费墙机制使用 JavaScript 功能来阻止用户进入网页审查元素,那么意味着用户无法使用右键功能。这个时候需要禁止 JavaScript 功能或者使用开启右键功能的插件。


8)浏览存档站点

类似 Wayback Machine 和 Archive.is 这些用于存档网页的网站。同样的也可以利用它们来解锁被付费墙阻止文章。

Wayback Machine
Wayback Machine

Wayback Machine


9)使用「稍后阅读」工具

对于部分媒体网站,将文章发送到稍后阅读,如 Pocket、Instapaper,增加免费阅读的次数。在此之前,这些稍后阅读服务可以绕过付费墙,后来就开始限制这种行为了。

Pocket
Pocket

稍后阅读 Pocket

需要注意的是,通过右键点击链接发送到稍后阅读工具中,避免打开页面后再发送,这样等于做无用功。


10)将文章转换为 PDF

在计量免费阅读的媒体网站中,通过直接将网站文章进行 PDF 转换器,例如通过 Webpagetopdf.com 。将付费墙的文章的 URL 直接放入到网站的文本框中,然后进行转换,最后下载为 PDF,再进行阅读,同样增加免费阅读的次数

Webpagetopdf.com
Webpagetopdf.com

Webpagetopdf.com


11)使用「共享登录服务」

如果我们要解锁的媒体网站是「硬收费」模式,并且强制用户登录才能阅读文章。那么我们可以尝试使用「共享登录服务」。像 BugMeNot 这类网站就提供了「共享登录服务」,通过这类网站可以伪装成付费用户来解锁付费墙。

共享登录服务
共享登录服务

BugMeNot


12)注册免费试用

如果上述的各类方法都不能解锁付费墙。那么只能通过免费使用的方式来解锁付费墙,记得在真正收费之前取消试用。这是网站提供用户的权利,这也是最基本也是最容易实现解锁付费墙的方法。

注册免费试用
注册免费试用

注册免费试用

需要注意的是,一般网站免费使用,将以为之前你所使用的账号或者绑定的卡片将无法再次免费使用,同时你的卡片信息也会按照用户隐私协议被记录。