使用浏览器控制台快速复制百度文库文档

百度文库中以垃圾居多,然而有时却特别适合完成一些垃圾任务。许多百度文库文档是所谓“VIP”文档,看是可以看,复制是不允许的。
不过通过浏览器控制台查看HTML代码可以发现,百度文库没有使用任何特殊的控件来渲染文档,每一行字都写在HTML里,这就意味着通过控制台可以快速将文档中的文字复制出来。

抽取特定元素中的文字最方便的方法是jQuery,首先在控制台中尝试输入$,结果竟然发现是undefined。看来百度针对初级程序员做了一些“优化”。为此需要首先加载jQuery:

1
2
3
4
var script = document.createElement('script');
script.src = 'https://code.jquery.com/jquery-3.4.1.min.js';
script.type = 'text/javascript';
document.getElementsByTagName('head')[0].appendChild(script);

然后就可以使用$了,通过选取p标签的各个元素即可在控制台内获得文档内容:

1
$("p").text()