
1. 安装Puppeteer:
- 首先,确保你已经安装了Node.js。然后,通过以下命令安装Puppeteer:
npm install puppeteer
2. 安装Page Injector:
- 打开终端或命令提示符,运行以下命令以安装Page Injector:
curl -sS https://github.com/jakejarvis/page-injector/releases/download/v0.5.1/page-injector-v0.5.1.zip
unzip page-injector-v0.5.1.zip
cd page-injector-v0.5.1
npm install
3. 配置Puppeteer:
- 打开一个文本编辑器(如Notepad++、Visual Studio Code等),创建一个名为`config.json`的文件。
- 在文件中添加以下内容:
json
{
"defaultViewport": {
"width": 1920,
"height": 1080
},
"useDefaultViewport": true
}
- 保存文件并关闭编辑器。
4. 使用Puppeteer截取网页内容:
- 打开一个新的终端或命令提示符窗口。
- 输入以下命令启动Puppeteer:
node index.js
- 等待Puppeteer启动完成后,打开你想要抓取内容的网页。例如,如果你想要抓取Google搜索结果,可以在浏览器地址栏中输入`https://www.google.com/search?q=
[{...}]
[{...}]
[{...}]
- 每个数组代表一个搜索结果,你可以根据需要提取所需的信息。
注意:在使用这些插件时,请确保遵守相关的版权和使用协议。