Scrapes 3.2.0中文版是专为WordPress打造的可视化内容采集插件,无需编程即可从任意网站抓取文章、图片等数据。支持PHP7.4环境,新增远程图片引用、自动添加图片alt属性、SEO优化等功能,可定时自动更新内容。兼容主流主题(如RiPro、7B2),适合博客、知识付费站点快速构建内容库,提升网站收录与排名。
一、插件核心功能亮点
- 可视化采集
- 通过图形化选择器自动抓取任意网站内容,无需编写代码,适合非技术用户。
- 支持自定义字段(标题、正文、图片等)的精准提取。
- 最新 3.2.0 版本更新
- 新增功能:
- 源链接传输图像:直接使用远程图片 URL(无需上传至媒体库),节省服务器空间。
- 防止片段并发执行:避免采集任务冲突,提升稳定性(需在所有片段中启用)。
- SEO 优化:
- 为无 alt 属性的图片自动添加 alt 标签(支持从源链接获取)。
- 密码保护文章状态功能。
- 效率提升:
- 单独更新产品价格/库存,无需重跑整个任务。
- 首次运行时自动添加内部链接(兼容 Top Rank 插件)。
- 问题修复:
- 修复摘要 HTML 标签导致的标题错误。
- 解决 Digikala 图片名称重复问题。
- 新增功能:
二、安装注意事项
- 环境要求
- PHP 版本:仅支持 ≤7.4.3,不支持 PHP 8.0+(强制升级会导致白屏)。
- WordPress 版本:建议 5.0+(需经典编辑器插件兼容旧版主题)。
- 激活与注册
- 启用后若提示“未注册”,点击插件设置页的 注册按钮 即可(无需输入密钥)。
三、使用教程(关键步骤)
- 创建采集任务
- 进入 Scrapes → 新建任务,输入目标网址。
- 使用可视化选择器点击需要采集的元素(标题、图片、正文等),自动生成 CSS 选择器。
- 配置字段映射
- 将采集到的内容映射至 WordPress 文章字段(如标题→标题,正文→内容)。
- 启用 “使用源链接添加 alt 属性” 以优化 SEO。
- 高级设置
- 防止并发执行:在任务设置中勾选 “防止同时执行片段”。
- 图片处理:选择 “不上传至媒体库” 以直接引用远程图片(需开启 CDN 或高速主机)。
四、常见问题解决
- PHP 8 报错
- 降级至 PHP 7.4 或使用兼容容器(如宝塔面板一键切换版本)。
- 采集内容乱码
- 检查目标网站编码(UTF-8 优先),在任务设置中强制指定编码格式。
- 分页采集失效
- 确认分页链接是否为相对路径,需在设置中补全完整 URL。
五、版本对比(3.2.0 vs 3.1.0)
功能 | 3.2.0 新增 | 3.1.0 基础 |
---|---|---|
图片处理 | 源链接 alt 属性、远程图片引用 | 本地上传 |
执行效率 | 独立更新产品属性 | 整站重爬 |
SEO 优化 | 自动 alt 标签、内部链接插入 | 基础元数据保留 |
兼容性 | 明确不支持 PHP 8 | 兼容 PHP 7.0+ |
提示:建议定期备份数据库,避免采集规则错误导致内容异常。如需批量管理任务,可配合 WP All Export 插件导出配置。