捕获和转换Web的工具

如何将整个网站转换为PDF以供离线查看?

©

有时,拥有网站的PDF版本很重要。 这可能是出于法律原因,例如证明有人盗用了您受版权保护的材料。 通过定期存储您网站的物理副本int的时间。

另一个常见原因是在关闭网站或博客之前保留所有辛勤工作的副本。 通常可能已经写了多年的材料。 因此,您可以下载整个PDF格式的网站以供后代使用,而不是丢失所有这些内容。

GrabzIt可以使用我们易于使用的网络抓取工具轻松地将您的整个网站转换为一组PDF文件,该工具是可以从网站中解析网站的专业软件 int以太网 为此,您必须首先为我们的在线网络刮板创建刮板。 然后,我们的网络抓取工具将使用此抓取工具来抓取您网站的链接结构,并从找到的每个网页中创建PDF。

抓取完成后,您将收到一封电子邮件,其中包含指向您整个网站的ZIP下载链接。 如果您已转换大型网站,请耐心等待,这可能需要一些时间才能下载。 然后可以是 saved到您的本地硬盘驱动器,这将使您可以离线查看您的网站,并且仍然可以int 友好,如果需要的话。

如何创建您的Scrape

为了完成创建刮擦的工作 save 您的网站转为PDF更加简单。 我们创建了一个模板来为您完成所有艰苦的工作。

加载此模板.

然后输入 目标网址,然后会自动检查该URL是否有错误以及是否进行了任何必要的更改。 保持 自动开始抓取 复选框被打勾,您的抓取工具将自动开始。

如果您希望网站的离线版本具有指向该网页的正确PDF文档的链接,请使用下面的“抓取模板”。 该模板将用连接所有转换后的网页的特殊本地链接替换PDF中的链接。

将您的PDF文档链接在一起 使用这个模板.

自定义刮板

如果要更改模板,请取消选中 自动开始抓取 复选框。 一种更改是按规定的时间表运行抓取,例如,创建网站的常规副本。 在 时间表刮 标签,只需点击 重复刮擦 复选框,然后选择要重复抓取的频率。 然后点击 更新 开始抓取。

作为附带说明,用于证明侵犯版权。 虽然每个PDF文件都有一个通过文件菜单可见的创建日期,但是要证明文件的创建时间,可以对它进行操作。 因此,作为附加保护,您还可以使用 时间戳记 watermark,这会将创建PDF的时间和日期添加到文档中。 现在有一个基本的 复制保护模板 为您做到这一点。

现在开始抓取。 您可以在 管理您的拼凑 页。 它会告诉您当前已转换为PDF的网页数量,如果您扩展抓取功能,您可以看到正在被转换的当前网页。 saved为PDF。 您还可以下载到目前为止已转换为PDF的页面的快照。

请记住,某些浏览器例如 Internet Explorer,可能不允许您本地查看PDF文件。 因此,您可能需要安装类似 使用Adobe Acrobat Reader 您可以先查看PDF文件。

您也可以全部转换整个网站 into DOCX通过使用此 模板.