捕获和转换Web的工具

使GrabzIt的Web抓取工具更易于访问

4,2017十二月十二日
改进之前的网页搜集

我们的 刮板机 是一个非常强大的工具,但是非技术用户可能很难使用。 正如您在2016的入门视频中看到的那样。

为解决此问题,除非明确要求,否则我们现在隐藏原始的刮刮指令,“刮擦指令”选项卡现在默认情况下以纯英语显示刮刮指令。 实际上,现在可以完全添加和删除抓取指令,而无需编写任何代码。

我们还简化了网页抓取工具向导, int通过合并四个独立的向导来实现 int一位 现在,新向导可以执行多个操作,每个操作仅在适用于网页时显示。 它还旨在为用户提供更多 int基于要抓取的网页的通用选项。

但是,如果您要为几种不同类型的网页编写剪贴簿,该怎么办? 为了解决这个问题,我们创建了一个新的 模板系统 允许您定义应针对哪些网页和操作执行哪些刮取指令,并且无需编写手动刮除指令就可以使用所有这些新功能。

改进后的网页抓取

另一个常见的抱怨int 是很难分辨刮板是否按预期工作,以解决此刮板结果,现在还可以实时获取日志。 因此,您知道刮擦在结束之前是否仍在工作,如果需要,您可以选择中止刮擦。

所有这些更改都带来了更加用户友好的体验,如左侧最新的抓取教程所示。

但是,我们还没有通过这些更改来完善我们的网络刮板的可用性,因此,如果有人对如何进一步改进它有任何想法,请 联系我们!

查看最新的博客文章