捕获和转换Web的工具

使GrabzIt的Web抓取工具更易于访问

04 2017月
改进前的网页抓取

我们已经上线了 刮板机 是一个非常强大的工具,但是对于非技术用户来说可能很难使用。 正如您在 2016 年的操作视频中看到的那样。

为了解决这个问题,除非明确要求,否则我们现在隐藏原始抓取指令,“抓取指令”选项卡现在默认以简单英语显示抓取指令。 事实上,现在可以完全添加和删除抓取指令,而无需编写任何代码。

我们还简化了网络抓取向导并使之更加完善 int通过合并四个独立的向导来实现 int哦,一个。 新向导现在可以执行多个操作,每个操作仅在适用于网页时显示。 它还旨在为用户提供更多 int基于正在抓取的网页的实用选项。

但是,如果您正在为几种不同类型的网页编写抓取内容,该怎么办? 为了解决这个问题,我们创建了一个新的 模板系统 它允许您定义应该对哪些网页和操作执行哪些抓取指令,并且所有这些新功能都可以使用,而无需编写手动抓取指令。

改进后的网页抓取

另一种常见的比较int 是很难判断抓取是否按预期工作,为了解决这个抓取结果,现在日志也可以实时获得。 因此,您可以在抓取结束之前知道抓取是否有效,以便您可以选择提前中止抓取(如果需要)。

所有这些变化都带来了更加用户友好的体验,如左侧最新的抓取教程所示。

然而,我们尚未通过这些更改完成网络抓取工具可用性的改进,因此,如果有人对如何进一步改进它有任何想法,请 立即联系我们!

查看最新的博客文章