捕获和转换Web的工具

将网页和HTML转换为PDF-Java

Java API

将HTML文件,网页或纯HTML转换为PDF时。 GrabzIt的Java API 提供以下有助于帮助的功能 integrate GrabzIt into您的系统尽可能地容易。

但是,在开始之前,请记住 URLToPDF, HTMLToPDF or FileToPDF 方法。 要么 Save or SaveTo 必须调用方法来获取PDF屏幕截图或将HTML直接转换为PDF。

基本选项

PDF屏幕截图捕获整个网页并进行转换 int可以包含许多页面的PDF文件。 取决于目标网页的长度。 只需一个参数即可转换网页 intoa PDF文档。 或者 将HTML转换为PDF 如下所示。

grabzIt.URLToPDF("https://www.tesla.com");
//Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html");
//Then call the Save or SaveTo method

自订识别码

您可以将自定义标识符传递给 PDF 方法如下图所示。 然后,此值返回到您的GrabzIt Java处理程序。 例如,此自定义标识符可以是数据库标识符,从而允许将屏幕截图与特定的数据库记录相关联。

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.URLToPDF("https://www.tesla.com", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.FileToPDF("example.html", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");

页眉和页脚

创建PDF屏幕截图时,您可以要求您应用特定的 模板 到生成的PDF。 该模板必须是 saved提前。 它将指定页眉和页脚的内容以及任何特殊变量。 在下面的示例代码中,用户正在使用他们创建的名为“我的模板”的模板。

如果没有足够大的顶部或底部页边距分别用于页眉或页脚。 它不会出现在PDF中。 在下面的示例中,我们将顶部和底部边距设置为20以提供足够的空间。

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.URLToPDF("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.FileToPDF("example.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");

将HTML元素转换为PDF

如果只想从HTML文档转换单个HTML元素。 例如直接转换一个div或span int您可以使用GrabzIt的Java库获得PDF文档。 您必须通过 CSS选择器 您希望转换为HTML元素的 setTargetElement 方法。

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

在此示例中,我们希望捕获跨度中ID为的所有内容 Article。 因此,我们将此ID传递给GrabzIt,如下所示。

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setTargetElement("#Article");

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");

定位HTML元素时如何裁剪PDF 使用这些技术进行控制.