捕获和转换Web的工具

GrabzIt如何将HTML转换为DOCX

HTML可以并排表示许多复杂的结构,例如嵌入式DIV或SPAN。 HTML元素重叠且边框应用于不同的HTML元素。 在大多数情况下,这在DOCX中不是明智的方法,但可以创建 float将HTML元素与文本框一起使用会导致几乎所有内容都包含在文本框中,从而导致非常丑陋且混乱的Word文档。

由于这个问题,我们忽略了 floatHTML元素和大多数HTML元素的边框。 但是,我们确实尊重某些HTML元素(如表格单元格)的边框和图像元素的对齐方式。

这是否意味着您不能并行放置内容? 否。这仍然可以通过使用 列CSS属性,HTML表格和制表符停止,如下所述。

如果您希望完全按照屏幕上的显示捕获HTML文档,则最好 将HTML转换为PDF PDF文件格式使用绝对定位。

制表位

制表位 是一种特殊的DOCX功能,如果 float具有文本对齐方式的HTML元素包含在宽度为100%的HTML元素中,该元素本身没有特定的文本对齐方式。 这很重要,因为这意味着不应将法线对齐应用于子元素。 这是通过使用 text-align:start。 请注意,制表位不会在表或列表中起作用。

下面是一个示例。

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>