Strumenti per acquisire e convertire il Web

In che modo GrabzIt converte HTML in DOCX

L'HTML può rappresentare molte strutture complesse come DIV in linea o SPAN affiancati. Elementi HTML sovrapposti e bordi applicati a diversi elementi HTML. Nella maggior parte dei casi questo non sarebbe un approccio sensato in DOCX mentre sarebbe possibile creare floatInserendo elementi HTML con caselle di testo, quasi tutto il contenuto sarebbe contenuto all'interno di caselle di testo, risultando in un documento Word molto brutto e disordinato.

È a causa di questo problema che ignoriamo il file floating degli elementi HTML e dei bordi della maggior parte degli elementi HTML. Tuttavia rispettiamo i bordi su alcuni elementi HTML come le celle della tabella e l'allineamento sugli elementi dell'immagine, ad esempio.

Ciò significa che non puoi posizionare i contenuti uno accanto all'altro? No. Ciò è ancora possibile utilizzando attributi CSS della colonna, tabelle HTML e tabulazioni come indicato di seguito.

Se desideri che un documento HTML venga catturato esattamente come mostrato sullo schermo, sarebbe meglio farlo convertire l'HTML in PDF poiché il formato file PDF utilizza il posizionamento assoluto.

Tabulazioni

Tabulazioni sono una funzione DOCX speciale che viene attivata se floatGli elementi HTML, con allineamento del testo, sono contenuti all'interno di un elemento HTML con larghezza del 100% che non ha un allineamento del testo specifico. Questo è importante perché significa che l'allineamento normale non dovrebbe essere applicato agli elementi figlio. Questo viene fatto utilizzando text-align:start. Tieni presente che i punti di tabulazione non funzionano all'interno di una tabella o di un elenco.

Un esempio di ciò è mostrato di seguito.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

Linguaggio del testo

Per fare in modo che il testo nel documento DOCX abbia una lingua particolare. IL HTML L'elemento tag del documento HTML deve avere un file lang attributo. O un altro elemento HTML all'interno del documento HTML come a P il tag deve avere una lingua specificata.

Se l'elemento HTML figlio non ha un tag lang specificato, la lingua torna a quella predefinita del documento. Se non viene specificato nessuno, viene utilizzato l'inglese.