Strumenti per acquisire e convertire il Web

Converti URL e HTML in DOCXAPI Java

Aggiunta della possibilità di convertire HTML o pagine Web into Con Word i documenti per la tua applicazione non sono mai stati così facili API Java di GrabzIt. Tuttavia, prima di iniziare, ricordare che dopo aver chiamato il URLToDOCX, HTMLToDOCX or FileToDOCX metodi il Save or SaveTo Il metodo deve essere chiamato per creare effettivamente il DOCX.

Opzioni di base

Catturare pagine Web mentre DOCX converte l'intera pagina Web into un documento di Word che può essere composto da più pagine. È richiesto un solo parametro per convertire una pagina Web into documento Word o a converti HTML in DOCX come mostrato negli esempi seguenti.

grabzIt.URLToDOCX("https://www.tesla.com");
//Then call the Save or SaveTo method
grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
grabzIt.FileToDOCX("example.html");
//Then call the Save or SaveTo method

Identificatore personalizzato

È possibile passare un identificatore personalizzato a DOCX metodi come mostrato di seguito, questo valore viene quindi restituito al gestore Java GrabzIt. Ad esempio, questo identificatore personalizzato potrebbe essere un identificatore di database, consentendo a un documento DOCX di essere associato a un particolare record di database.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.URLToDOCX("https://www.tesla.com", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.FileToDOCX("example.html", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");

Intestazioni e piè

Per aggiungere un'intestazione o piè di pagina a un documento di Word è possibile richiedere che si desidera applicare un particolare modello al DOCX generato. Questo modello deve essere saved in anticipo e specificherà il contenuto dell'intestazione e del piè di pagina insieme a eventuali variabili speciali. Nel codice di esempio riportato di seguito, l'utente sta utilizzando un modello che ha creato chiamato "il mio modello".

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.URLToDOCX("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.FileToDOCX("example.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");

Converti l'elemento HTML in DOCX

Se vuoi semplicemente convertire direttamente un elemento HTML come div o span into documento Word che puoi con la libreria ASP.NET di GrabzIt. Devi superare il Selettore CSS dell'elemento HTML che si desidera convertire in setTargetElement metodo di DOCXOptions classe.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In questo esempio, desideriamo acquisire tutto il contenuto nell'intervallo di cui ha l'ID Article, quindi lo passiamo all'API GrabzIt come mostrato di seguito.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTargetElement("#Article");

grabzIt.URLToDOCX("http://www.bbc.co.uk/news", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");