Strumenti per acquisire e convertire il Web

Converti URL e HTML in DOCX

API Ruby

Aggiunta della possibilità di convertire HTML o pagine Web into Con Word i documenti per la tua applicazione non sono mai stati così facili API Ruby di GrabzIt. Tuttavia, prima di iniziare, ricordare che dopo aver chiamato il url_to_docx, html_to_docx or file_to_docx metodi il save or save_to Il metodo deve essere chiamato per creare effettivamente il DOCX.

Opzioni di base

Catturare pagine Web mentre DOCX converte l'intera pagina Web into un documento di Word che può essere composto da più pagine. È richiesto un solo parametro per convertire una pagina Web into documento Word o a converti HTML in DOCX come mostrato negli esempi seguenti.

grabzItClient.url_to_docx("https://www.tesla.com")
# Then call the save or save_to method
grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>")
# Then call the save or save_to method
grabzItClient.file_to_docx("example.html")
# Then call the save or save_to method

Identificatore personalizzato

È possibile passare un identificatore personalizzato a DOCX metodi come mostrato di seguito, questo valore viene quindi restituito al gestore GrabzIt Ruby. Ad esempio, questo identificatore personalizzato potrebbe essere un identificatore di database, consentendo a un documento DOCX di essere associato a un particolare record di database.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.file_to_docx("example.html", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")

Intestazioni e piè

Per aggiungere un'intestazione o piè di pagina a un documento di Word è possibile richiedere che si desidera applicare un particolare modello al DOCX generato. Questo modello deve essere saved in anticipo e specificherà il contenuto dell'intestazione e del piè di pagina insieme a eventuali variabili speciali. Nel codice di esempio riportato di seguito, l'utente sta utilizzando un modello che ha creato chiamato "il mio modello".

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.file_to_docx("example.html", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")

Converti l'elemento HTML in DOCX

Se vuoi semplicemente convertire direttamente un elemento HTML come div o span into un documento Word che puoi ottenere con Ruby Gem di GrabzIt. Devi passare il Selettore CSS dell'elemento HTML che si desidera convertire in targetElement metodo di DOCXOptions classe.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In questo esempio, desideriamo acquisire tutto il contenuto nell'intervallo di cui ha l'ID Article, quindi lo passiamo all'API GrabzIt come mostrato di seguito.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.targetElement = "#Article"

grabzItClient.url_to_docx("http://www.bbc.co.uk/news", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")