Strumenti per acquisire e convertire il Web

Converti URL e HTML in DOCXAPI Perl

Aggiunta della possibilità di convertire HTML o pagine Web into Con Word i documenti per la tua applicazione non sono mai stati così facili API Perl di GrabzIt. Tuttavia, prima di iniziare, ricordare che dopo aver chiamato il URLToDOCX, HTMLToDOCX or FileToDOCX metodi il Save or SaveTo Il metodo deve essere chiamato per creare effettivamente il DOCX.

Opzioni di base

Catturare pagine Web mentre DOCX converte l'intera pagina Web into un documento di Word che può essere composto da più pagine. È richiesto un solo parametro per convertire una pagina Web into documento Word o a converti HTML in DOCX come mostrato negli esempi seguenti.

$grabzIt->URLToDOCX("https://www.tesla.com");
# Then call the Save or SaveTo method
$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>");
# Then call the Save or SaveTo method
$grabzIt->FileToDOCX("example.html");
# Then call the Save or SaveTo method

Identificatore personalizzato

È possibile passare un identificatore personalizzato a DOCX metodi come mostrato di seguito, questo valore viene quindi restituito al gestore GrabzIt Perl. Ad esempio, questo identificatore personalizzato potrebbe essere un identificatore di database, consentendo a un documento DOCX di essere associato a un particolare record di database.

$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->customId(123456);

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
# Then call the Save method
$grabzIt->Save("http://www.example.com/handler.pl");
$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->customId(123456);

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
# Then call the Save method
$grabzIt->Save("http://www.example.com/handler.pl");
$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->customId(123456);

$grabzIt->FileToDOCX("example.html", $options);
# Then call the Save method
$grabzIt->Save("http://www.example.com/handler.pl");

Intestazioni e piè

Per aggiungere un'intestazione o piè di pagina a un documento di Word è possibile richiedere che si desidera applicare un particolare modello al DOCX generato. Questo modello deve essere saved in anticipo e specificherà il contenuto dell'intestazione e del piè di pagina insieme a eventuali variabili speciali. Nel codice di esempio riportato di seguito, l'utente sta utilizzando un modello che ha creato chiamato "il mio modello".

$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->templateId("my template");

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
# Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->templateId("my template");

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
# Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->templateId("my template");

$grabzIt->FileToDOCX("example.html", $options);
# Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");

Converti l'elemento HTML in DOCX

Se vuoi semplicemente convertire direttamente un elemento HTML come div o span into un documento Word che puoi con la libreria Perl di GrabzIt. Devi superare il Selettore CSS dell'elemento HTML che si desidera convertire in targetElement metodo di GrabzItDOCXOptions classe.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In questo esempio, desideriamo acquisire tutto il contenuto nell'intervallo di cui ha l'ID Article, quindi lo passiamo all'API GrabzIt come mostrato di seguito.

$grabzIt = GrabzItClient->new("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = GrabzItDOCXOptions->new();
$options->targetElement("#Article");

$grabzIt->URLToDOCX("http://www.bbc.co.uk/news", $options);
# Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");