He estado probando la clase PDF en RPA Developer, más en lo específico
.copyfromdocument($document);
.pagefromocr($index, $language);
usando el siguiente código
Balloon("Start");
$pdfSelez = new PDF;
$pathPdf = "C:\...\nombre-file.pdf";
$pdfSelez.load($pathPdf);
Balloon("Pdf loaded.");
//Obtengo el texto,
$text=$pdfSelez.pagefromocr(1, "ita");
SaveToTxtFile($text, "C:\...\testo-ocr-da-pdf.txt");
Balloon("texto extraido desde pdf escanerizado. End");
Este funciona bien, y me gustaría hacer la misma operación pero desde Visual Studio, con C#.
Para extraer el texto de un pdf he visto que es posibile usar, por ejemplo, la libreria iTextSharp.
Pero para obtener el texto de un pdf de un documento escanerizado necesitaria de la clase .pagefromocr($index, $language) de RPA Developer.
No he encontrado nada al respecto en la documentación de RPA developer, los video tutotial y los proyectos de ejemplo que vienen con el rpa developer.
Alguna sugerencia?
Gracias