Como pueden ver en la captura me esta dando error al momento de leer el pdf con el mensaje ‘Unexpected EOF’ como se ve en la captura probe con otros pdf’s y si funciono pero con un pdf que solo tiene datos como tablas ya solo da el error como se ve en la imagen de ahi la consulta si hay otro modulo que pueda leer los pdf’s que vienen ya con un formato de tabla, asi como se ve en la imagen.
Share
JoseL
Ese error ocurre porque no encuentra el final del archivo, lo que ocurre porque es muy probable que ese documento sea escaneado en cuyo caso no te servira ese comando ya solo funciona con documentos pdf puros.
Armando
Gracias por la respuesta, pero los datos que están en el pdf no son escaneados son obtenidos de un sistema de escritorio que entrega esas tablas en formato pdf y también no son imágenes que son colocadas en el pdf, son datos digitales. no sabes si hay un modulo que permita recorrerlo y asi evitar el error que se mostro anteriormente
JoseL
¿Estas 100% seguro? Si el documento no es escaneado no veo la razón por la que daría ese problema y no, no hay un módulo para hacer eso que tu dices.
En todo caso, basado en mi experiencia con documentos pdf ya te digo que será todo un desafío extraer esa tabla de forma correcta. En este caso, la ventaja que tiene es que el documento no trae mucha información pero lo que se me ocurre es que uses expresiones regulares una vez que hayas extraído la información del pdf.
Ahora con respecto al error, veo que dejaste vacio el número de la página, así que trata de ponerle el numero de la página donde esta la información que deseas extraer y vuelve a probar.