Software lettura libretto CEM

Заказчик: AI | Опубликовано: 19.12.2025

Devo automatizzare la parte più noiosa del nostro flusso: leggere il libretto di circolazione in PDF (sono file nativi, non immagini scannerizzate) ed estrarre in modo affidabile i dati del veicolo e del proprietario. L’obiettivo è avere un piccolo programma – va bene script Python, tool .NET o Java, purché cross-platform – che apra il PDF, identifichi i campi rilevanti e mi restituisca un file di appoggio facile da caricare nel nostro CEM con la procedura manuale già in uso. In pratica mi serve: • Parsing del PDF in testo di base • Mappatura dei campi “targa, telaio, marca, modello, alimentazione, nome, cognome, indirizzo” (in italiano, come appaiono sul libretto) • Esportazione in CSV o XLSX con intestazioni chiare Accetto soluzioni che usino librerie come PyPDF2, PDFBox, iText, oppure motori OCR solo opzionali se servisse una verifica extra. Il codice deve essere commentato e consegnato insieme a una breve guida all’uso; niente installazioni complesse, idealmente un singolo eseguibile o uno script con requirements.txt. Testo personalmente il risultato su un set di libretti reali: se tutti i campi vengono popolati correttamente il lavoro è accettato.