Program pentru extragerea textului din fișierele PDF: Detexter

Cele mai traficate documente pe Internet sunt cele în format PDF (Portable Document Format), un format ce acceptă inserarea de imagini, semnături personalizate și multe altele. De multe ori însă, nu avem nevoie de tot conținutul unui document PDF, ci doar de textul său. Este destul de obositoare selectarea paragraf cu paragraf din document, apoi introducerea într-un alt document în format text. Detexter, un mic program gratuit și portabil poate extrage numai textul dintr-un fișier PDF.

1-PDF-to-Text

Detexter este un program dezvoltat în limbajul de programare Java, deci, rularea sa necesită instalarea Java în calculator, iar funcționarea sa este cât se poate de simplă.

Interfața programului nu lasă loc de interpretări, nu oferă nicio opțiune, bineînțeles, nefiind nevoie. Chiar mă întrebam la ce folosesc cele două butoane, Copy Selected Text și Clear Text din interfața sa. Probabil, pentru copierea și/sau eliminarea rezultatului extragerii textului, rezultat ce va fi afișat în partea de jos a casetei.

2-Detexter-interfata

Încărcarea documentului în format PDF se face cu ajutorul butonului Browse, Detexter extrăgând instantaneu textul din documentul respectiv. Textul extras nu va apărea în caseta programului, fișierul în format TXT va fi salvat în locația originală a celui în format PDF cu aceeași denumire.

Download

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *