A pdf-ből származó szöveg nem másolódik: okok, a formátum megváltoztatásának módjai és szakértői tanácsok

Volt már olyan dolog, hogy be kell illesztenie a PDF dokumentumban található szöveget egy másik szerkesztőprogramba, de a szöveget nem másolja a PDF fájlba? Hogyan tanácsolná, hogy ilyen helyzetben járjon el? Nem sok felhasználó veszi észre, hogy nem használhat egyet, de számos egyszerű módszer, a helyzet "megoldása" . De először összpontosítsunk néhány szokásos esetre és azok okaira, majd próbáljuk megtalálni a legmegfelelőbb megoldást mindegyikre. Rögtön meg kell jegyezni, hogy nem mindig tanácsos megváltoztatni az eredeti dokumentum formátumát.

Miért nem másolja a PDF-ből származó szöveget?

Tehát a PDF-dokumentumok tartalmának másolásának képtelenségének első és fő oka, a legtöbb szakértő úgy véli, hogy az ilyen műveletekre vonatkozó mindenféle tilalmat magukban a fájlokban telepítik.

A másolás tiltása a fájlszerkezetben

Ezek lehetnek jelszavak a megnyitáshoz, a másolási tilalmakhoz, sőt a dokumentumok védelméhez is, amikor tartalmat próbál nyomtatni. Egy másik egyformán közös helyzet, az a tény, hogy a PDF-ből származó szöveget nem másolják, maga a fájl károsodása vagy az eredeti szerkezet megsértése lehet. Ritkábban fordulnak elő olyan esetek is, amikor a Felhasználó olyan alkalmazást használ, amely nem igazán alkalmas szöveges tartalom kinyerésére egy PDF dokumentumból. Így például sok szakértő egyetért abban, hogy az Adobe Reader sokkal több funkcióval rendelkezik az Acrobat-hoz képest. Ezért, ha a PDF-ből származó szöveget nem másolja az Acrobat, először próbáljon meg hasonló műveletet végrehajtani az olvasóban. , ez teljesen lehetséges, ez megadja a kívánt eredményt. De a legtöbb esetben ez sajnos nem segít, mert a tartalom egyszerűen másolásvédett, a jelszó pedig mélyen el van rejtve magában a fájlban. Egy kicsit később megvizsgáljuk, hogyan lehet megkerülni az ilyen korlátozásokat, de most egy másik helyzetre összpontosítunk, amely sok felhasználót is zavar.

Miért másolják a PDF-ből származó szöveget hieroglifákkal?

Most tegyük fel, hogy a másolásvédelem nincs telepítve az eredeti dokumentumban, és úgy tűnik, hogy minden rendben van. De valamilyen oknál fogva, amikor a tartalmat egy másik szerkesztőbe továbbítja, a PDF-ből származó szöveget hieroglifákkal másolják. Ez csak annak a ténynek köszönhető, hogy az eredeti kódolása eltér a szabványtól. Leggyakrabban az ilyen helyzetben lévő szakértők a legegyszerűbb kiutat kínálják, , amelyben még a dokumentum kezdeti formátumának megváltoztatása sem szükséges. Annak alapján, hogy a PDF-ből származó szöveget rossz kódolással másolják, meg kell változtatni.

PDF fájl újbóli mentése

Ehhez a legegyszerűbb módja a PDF-szerkesztő fájlmenüjének használata, válassza a "Mentés másként" lehetőséget..."(Mentés Másként...), majd kattintson a Beállítások gombra a Mentés ablakban, és válasszon ki egy másik kódolást. Általában elegendő az eredeti szabvány UTF-8-ra történő megváltoztatása. A dokumentum újbóli megnyitásakor a szöveg változatlanul átmásolható és beilleszthető bármely más szövegszerkesztőbe. Azt is recode a fájlt néhány internetes erőforrás, mint a dekóder.

Hogyan lehet megkerülni a másolás tilalmát a fájlban?

Most lássuk, mit lehet kell tenni, hogy megkerülje mindenféle tilalmak és zárak.

PDF jelszó eltávolító Program

Ha a PDF-ből származó szöveget semmilyen ürüggyel nem másolja, akkor a kalóz módszert használhatja a korlátozások eltávolításával vagy a telepített jelszavak törlésével a PDF Password Remover programban. Ha ez nem ad eredményt, akkor látogasson el egy speciális webhelyre, mint például a Pdfpirate vagy a FreeMyPDF, és próbálja meg eltávolítani a védelmet. Mindazonáltal mindenkinek meg kell értenie, hogy egyes hivatalos dokumentumok esetében ez a technika illegális.

PDF fájl megnyitása Word-ben

Egy másik egyszerű technika, amely az eredeti PDF-dokumentumokkal kapcsolatos sok probléma kiküszöbölésére ajánlott, nem az eredeti tartalom másolása "a PDF viewer" vagy szerkesztő, de a fájl megnyitása közvetlenül a szerkesztéshez használt programban.

PDF megnyitása Word-ben

Szöveges dokumentumok esetén a legegyszerűbb módja az univerzális "Word" használata, és a megfelelő fájltípus kiválasztásával nyissa meg a kívánt dokumentumot ebben az alkalmazásban. Ha a dokumentum gond nélkül megnyílik, szerkeszthető és menthető a kívánt formátumban.

Hogyan lehet átalakítani a PDF szöveget Word-be?

De tegyük fel, hogy a forrásdokumentum nem nyílik meg a szövegszerkesztőkben (soha nem tudhatod, mi történhet), és a PDF-ből származó szöveget nem másolja a "natív" szerkesztők.

PDF fájl másolása a vágólapra

Ebben az esetben a fájl Word-dokumentummá konvertálásához próbálja meg a PDF-szerkesztőben úgy dönteni, hogy nem másolja a szöveget, hanem teljes egészében másolja a fájlt a vágólapra, majd illessze be a tartalmat a Wordbe. A módszer természetesen messze nem a legkényelmesebb, mivel a betét grafikus formátumú lesz, így lehetetlen lesz az anyag szerkesztése.

Ebben a helyzetben az optimális megoldás az eredeti dokumentum formátumának megváltoztatása bármely másra. Nagyon sok konverter program van az interneten, például a PDF To Word Converter stb. A kiválasztott alkalmazásban általában elegendő egyszerűen megadni a kezdeti fájlt és a végső formátumot az átalakítás után. Egyébként az ilyen kisalkalmazások segítségével a PDF-t nem csak Word-be konvertálhatja. Vannak programok az Excel konvertálására is.

Problémák a szöveggel a PDF dokumentumokban

Néha az is előfordul, hogy az eredeti fájlban a szöveges tartalmat eredetileg valamilyen nyomtatott dokumentum beolvasásával lehetett létrehozni. Nyilvánvaló, hogy ezzel a megközelítéssel a szöveget grafikus formátumban mentették el. Ugyanakkor meg lehet tiltani a másolást vagy a nyomtatást. Mit kell tenni egy ilyen helyzetben?

Az optikai felismerő rendszer használata

Ebben az esetben az OCR optikai felismerő rendszerek mentésre kerülnek. Szinte minden szakértő egyetért abban, hogy a legjobb megoldás az ABBY Finereader csomag kiválasztása. Természetesen a program nem ingyenes, de a szélességében "a Runet" a már aktivált (feltört) verziókat vagy módosításokat aktiválókulccsal találhatja meg.

ABBYY Finereader Program

Magában az alkalmazásban a start ablakban válassza ki a PDF fájl / kép konvertálását Word dokumentummá. A rendszer önállóan felismeri a szöveget a képből, és elküldi a Word-nek, majd új dokumentumot szerkeszthet és menthet.

Konvertálás más formátumokra

Végül, ha a feladat a szöveg konvertálása más nem szabványos formátumokra, akkor általában ajánlott ugyanazokat a konvertereket használni ezekre a célokra, vagy szűken célzott programokat (például PDF-t JPEG-be grafikus fájlokká konvertáláshoz), vagy olyan univerzális alkalmazásokat választani, amelyek nem egy, hanem több formátumot támogatnak, amelyek között lesz az, amelyre szükség van. Néha online szolgáltatásokat is használhat, de ez kényelmetlen a nagy időköltségek és a hozzáadandó fájlok méretének (vagy számának)korlátozása miatt.

Következtetés

Összefoglalva, több fő pontot is kiemelhetünk. Először is, nem mindig szükséges megváltoztatni a forrásformátumot, mivel másolhat egy fejlettebb szerkesztőben, mint például az Acrobat és a Reader esetében, vagy megnyithatja a fájlt közvetlenül a programban munkavégzéshez szöveges tartalommal, amelybe be kell illeszteni a forrásanyagot, mint a Word esetében. Másodszor, a legjobb a jelszavak és a tiltások visszaállítása speciális alkalmazások használata (még akkor is, ha illegálisnak tűnik). Harmadszor, a formátumok konvertálásának folyamatában a legtöbb átalakító általában figyelmen kívül hagyja a tilalmakat, így használatuk nagyon ígéretesnek tűnik. Negyedszer, ne engedje le a szövegfelismerő rendszereket, amelyek néha még jobban néznek ki, mint az összes előző. Ötödször, van egy vélemény, hogy néha az átalakítás virtuális nyomtatókkal is elvégezhető, de ez az opció csak azokra az esetekre alkalmas, amikor az eredeti szövegrészletet grafikává kell alakítani.

Cikkek a témában