Převod pdf to doc

Ring volný... (General Discussion)

Moderátor: Knihovníci

Knihomol
Uživatelský avatar
Příspěvky: 109
Registrován: 23 led 2008 21:02

Re: Převod pdf to doc

Příspěvekod Foolproof » 17 bře 2010 21:03

FerryH píše:
jinak zastavit ocr pri vkladani obrazku samozrejme jde v preferencich u JAKEKOLIV verze... blbe se divas.. vlez si jeste jednou do toho nastaveni u te verze co mas a hledej neco jako >> options > scan/open > do not read .....

:O)) a adekvatne totez v ceskem.. :O))


Asi jsem slepý, což ovšem nemění nic na situaci, že dělá OCR na textu, vždyť aby mohl dělat OCR, tak si to musí napřed převést na obrázek nebo fiktivně vytisknout nebo co já vím. Vždyť stovky programů poznají, že se jedná o text.

Jestli myslíš povel " Nečíst a neanalyzovat při otevření souboru", to je taková jediná trochu logická věc, která by se k tomuto vztahovala, tak to je o ničem, protože při jakékoliv akci vypíše jednoduše "Alesponˇjedna stránka nebyla rozpoznána" a to je samozřejmě konec, misíš dát rozpoznat a vesele dělá OCR, v kterém z naprosto bezchybného textu udělá pologuláš. Na toto to prostě není. :evil:
Sony Reader 505

Knihomol
Uživatelský avatar
Příspěvky: 109
Registrován: 23 led 2008 21:02

Re: Převod pdf to doc

Příspěvekod Foolproof » 17 bře 2010 21:26

Tak jsem zkusil i Infix, z něho jsem rozpačitý, něco tam nastavit ?Konečně srovnejte obrázky pokusné hnihy. VisageSoft je pochopitelně správně.

Obrázek

Obrázek
Sony Reader 505

Moderátor
Uživatelský avatar
Příspěvky: 5638
Registrován: 17 zář 2007 23:41

Re: Převod pdf to doc

Příspěvekod misojogi » 17 bře 2010 21:58

VisageSoft je pochopitelně správně.

mozes nejake blizsie info o tomto programe?
Neviete ako spravit kvalitny ebook? Citajte!
tlacitko HLADAT
podporujem dobu hajenia tri roky pre povodne CZ SK knizky, pre preklady pol roka
digitalizujte prednostne starsie tituly

Knihomol
Uživatelský avatar
Příspěvky: 109
Registrován: 23 led 2008 21:02

Re: Převod pdf to doc

Příspěvekod Foolproof » 18 bře 2010 01:44

Ten ExpertPDF mi doporučil kdosi výše, zatím jako jediný co jsem zkiušel převede text do Wordu správně česky. Skoro nezdrbe formátování, ale ignoruje typy písma, takže třeba italic se nekoná, velikost písma zachová. Ignoruje taky heslo pro úpravy. Možnosti editace chudobné. Kromě toho převodu pro mě nevyužitelný.

Domácí stránka
Kód: Vybrat vše
http://www.visagesoft.com/products/expertpdf/


Pilulka existuje.
Sony Reader 505

Knihomol
Uživatelský avatar
Příspěvky: 109
Registrován: 23 led 2008 21:02

Re: Převod pdf to doc

Příspěvekod Foolproof » 18 bře 2010 16:03

Tak po trochu usilovnějším studiu jsem našel jakési řešení. Zjistil jsem, že se svým problémem nejsem zdaleka osamocen a na foru

Kód: Vybrat vše
http://www.mobileread.com/forums/index.php


diskuse vyvrcholila tím, že jeden nadaný vytvořil prográmek soPDF, pouze CMD, který se netkne písma, ale pouze odstraní "nadbytečný papír". :D Jakoby udělá ty nulové okraje, o které se snažím, čtečce nezbývá nic jiného, než to nazoomovat na full screen a písmo se tím automaticky zvětší. Celá operace trvá u tlusté knihy asi 1 sekundu, tedy uživatelsky velmi přívětivé. Další k tomu vyrobil GUI a je z toho plnohodnotný prográmek.
Otestoval jsem, nemá to chybu, navíc pokud je člověk opravdu slepý, tak si může změnit orientaci a písmo se z šířky nazoomuje na výšku a to už jsou bukvy i pro 8 dioptrií. :D Stránkování, formát PDF, obrázky, vše zachová. Z mně neznámých důvodů zlikviduje interaktivní obsah, poznámky a vysvětlivky i metadata. Část lze pomocí GUI obnovit, ale nic moc. Rozhodně však zatím nejlepší.

Trochu problémy nastávají s čísly stránek. Zřejmě to v PDF není žádný footer, ale opuštěná číslice třeba na konci stánky. Díky ní program vyhodnotí rozsah textu včetně tohoto údaje a zvětšení textu mám pak ještě rezervu.
Zkoušel jsem pomocí Infixu a jiných editorů najít metodu, jak ty čísla stránek racionálně odstranit, ale zatím neúspěšně. V PDF editorech najít a nahradit zdaleka nedosahuje úrovně Wordu, takže něco podobného jako ve Wordu, kdy se dá třeba vyhledat číslice mezi pomlčkami, to nejde,

Nebo ano. :?: :?: :?:

Poraďte jeětě nějaký dostupný PDFeditor (Acrobat?), ve kterém by to nějak rozumně šlo.

Díky.

to FerryH

Ta FR8, na kterou jsi odkazoval, je bohužel portable a na 64bitu padne jak hruška. V té co se dá stáhnout u ABBYY není čeština, jak jsem psal a i když zatrhnu text místo obrazu, tak dělá OCR (proč?) a z ř udělá f atp. Nepoužitelné.
Pokud OCR, tak jsem to porovnával, FR10 je 64bit kompatibilní a je minimálně 4x až 5x rychlejší, než FR8, ale ignoruje to, že je to text.

Pro ty čtečky se jeví soPDF jako nejjednodušší vyrianta.
Sony Reader 505

Knihomol
Uživatelský avatar
Příspěvky: 109
Registrován: 23 led 2008 21:02

Re: Převod pdf to doc

Příspěvekod Foolproof » 18 bře 2010 20:27

:oops: :oops: :oops:

Ža diskuse ze strany FerryH není vedena ausgerechnet se mnou mi uniklo a omlouvám se. :oops: FR8 nepotřebuji.

Mezitím (stále usilovně koumám) jsem objevil, že Infix umí ve vyhledávání wild card, takže díky tomu, že jsou čísla stránek mezi pomlčkami se mi jaksi podařilo tam naprasit vyhledávací řetězec a čísla stránek jsem odstranil přímo v PDF :!:

Další krok soPDF a soubor je ve čtečce čitelný. :!:
Sony Reader 505

Analfabet
Příspěvky: 1
Registrován: 12 dub 2012 17:41

Re: Převod pdf to doc

Příspěvekod patrik_m » 10 kvě 2012 18:13

Ahoj,

teprve nedávno jsem si pořídil čtečku ale prakticky pořád se setkávám s jedním obligátním problémem... Převedu si knihy (většinou z PDF) do souboru EPUB. Text je v pohodě, velikost písma taky v pohodě, že to někde mezi slovy nechává pomlčku (pozůstatek původního textu - oddělení slov na konci řádku), ale vadí mi, že takhle převede i čísla stránek, takže se mi uprostřed stránky objeví číslo a text pokračuje dál. Docela mě to štve, nevíte jak z toho ven? Děkuji za pomoc...

Analfabet
Příspěvky: 11
Registrován: 02 dub 2012 10:14

Re: Převod pdf to doc

Příspěvekod svejk001 » 05 srp 2012 18:14

Zdravim.Možná budu za b.....a,ale když se nastaví správné nastavení v programu Calibre(cp1250)tak mi to vždy vyšlo k mojí spokojenosti.

Předchozí

Zpět na Obecné diskuze

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 4 návštevníků