Urborg napisał/a:Możemy się podzielić zadaniami. Pytanie tylko z jaką jakością skanujesz?
300 DPI w odcieniach szarości, z wykrywaniem stron podwójnych, czyli fizyczna jedna strona książki jest jedną stroną dokumentu w formacie oryginału (A5). Wszystko to robi program OCR. Chciałbym, aby produkt finalny wyglądał możliwie identycznie z tekstem źródłowym.
Na chwilę obecną zrobiony jest Kyan Pascal. Dzisiaj siadam do Deep Blue C, tak więc możesz zająć sie Action! i Dodatkami. Jeśli masz możliwość, to umieść każdą stronę w oddzielnym obrazie i wrzuć na jakiś serwer w postaci archiwum. Tekst przetworzony przez OCR również będzie lie widziany. :)
BTC, generalnie Twoja propozycja jest juz wcielana w życie. Z drobną różnicą: nie DOC a ODT. Finalnym formatem będzie PDF.
Jellnek, tak na dobrą sprawę to plain/text w zupełności wystarczy, jako że książeczka wygląda jakby była drukowana na igłówce w trybie draft. ;)