Om du går papperslös behöver du ett enkelt sätt att göra dina skannade dokument sökbara så att de är mer än bara statiska bilder av dina pappersdokument. Vi har redan tittat på sätt att OCR-dokument i appar som Adobe Acrobat, PDFPen och Google Drive. Även om var och en av dessa appar kan känna igen text i dina dokument är det inte deras primära funktion.
Kanske är en av de mest kända OCR-utvecklarna ABBYY, som producerar många olika papperslösa hanteringsprogram. I den här handledningen visar jag dig hur du kan använda sin FineReader för webben och dess OCR-teknik för att konvertera PDF-filer, skanningar och andra bildfiler till redigerbar text.
Även om onlineversionen inte är lika kraftfull som skrivbordet, är ABBYY FineReader Online kanske den mest kraftfulla online-OCR-tjänsten tillgänglig nu.
ABBYY FineReader tar ut det mesta av det arbete som skulle ha varit gjort för att OCR ska lyckas i en annan tjänst, eftersom förbehandling sker i själva appen. ABBYY FineReader korrigerar bildförvrängningar, till exempel sidorientering och ljud, innan du börjar skanningen. Naturligtvis är aspekter som ljusstyrka och bildkvalitet beroende av användaren, men ingen ytterligare redigering skulle vara nödvändig vid användarens slut.
Efter förbehandlingen bryter ABBYY FineReader ner dokumentet till element som tabeller, bilder och textblock innan de upptäcker rader och enskilda bokstäver och ord. Tekniken bestämmer sedan förhållandet mellan alla egenskaper på sidan till varandra. Detta är för att säkerställa korrekt replikering inte bara av texten i dokumentet, utan hela layouten på själva sidan.
ABBYY FineReader Online stöder för närvarande 42 språk, även de med icke-latinska tecken som hebreiska och koreanska. Det finns ordbokstöd för 37 av dessa språk, vilket hjälper till att skapa en ännu mer exakt rekreation genom att markera upptäckta ord i minst en ordlista. Tjänsten kan OCR på dokument med upp till tre olika språk vid en given tidpunkt.
Den fullständiga listan över språk som stöds för ABBYY FineReader Online.Förutom språkstöd kan tjänsten skanna gamla texter på tyska och lettiska som sattes i svart brev, vilket gör ABBYY FineReader Online till ett användbart alternativ för OCR av historiska dokument.
En tjänst som denna kraftfulla inte kommer utan ett pris. OCR på ABBYY FineReader Online är inte alltför dyr: sidokrediter kostar mellan $ 3- $ 10USD för inkrement på respektive 20-200 sidokrediter. Du får dock gratis 20 poäng vid anmälan till tjänsten.
När du har loggat in på ditt ABBYY FineReader Online-konto, kommer du att dirigeras till uppladdningssidan.
Hitta först det dokument eller den bild du vill ladda upp, och se till att ABBYY FineReader stöder OCR för din fil. Tjänsten stöder OCR för PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif och .djvu-filer. Maximal filstorlek är 30 MB.
Tips: För bästa möjliga resultat, se till att filen är av hög kvalitet, och texten är minst 9pt eller 10pt.
Om du vill OCR-ett fysiskt dokument använder du en hårdvaruskanner, t.ex. Doxie eller en mobilapp, för att konvertera det fysiska dokumentet till ett ABBYY FineReader-kompatibelt filformat.
När ditt dokument är klart för uppladdning klickar du på Ladda upp knapp under Ladda en fil som ska behandlas fält. Hitta din fil i Finder-fönstret, och klicka Öppna. Jag rekommenderar att du checkar ut Skicka mig en länk via e-post rutan precis under filfältet för enkel åtkomst till det återskapade dokumentet efter att det har blivit OCRed. Den uppladdade filen visas i Välj filer som ska bearbetas Fält några avsnitt nedan.
Välj en fil för uppladdning.Därefter definierar du språk i ditt dokument under Välj språk (erna) för ditt dokument fält. Bläddra igenom listan tills du hittar språken i ditt dokument. Om du har mer än en, välj de ytterligare språken genom att hålla Kommando tangent, om du använder en Mac eller Kontrollera tangent, om du använder en dator och klickar på.
ABBYY FineReader Online stöder OCR för upp till tre språk i ett enda dokument.Om du skannar ett äldre dokument som sätts i svart brev, klickar du på hyperlänk till höger om språkvalet. Språklistan ändras och erbjuder dig rätt tyska och lettiska alternativ för OCR.
Gå sedan till Välj ett utdataformat fält för att välja formatet som filen kommer att OCRed. På den här tiden kan ABBYY FineReader Online exportera filerna som Microsoft Word eller Excel (i både 97-2003 och nya versionen), Open Office, PDF, RTF eller Plain Text-dokument. Välj det format du vill att det slutliga dokumentet ska konverteras till från rullgardinsmenyn.
Välj ett utmatningsformat i rullgardinsmenyn.Tips: När du väljer din dokumentutmatning, var försiktig med tabeller, diagram och andra bilder som kan vara i ditt inmatningsdokument, eftersom ordbehandlaren kanske inte kan hantera dem ordentligt och ge dåliga resultat.
Kontrollera att dokumenten du vill ha OCRed är avmarkerade i Välj filer som ska bearbetas fält. Nu trycker du på Erkänna knappen och ABBYY FineReader startar OCR.
Tryck Erkänna för att starta OCR-processen.Efter att ha tryckt Erkänna, Du kommer att omdirigeras till Uppgiftshistorik sida, där du kan kolla på framstegen i OCRed-dokumentet. Beroende på filens storlek kan OCR ta var som helst från några sekunder till några minuter.
När bearbetningen slutar kan du hämta ditt dokument i det format du valt, och exportera dokumentet direkt från webbapplikationen till Google Drive, Evernote och Dropbox. Du kan också betygsätta kvaliteten på OCR-jobbet, vilket gör det möjligt för ABBYY att förbättra sina produkter.
När bearbetningen är klar kan du hämta dokumentet eller exportera det direkt till en molntjänst.OCRed-dokument kvarstår på ABBYY FineReader-servern i två veckor innan de automatiskt raderas.
ABBYY FineReader Online är ett enkelt sätt att OCR-komplicerade dokument på nätet till en låg kostnad. Medan det inte är helt perfekt när det gäller bilder och andra stilistiska element, översätter den text felfritt, även i dokument med mer än ett språk, till många olika redigerbara filformat.
Om du har några problem med OCR i ABBYY FineReader Online, eller några tankar eller oro över OCR eller gå papperslösa i allmänhet, lämna en kommentar nedan!