Molim preporuku za OCR softver
(1 korsinik/a gleda/ju temu) (1) Gost

Molim preporuku za OCR softver


17.02.2015 | 23:34
Imam 200 A4 listova tehničkih tablica koje moram vratiti u elektronički oblik.

Stvar je isprintana iz Excela, nekim običnastim Arial-olikim fontom (možda je Calibri, možda je Tahoma, nemam oko da to razlikujem, ali uglavnom radi se o sans-serifnim slovima), sve crnom bojom, na bijelom papiru. Ćelije su u najobičnijem rasteru - pune linije standardne debljine, i horizontalno, i vertikalno.

(Iz prilično glupih društveno-političkih razloga ne mogu do izvornog elektroničkog dokumenta niti imam ikakvu alternativu da ga nabavim. Ne dirajte u ljutu ranu. Jedina mi je opcija OCR iz ovih papira.)

Papire ću dobiti skenirane kao TIFFove 1-bit color depth, maksimalne rezolucije koju skener podržava bez interpolacije.

Postoje kolone samo s brojevima i kolone s tekstom (na hrvatskom, čćžđ...)

Radi se o ogromnoj količini podataka pa naknadna ručna kontrola i ispravljanje APSOLUTNO NE dolazi u obzir.

Zato mi je bitno da je točnost OCR-a što je veća moguća, osobito za brojke.

Također bi bilo bitno da OCR kuži da se radi o tablici i formatira izlaz kao tablicu. Bilo da koristi TABove ili CSV ili kako god.

Cijena softvera bi se morala uklopiti u ne više od $150-200. Poželjno je i manje.

Online OCR servisi nisu baš poželjna opcija, ali ne isključujem ih a priori.

Zahvalan na svim prijedlozima i idejama!
Tema zaključana.
17.02.2015 | 23:36
Pardon. Nije nužno da se radi o Mac softveru. Može i Win softver.
Tema zaključana.
  • Dijete
  • Posjetitelj
18.02.2015 | 03:08
www.abbyy.com.au/finereader/

Ima trial pa probaj, ne znam kako radi sa tablicama, ali mi je jedini OCR s kojim sam radio. Nije mi vise dostupan, pa ne mogu sam provjeriti to s tablicama, ali oni se hvale da svi elementi, tablice i grafike ostaju...

Koristio sam verziju 9 (aktualna je 12) i ta je lijepo radila sa dijakritickim i tvoji tiffovi se cine overkill jer je prepoznavao i lose skenirane dokumente.
Tema zaključana.
18.02.2015 | 07:03
I moj glas ide Abbyy fine reader-u. Radi s tabelama, prepoznaje nase grafeme, brojke mu idu odlicno. Ne znam cemuu TIFF, jer je taj formatobicno vrlo veliki. Treba ti 300dpi, greyscale ili B&W (imam na skeneru opciju OCR).
Ono u sto nije siguran, oznaci kao markerom. Eksport napravi i u Excel. Ako nije zahtjevna tablica, cak ju ok prebaci. Jedini problem moze bitidatibrojke spremi kao tekst, ali u Excelu to mozes prebaciti u broj.
Doduse, ja imam Abbyy fine reader express jer imam 10.6.8, a za vise sisteme je onaj pro koji ima vise opcija i mogucnosti.
Tema zaključana.
24.02.2015 | 13:55
jesi našao neko rješenje za ovo?
Tema zaključana.
24.02.2015 | 17:16
Probao sam Abby i još neka 2 (u istom rangu cijene), na testnom batchu od 10 stranica. Ova druga 2 su totalna katastrofa, brrr...

Abby je odradio posao na kraju. Ne odlično, ali OK. Radi se o tablicama. Sve ispada OK, samo je problem što ADF od scannera ne uspijeva sve papire povući idealno ravno pa onda na onima koji su otišli zeru ukoso (ništa dramatično, recimo da 2-3 mm bježe od vrha do dna) ima problema s prepoznavanjem ruba ćelije (pa ubacuje nepostojeće jedinice, male "L", velika "I", uskličnike i slične znakove).

Također, gotovo svaki put kad je imao više jedinica zajedno, ili jedinicu kraj kose crte ("/1" ili "1/") to je prepoznao kao "ll" (dva mala "L"), iako je jedinice pokraj drugih znamenaka prepoznavao nepogrešivo.

Najmanje bitan, ali najviše uočljiv problem imao je s ne-hrvatskim slovima. Naime, ako odabereš HR kao jezik, da bi uredno prepoznavao čćžšđ, onda ne doživljava slova W i Y (iako je X ok, s njim nema problema), nego w tumači kao "vv", a y kao "v".

Moram naglasiti da se radi o jako malom postotku pogrešnog prepoznavanja, ali količina toga je ogromna tako da se i s tim malim postotkom nakupilo ispravljanja. No, opet je sve bilo gotovo u jedan dan.

Hvala svima na preporukama!
Tema zaključana.
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 1 tjedan, 1 dan
  • smayoo: piši u forum
  • user: Ako zna netko kako dobiti njihovu zadnju poznatu lokaciju to bi bilo korisno
  • user: pretražio sam sve itd.
  • user: Već sam "play sound" aktivirao, ništa
  • user: nestale mi Airpods 4, what do? Piše "No location found" u FindMy.
  • user: ljudi,
  • CoffeePod: Cijeli 26 relase je bio sramotan za Apple i morali su “double down” i back to the lab da sve tweakaju kako su trebali
  • CoffeePod: Performansi i ulickani dizajn je ono sto treba
  • CoffeePod: Iskreno ne razumjem vas kojima je ovo “dosadno”. Stvarno morate ici taknuti travu.
  • dpasaric: Objavio sam osvrt na naslovnici, pa tamo komentirajte...
  • drlovric: Meni je Siri skroz OK, upakirali su to lijepo. Ocekivano ce vecina puno ovih stvari iic na pretplatu jer trosi compute (i Gemini) resurse. Lejpse mi izgleda UI jer smanjuju prozirnost :)
  • dpasaric: Što je najbolje nećemo imati niti Siri AI jer je EU učinila sve da se to regulatorno zabrani.
  • pontmax1: A dosade, imate li nešto više od šugave SIri AI
  • drlovric: Kao da ce roditelji ovo raditi. Otkljucat ce im sve i cao.
  • drlovric: Smorise sa ovom djecom :) Nestvarno...
  • dpasaric: Za sada dosadno za poludit... :)
  • dpasaric: I ja imam niska očekivanja, pa da vidimo! :)
  • dpasaric: Kreće za 5 minuta! :)
  • drlovric: Meni su ocekivanaj jako nisko. Pricati ce o Siri, koja ce opet doci kao beta. Pa ce raditi kako treba u inacici 27.4 :) Volio bih da grijesim, ali vise im ne vjerujem na rijec.
  • ping: Bit će to zanimljiva večer. Kupio sam dvije vrečice indijskih oraščića i planiram još barem mali paket Munchmallowa.
  • dpasaric: Danas u 19h WWDC! :)
  • Riba: user, ne upisuj admin password ano ne znas tko i zasto te pita i to je u osnovi to.
  • Yonkis: U Berlinu se otvara Developer Centar [link]
  • user: kako biti siguran od virusa na Macu? Sad ću reinstalirati OS i želim biti siguran.
  • user: bok ljudi,
  • Yonkis: Mene, kao prišlića, iznenadilo koliko je puno zastupljeniji Viber nego WhatsApp a Signal skoro nitko nije ni čuo (osim jabučnjaka). Zanimljivo.
  • Riba: Za tajne stvari imam pisacu masinu. :)
  • Riba: Ja imam instalirano sve pa tko kako hoce.
  • drlovric: Sve koje znam koriste Whatsapp. Viber, je isto popularan. Kao i Telegram. Signal nije bas zastupljen u mojim krugovima :)
  • dpasaric: Hehe, odlično, ja sam odavno prebacio sve na Signal.
  • Performita: Hvala Smayoo, Kako je Davor napisao ispod članka, i ja ebo čitam knjigu i lagano sve prijatelje, osobito one koji nemaju iPhone nagovaram na Signal.
  • smayoo: svima koje znam, to jest. :)
  • smayoo: skinuo i proslijedio link svima koji su još sposobni čitati knjige... :)
  • Performita: Ekipa, idemo sad svi skinuti besplatnu knjigu Guya Kawasakija da mu na administraciji stranice pokaže kako je odjeknulo u Hrvatskoj ;-)
  • dpasaric: Jest sitni sat, ali je published! :) Uživajte!
  • Yonkis: [link]
  • Yonkis: Baš baš sve!
  • Djuro genijalac: Izgleda da je BAŠ sve ovdje
  • Djuro genijalac: [link]
  • Yonkis: Hooorayyyy [link]
  • dpasaric: Radim na tome da nabavim zanimljiv monitor za tehnički review, držite palčeve da upali jer bi moglo biti mnogima zanimljivo. :)
  • Yonkis: Font je drugačiji.
  • Performita: :-)
  • dpasaric: Pogledajte naslovnicu! :)
  • dpasaric: Taaaa-daaaa! :)
  • dpasaric: Javim uskoro... :)
  • dpasaric: Ne, ovdje na Jabučnjaku!
  • Yonkis: dpasaric - Jel' u Kokolu?
  • dpasaric: Spremamo poslasticu za večeras! :)
  • ivan.ocd: Hvala za konkretni model, budem i ja pogledao za takav neki model… imam puno knjiga koje trrba analizirati i tu je onda preslab.

Za vikanje moraš biti prijavljen.

Prijava

Prisutni jabučari

Riba, Anonimci (1588)

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Anketa

Koji Mac koristite?

Page Speed 0.84 Seconds

Provided by iJoomla SEO