마음의 안정을 찾기 위하여 - MODI (Microsoft Office Document Imaging)를 이용한 OCR
2058466
92
209
관리자새글쓰기
태그위치로그방명록
별일없다의 생각
dawnsea's me2day/2010
색상(RGB)코드 추출기(Color...
Connection Generator/2010
최승호PD, '4대강 거짓말 검...
Green Monkey**/2010
Syng의 생각
syng's me2DAY/2010
천재 작곡가 윤일상이 기획,...
엘븐킹's Digital Factory/2010
MODI (Microsoft Office Document Imaging)를 이용한 OCR
개발관련 Tool Manual | 2009/12/09 10:47
이번에 스캐너 관련 업무에 심취(?)해 있던중 스캔된 이미지의 문자 인식 부분에 관해서 기존에 전문 회사의 OCR 엔진을 사용하다가, 이 엔진이 덩어리가 너무 커서 배포시에 용량이(약 30메가) 부담이 되었기에, 좀 쓸만한 OCR이 없을까 알아보던중 알게된 MODI.

Microsoft Office Document Imaging을 설치하면 OCR모듈을 설치 할 수 있다는 얘기를 듣고, 노트북에 해당 프로그램을 설치한후에, ActiveX 모듈을 Import하여 OCR을 돌려보니....

Wonderfull!!!!!

너무나 훌륭하게 잘된다..... 한글/영어/일본어/중국어... 다된다. -_-;;;; 언어팩만 설치해주면 안되는게 없다..

음.. 이거 잘만 다듬으면 물건 되겠구나... 해서 컴퍼넌트 만들고나서.... 배포하려고 생각해보니....

이런 젠장.. -_-;

클라이언트PC에 MODI가 설치되어 있지 않으면 동작을 하지 않는.....
그래서 MODI를 이용한 OCR 모듈은 그런게 있구나 하고 알아보고 접어버리는... -_-;;;;;

누가 MODI 모듈을 손쉽게 배포할 수 있는 방법을 알고 계시면.... 팁좀.. 굽슨굽슨~~~~  (라이센스 때문에라도 안될듯... ㅠㅠ)

어찌됐든 MODI를 이용하면 아주 훌륭한 OCR 엔진을 이용할 수 있다는 것을 알려주고자 한다. 뭐 궁금하지 않다면 스킵 -_-;;

본인은 델파이를 이용해서 개발을 하기 때문에 델파이를 예로 들어 MODI를 이용하는 방법을 소개한다. 어짜피 ActiveX 모듈이기 때문에 다른 컴파일러에서도 아래와 비슷한 방법으로 적용하면 손쉽게 이용할 수 있을듯...

1) 메뉴의 "컴퍼넌트"탭에서 "Import ActiveX Control"을 선택
2) "Microsoft Office Document Imaging ...."을 선택
3) "Create Unit"을 선택

위와 같은 작업을 거치게 되면 "MODI_TLB.Pas"파일이 생성 되게 된다. 해당 유닛을 컴파일해 인스톨 하게 되면 MODI 관련 컴퍼넌트들이 인스톨 되고, MODI를 사용할 준비가 완료된상태...

이제 새 프로젝트를 열고 폼에 "MiDocView" 컴퍼넌트를 떨궈주자.

그다음에 아래의 샘플 소스코드를 이용해 테스트!!!

procedure TForm.Button1Click(Sender: TObject);
Var
  mi_doc :IDocument;
  Img :IImage;
  Layout :ILayout;
begin
  mi_doc:= IDispatch(CreateOleObject('MODI.Document')) as IDocument;
  mi_doc.create(c:\modi\image\ocr_sample.bmp);
  mi_doc.ocr(miLANG_ENGLISH,true,true);
  Img := IDispatch(mi_doc.Images[0]) as IImage;
  Layout := IDispatch(Img.Layout) as ILayout;
  Memo1.Lines.Add(Layout.Text);
  MiDocView1.Document := mi_doc;
  mi_doc.Close(false);
  Img := nil;
  Layout := nil;
end;


언제나 그렇듯이 좀더 자세한 정보가 필요하다면 가자!!!!!! http://msdn.microsoft.com/
2009/12/09 10:47 2009/12/09 10:47
Article tag list Go to top
View Comment 0
Trackback URL :: 이 글에는 트랙백을 보낼 수 없습니다
From. UbiSpace.net 2009/12/09 19:09삭제
ABBYY FineReader 10 한글 OCR 프로그램 - 이미지에서 텍스트 추출
최고의 OCR 성능으로 이름 있는 러시아 ABBYY사에서 한글을 포함한 전세계 186개 언어를 인식할 수 있는 OCR 소프트웨어인 FineReader 10 Professional Edition을 국내 총판 협력사인 디오텍을 통해 출시했습니다. 시험판 다운로드는 http://abbyy.co.kr/data/abbyy/product/finereader.asp 입니다. 국산 한글 OCR 엔진의 성능 개선이 답보 상태인 상황에서 FineReader 10이 출..
 
 
 
 
: [1] ... [311][312][313][314][315][316][317][318][319] ... [862] :
«   2022/10   »
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
전체 (862)
출판 준비 (0)
My-Pro... (41)
사는 ... (492)
블로그... (22)
My Lib... (32)
게임 ... (23)
개발관... (3)
Smart ... (1)
Delphi (75)
C Builder (0)
Object... (0)
VC, MF... (9)
Window... (1)
Open API (3)
Visual... (0)
Java, JSP (2)
ASP.NET (0)
PHP (4)
Database (12)
리눅스 (28)
Windows (23)
Device... (1)
Embedded (1)
게임 ... (0)
Web Se... (2)
Web, S... (19)
잡다한... (5)
프로젝트 (0)
Personal (0)
대통령... (9)
Link (2)