<날개셋> 편집기는 <날개셋> 한글 입력기가 제공하는 프런트 엔드 중의 하나인 간단한 텍스트 에디터입니다.
메모장보다야 기능이 많지만, 이 프로그램의 개발 목적 자체가 외부 모듈과 입력 패드와 더불어 "<날개셋> 한글 입력기 커널의 기능 시연/제공"이기 때문에, 딱히 전문적인 텍스트 에디터나 워드 프로세서를 표방하면서 개발되지는 않는 프로그램이기도 합니다.

<날개셋> 편집기에는 컴퓨터용 언어 작성에 적합한 문법 표시(syntax highlight)라든가, 일반 자연어 작성에 적합한 맞춤법 검사/자동 교정 같은 기능은 없습니다. 하지만 프로그램의 특성상 문자 코드를 다루는 기능이 은근히 발달해 있으며, 버전업을 거치면서 지금은 텍스트 필터가 20여 종에 가깝게 추가된 덕분에 나름대로 독특한 텍스트 프로세싱 기능을 제공합니다. 숫자를 한글로 바꾸기, 한글을 소리나는 형태로 바꾸기, 풀어쓰기-모아쓰기 바꾸기 등 재미있는 기능이 많죠.

여기서는 <날개셋> 편집기의 고급 기능을 활용하여, 완성형-조합형 코드 변환 테이블을 생성하는 방법을 살펴보겠습니다. 조합형이나 유니코드는 현대 한글 11172자의 코드 번호를 계산으로 간단히 생성할 수 있지만, 완성형 코드는 테이블이 필요합니다. 사실, 윈도우 3.1의 한글 IME 프로그램도 헥사 에디터로 들여다보면 이런 테이블이 들어있는 것을 알 수 있습니다.

1. 먼저, 문자표를 이용해 완성형 한글 2350자 나열을 만듭니다.
Ctrl+I를 눌러서 '문자표'를 꺼내면, 코드번호에다 16진수를 입력하여 해당 유니코드 문자를 본문에다 삽입할 수 있습니다. 하지만 '-'를 이용해서 500-600 이런 식으로 입력하면 U+500부터 U+600까지 257자의 문자를 순서대로 한꺼번에 본문에 삽입할 수 있습니다.

그런데, 이 프로그램은 from과 to에 해당하는 문자가 모두 현재의 문자표 리스트에 있는 경우, 문자표 리스트에 등재되어 있는 문자만 본문에다 삽입합니다. 이 점이 중요합니다.
그래서 'KSC5601 문자표' 옵션을 체크하여 완성형 한글만 나오게 한 후, AC00-D79D (가~힝)을 입력해 주면 완성형 2350자 한글을 얻을 수 있습니다. 물론 2350자가 바로 삽입되는 건 아니고 처음 512자까지만 본문에 삽입되므로, 그 다음 문자부터 이 작업을 다섯 번 반복해 주면 됩니다.

  결과물: 가각간갇갈갉갊감갑값갓갔강갖갗같갚갛개객갠갤갬갭갯갰갱갸갹갼걀걋걍걔걘걜거걱건걷걸걺검겁것겄겅겆겉겊겋게겐겔겜겝겟겠겡겨격겪견겯결겸겹겻겼경곁계곈곌곕곗고곡곤곧골 ...

2. 이 글자들을 일단 줄을 나눠 줍니다. 블록으로 잡아서 "구분자 삽입" 필터를 고른 뒤, 설정에 들어가서 간격을 1로, 구분자는 '줄 바꿈'으로 지정하세요.

  결과물:



갇 ....

3. 결과물을 다시 블록으로 잡아서 "코드 번호로 변환" 필터를 고릅니다. 설정에 들어가서는 "문자를 기타 인코딩의 바이트 번호로"를 고르고, 기준 인코딩은 1361 조합형을, 번호 표현 형태는 "C언어 정수형"을 고릅니다.

  결과물:
0x88,0x61,
0x88,0x62,
0x88,0x65,
0x88,0x68, ...

4. 필터가 바꿔 준 숫자는 '바이트' 단위입니다. 하지만 우리는 한글 한 글자가 한 번호에 대응하도록 '워드' 단위로 바꾸고 싶습니다. 그렇기 때문에 찾기-바꾸기를 수행하여 ,0x를 없앱니다. 이걸 하고 싶어서 매 글자마다 임시로 줄을 바꾼 것입니다.

  결과물:
0x8861,
0x8862,
0x8865,
0x8868, ...

5. 이제 거의 다 됐습니다. 이제 다시 줄바꿈 문자를 없애고 모든 번호들을 한 줄로 도로 붙입시다.
결과물을 블록으로 잡은 뒤 "일괄 치환" 필터를 골라서 "\n","" 라는 문자열을 입력합니다. 줄바꿈 문자를 없앤다는 뜻입니다.

  결과물: 0x8861,0x8862,0x8865,0x8868,0x8869,0x886A, ...

6. 결과물을 블록으로 잡은 뒤 다시 "구분자 삽입"을 고른 뒤, 간격을 적당한 7의 배수로 입력하면, 2350개의 숫자가 84칼럼, 혹은 70칼럼 간격으로 가지런히 늘어서 있게 됩니다.
이 배열을 내가 짜고 있는 배열에다가 복사해서 붙여넣으면 되지요.

const unsigned short kshan[2350] = { ... };

Posted by 사무엘

2010/01/11 10:29 2010/01/11 10:29
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/94

Trackback URL : http://moogi.new21.org/tc/trackback/94

Leave a comment
« Previous : 1 : ... 2122 : 2123 : 2124 : 2125 : 2126 : 2127 : 2128 : 2129 : 2130 : ... 2204 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/11   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Site Stats

Total hits:
2978593
Today:
363
Yesterday:
1358