1. 라틴 알파벳의 위엄

오늘날 세계 문자들 중에 라틴 알파벳은 인지도와 실용성 면에서 단연 절대적인 '갑'임을 부정할 수 없다. 라틴 알파벳은 다음과 같은 여러 장점과 유리한 점이 있다.

  • 어느 한 국가나 민족만의 문자가 아니다. 물론 나라의 정서법마다 알파벳을 읽는 방식에 대동소이한 차이가 있어서 혼동스러운 면모도 있지만, 어쨌든 가장 국제적이다.
  • 음소문자여서 나름 다양한 언어의 말소리에 대응하기 유리하다. 또한 풀어쓰기를 하는 구조여서 언어의 다양한 음절 구조에 대응하기에도 유리하다.
  • 글자 수가 적어서 간편하며 활용하기도 쉬운 구조이다. 가령, 세계의 문자들 중에 기계식 타자기로도 만들고 또 겨우 8*8 크기의 비트맵에 각 글자의 모양을 다 담을 수 있는 문자는 얼마 되지 않을 게다.
  • 각각의 글자들이 들쭉날쭉하고 개성이 뚜렷해서 한데 뭉쳤을 때 시각성이 뛰어나며, 기호로서의 역할도 하기 좋다.
  • 타이포그래피 관점에서는 문자 차원에서 대소문자 구분이 존재하고, 또 이탤릭체 같은 같은 방식으로도 호소력을 높일 수 있다.

물론 라틴 알파벳은 표음· 음소문자라는 취지와는 달리 현실은 시궁창으로 언문일치가 개떡이며, 구조적으로 모음 글자가 너무 부족하다는 한계도 있긴 하다.

그럼에도 불구하고 라틴 알파벳은 신경 써야 하는 글자 수가 겨우 수십 개에 불과하기 때문에, 개개의 글자가 그야말로 왕이며, 서체 디자이너는 각 글자에 대해 완전 올인 몰빵 최적화가 가능하다. 이게 개인적으로 가장 부럽게 느끼는 점이다.
가령, A~Z까지 아주 정교하게 테스트된 수제 힌팅 프로그램을 집어넣는 여유를 부리는 건 이미 20여 년 전에 트루타입 글꼴이 처음으로 도입됐을 때부터 있었던 일이다.

그리고 요즘 글꼴이라는 건, 그저 코드값별로 고정된 글자의 폭과 벡터 이미지만을 기술하는 static한 데이터의 집합이 아니다. OpenType 기술 규격 덕분에 자기 옆에 무슨 글자가 오느냐에 따라서 다른 모양을 제공할 수 있고(GSUB), 폭을 미세하게 달리할 수도 있다(커닝.. 이게 개념적으로 더 확장되어 GPOS).

알파벳 정도야 문자 개수를 제곱해 봐야 몇백~몇천 정도까지의 조합밖에 안 나오니, 그 정도는 감당 가능하다. 한글이 '가' 할 때 ㄱ과 '고'나 '강' 할 때 ㄱ의 모양이 서로 달라지는 게, 알파벳으로 치면 W 다음에 A가 올 때와 W 다음에 P가 올 때의 간격을 미세하게 달리 설정하는 것과 같다는 뜻이다. 무슨 뜻인지 아시겠는가?

이런 기술은 이런 게 반드시 있어야만 정서법 차원에서 제대로 표시가 가능한, 복잡한 외국어 문자(complex script. 태국어나 아랍어 문자 같은)를 위해서 개발된 것이다. 그런데 라틴 알파벳은 원래 그런 기술의 도움을 받아야 할 정도로 복잡한 문자가 아님에도 불구하고, 더 정교하고 아름다운 타이포그래피를 위해 서체 디자이너가 그런 최신 기술까지 적용하여 시쳇말로 가히 잉여짓을 하고 있는 것이다. 가령, 라틴 알파벳도 아주 정교하고 미려한 필기체 중에는 그렇게 다이나믹한 표시 조건이 필요한 것도 있으니 말이다.

2. 반대편 극단에 있는 한자와 가나

이렇게 소수의 유한한 글자들이 왕인 라틴 알파벳 문화권에 비해, 글자 수가 엄청 많은 CJK는 상황이 굉장히 다르다.
한자는 전세계의 문자들 중 유일하게 '열린-_- 집합'인 무지막지한 문자 시스템이다. 덕분에 가변폭-_-이라든가 글자간의 다이나믹한 상호작용 같은 개념은 전혀 존재하지 않는다. 그래도 각각의 글자 자체가 워낙 그림처럼 생겼기 때문에 그 특성을 살린 타이포그래피가 존재한다.

거기에다 일본어 정서법은 한자에다가 자기네만의 간단한 표음문자가 더해져서 상황이 또 달라진다.
일본어는 입력하기가 굉장히 복잡하고 어려운 축에 든다. 그리고 '가나'라고 불리는 고유 문자는 구조적으로 불완전하며 한글에 비해 스케일이 작고 표음 능력에 한계가 있는 게 사실이다. 일본어 정서법은 가나 전용이 현실적으로 무리이다. 한자를 쓰지 않으면 안 되는 상황이며, 한글하고는 분명 상황이 다르다.

그러나 이런 형태가 단점만 있는 건 아니다. 굵직한 의미를 강조하는 한자와, 비교적 단순한 모양인 가나가 어우러지면 그것도 또 개성이 있으며 시각성이 살아나서 읽기도 꽤 좋다. 유식한 용어를 동원하자면 function word와 content word가 딱 잘 구분돼 보인다.
또한 입력이 어려운 대신, 한번 입력된 일본어 문장은 문자 차원에서 한자, 히라가나, 가타카나 같은 적지 않은 양의 NLP 정보가 담기기 때문에, 형태소 분석이나 번역을 의외로 유리하게 만들기도 한다. 히라가나-가타카나 구분이 라틴 알파벳으로 치면 대소문자에 얼추 비슷하게 대응한다고 볼 수도 있다(완전히 같지는 않지만).

3. 한글은 멀티 패러다임

자, 이렇게 라틴 알파벳 쪽의 정황과 한자 및 일본어 정서법의 정황을 살펴보았다.
그렇다면 세종대왕이 창제한 그 우수하고 독창적인 문자라는 '한글'을 사용하는 우리는 상황이 어떨까?

한글과 관련해서 우리가 절대로 간과해서는 안 되는 점은, 한글은 단일 패러다임만으로 설명이 되지 않는 문자라는 점이다. 단적인 예로, 단일 패러다임으로 설명이 되지 않기 때문에 한글이 총 몇 자냐는 질문에 24자부터 시작해 67자, 11172자, 심지어 160여만 자 같은 사람마다 뒤죽박죽인 대답이 나오는 것이다. 각각의 숫자가 한글의 규모를 어떤 관점에서 측정한 것이겠는지는 독자 여러분이 알아서 생각해 보시라.

차라리 한자는 총 몇 자냐는 질문에 대해 “아무도 모른다”라는 대답이라도 곧바로 나오지, 한글은 대단히 특이한 경우가 아닐 수 없다. 그래서 유니코드에는 고육지책으로 한글이 자모와 글자마디가 모두 등록되어 있으며 이것은 내가 보기에 나쁜 선택이 아니다. 그러나 한글을 바라보는 패러다임의 대립은 심지어 컴퓨터 전문가 사이에서도 거의 종교적인 신념의 대립에 가깝다. 이 말이 무슨 뜻인지 잘 모르겠으면, 본인에게 개별적으로 물으면 대답해 주겠다.

한글이 이런 유별난 위치에 있는 이유는 두 말할 나위도 없이 초-중-종성을 모아서 한 글자를 이루는 구조이기 때문이다. 만약에 한글이 IPA의 지위를 노리는 범용 음성 부호를 염두에 두고 만들어졌다면, 굳이 모아쓰기를 할 필요가 없다. 로마자의 예에서 볼 수 있듯, 풀어 쓰는 게 자음이나 모음의 중첩 같은 각종 외국어들의 변화무쌍한 음운 구조의 대처에 더 유리하다. 지금의 모아쓰기 체계는 모음의 발음이 분명하고 받침이 자주 등장하는 한국어의 음운 구조에 좀 더 최적화/로컬라이즈 전략을 선택한 귀결이다.

그래서 한글은 한국어의 음절 구분이 분명하며 시각성과 개성이 더 뛰어난 문자가 되었으며, 구조적으로는 알파벳 같은 계열보다 한자 계열과 좀 더 비슷한 형태가 되었다. 이 선택은 매우 큰 장점과 개성과 자부심을 가져온 것이 사실이다. 그러나 한편으로는 우리가 기술적으로 풀어야 할 과제도 많이 만들었다. 로마자처럼 소수의 글자를 최적화하고 품질을 다듬는 데 투자될 수 있는 기술과 노력이, 한글 조합 그 자체의 문제만을 푸는 데 다 소비되어 버리게 되었다. 입력이든 출력이든 모두에서 말이다.

다시 말해, 1만 개, 1백만 개, 심지어 1억 개의 글자를 조합해서 생성할 수 있다고 하는 한글의 그런 잠재성은, 알파벳처럼 개개의 글자마다 완전 정교한 힌팅, 커닝, 이탤릭, 필기체 따위로 최적화가 가능한 면모와 기술적으로 공존할 수가 없거나, 최소한 상호 조화시키기가 대단히 매우 어렵다는 뜻이다. 그렇다면 모아쓰기라는 걸 현실에서 반드시 절대적으로 일방적인 장점이라고만 간주해도 되는 것일까?

그래서 옛날 한글 선각자 중에는 로마자의 직관적인 기계화 기술과 먼치킨 급의 타이포그래피 최적화에 너무 한이 맺힌 나머지, “우린 안 될 거야 아마”라는 비관적인 결론으로 빠져서 아예 <글자의 혁명> 급으로 한글을 풀어쓰기 형태로 마개조할 생각을 한 분까지 있었다. 다중 패러다임이 독이라고 생각했던 것 같다.

물론 그 의도는 이해하지만 그건 너무 과격하고 비현실적인 주장이다. 개개의 한글 낱자는 마치 일본어 가나만큼이나 완성도가 부족하다. 가나가 한자와 섞어 쓰라고 만들어진 문자라면, 한글 낱자는 모아 쓰라고 만들어진 문자인 것이다. 한글 낱자만으로 풀어 쓰려면 진짜로 모음 ㅡ라면 U처럼 바꾸는 식으로, 글자 자형을 좀 더 변별성 있게 고쳐야 하고 맞춤법까지 대대적으로 손을 봐야 한다. 위험 비용이 너무 클 뿐만 아니라, 풀어쓰기를 실제로 오랫동안 시행해 본 분의 증언에 따르면, 한글 풀어쓰기의 시각적 능률은 모아 쓴 한글 음절을 도저히 따라갈 수 없었다고 한다.

4. 이제는 한글 자체의 고유한 특성을 살려서 입출력 기술을 발전시켜야

결국 이 모아쓰기에 따른 다중 패러다임은 우리가 한글을 고유 문자로 사용하는 한, 우리가 언제까지나 지고 가야 하는 숙제이다. 예전에 컴퓨터의 성능이 열악하던 시절에는 한글 같은 복잡한 문자를 심을 길이 안 보여서 풀어쓰기라도 생각해야 할 것처럼 상황이 암울했다. 그보다 상황이 약간 나아졌을 때에도 겨우 일본의 자국 문자 로컬라이즈 방식을 모방한 2바이트 한글 코드에다 전/반각 문자 따위밖에 선택의 여지가 없었다.

그러나 지금은 그런 기술적인 제약이 없다. 유니코드에, 화려한 OpenType 기술까지 완비되어 있는데 뭘 더 바라겠는가? 한글은 기계화가 유리한 문자인 건 명백한 사실이다. 그러나 딱 그거 하나만 믿고, 기계화 수준이라는 게 과거의 타자기 내지 2바이트 한글 코드 시절의 기술적 수준에서 멈춘 채 발전이 정지해 있다. 그런 낙후된 기술 수준은 한글에서 제한된 일부 패러다임밖에 수용을 할 수 없다.

일례로 입력부터 먼저 살펴보면, 15년도 더 전의 윈도우 95의 마소 한글 IME의 설정 대화상자와, 지금 윈도우 8의 한글 IME의 설정 대화상자는 제공하는 기능이 차이가 거의 없다. 이거 좀 문제가 있다.
어차피 조합이 필요하고 IME 같은 계층이 필요하다면 그걸 살려서 IME 계층이 있어야만 할 수 있는 일을 추가로 많이 지원해 줘야 한다.. 이것은 내가 <날개셋> 한글 입력기를 통해 어느 정도 기술적으로 실현시켰으며, 이 분야의 발전에 대한 필요성은 내 석사 논문에다가도 충분히 언급해 놨다.

출력 쪽도 마찬가지이다. 앞서 언급했듯이 라틴 알파벳은 적당히 꼬불꼬불하고 스스로 들쭉날쭉해서 보기가 좋으며, 일본어는 한자와 가나가 어우러져서 보기 좋다. 그렇다면 한글은 단일 종류의 문자가 빽빽하게 모였을 때 어떤 미를 추구해야만 할까?
이제는 한글도 한자 중심의 획일적인 정사각형 타이포그래피를 벗어나서 커닝도 생각하고, OpenType 기술을 적극 활용한 다이나믹 글꼴이 더 많이 나와야 한다. 한글은 굳이 한자가 섞일 필요가 없는 stand-alone, self-contained 문자이기 때문이다.

한글은 각 낱자는 직선 아니면 원밖에 없어서 기하학적으로 의외로 무척 추상적이고 단순하다. 그러면서 초중종성의 개성이 아주 분명하니, 한자나 로마자와는 달리 각종 로고타입이나 픽토그래픽으로 형상화하기가 좀 까다로운 면모가 있다(여전히 그림이나 아이콘 같아 보이지 않고, 글자처럼 보임). 그러나 그런 식으로 모아 쓰는 한글의 특성 때문에 오로지 한글에만 적용할 수 있는 글꼴이 나올 수도 있다. 모아쓰기를 그저 거추장스럽게 한글 자모를 정사각형에다가 예쁘게 끼워 넣는 overhead, burden으로만 받아들이지 말고 좀 더 창조적으로 활용할 수는 없을까? 이것이 내가 현재 고민하고 있는 분야이다.

요컨대,

  • 한글을 굳이 여타 문자와 더 비슷하게 만들어서 단점을 상쇄하려 하기보다는, 한글의 개성과 장점을 더 살린다. “넌 그걸 할 수 있냐? 난 그걸 못 하는 대신이 완전히 새로운 이걸 할 수 있다. 놀랍지?”를 지향한다는 뜻이다.
  • 한국어의 특성은 배제하고 오로지 한글의 형태 자체만을 생각한다.

이것이 내가 전통적으로 생각해 온 연구 방향이다. 입력기도 그렇고 글꼴도 그렇다. 더 이상의 자세한 설명은 생략한다. 연구 결과물이 다 나온 뒤에 빵! 터뜨려야 하는 것이기 때문에 당분간은 비밀이다. 그렇다고 해서 그렇게 심하게 거창한 건 아니고.. <날개셋> 한글 입력기도 겨우 1.x~2.x 시절에는 아이디어만 새로웠지, 기술적으로는 그다지 거창하지 않았으며 허접함 그 자체였었다.

이런 식으로 입력과 출력 모두에서 한글의 기술적 가능성을 한 걸음 확장하는 시도를 골고루 달성하고 나면, 그것이 대중적으로 성공하든, 아니면 너무 과격하거나 시장성이 없어서 실패하든 난 대한민국이라는 나라에서 태어난 보람을 느낄 것이고 죽어도 여한이 없을 것 같다.

Posted by 사무엘

2013/03/27 19:38 2013/03/27 19:38
,
Response
No Trackback , 13 Comments
RSS :
http://moogi.new21.org/tc/rss/response/811

한글 타이포그라피 학교 수강

1. 한글 운동꾼

평생을 '한글 운동'에만 몸바친 어르신이 한 분 계신다.
한글 운동이 뭐냐고? 일상생활이나 대외적으로(도로 표지판, 간판, 출판물 등) 최대한 한글을 많이 쓰게 하고 드러나게 하고, 세종대왕을 밀고, 덤으로 바른 한글 맞춤법과 순우리말을 가능한 한 미는 일체의 활동을 일컫는다. 한국어와 한글은 서로 다르지만, 그렇다고 완전 무관한 별개도 아니니...

일부 운동은 국문과 전공자가 보기에도 좀 과격하고 융통성 없어 보이고, 시대에 뒤떨어지는(?) 국수주의· 전투종족스러운 인상이 느껴지기도 할 정도이다. 허나 이런 분들의 헌신 덕분에 CJK 중 한국만이 한자를 일상생활에서 사실상 완전히 떼어 낸 편리한 자국 문자 전용을 이뤄 냈고, 끈질긴 전투 기질 덕분에 한글날을 빨간날로 추가하는 데 성공했다.

그 열정과 노력을 폄하하지 말지어다. 이거 그냥 된 게 아니다. 문자 습관이라는 건 인간 문화에서 굉장히 보수적이고 안 변하는 분야 중 하나이다.

내가 그분에 대해서 놀라는 면모는 인맥 네트워크이다. 한글 운동계에서 연륜과 짬밥에 관한 한, 이제 타의 추종을 불허하는 만렙이다 보니, 언어학, 공학, 역사학 등 갖가지 분야에 종사하고 있다가 뭔가 깨달은 게 있어 한글 덕후가 된 후학들은 알아서 이분을 제 발로 찾아가서 무릎 꿇고 “선생님, 한 수 가르쳐 주십쇼”를 한다. 자기 전공에서는 자신이 그 선생님과 비교가 안 되는 더 전문가인데도, 자기가 쓴 책이나 논문을 그분께 알아서 “드.. 드리겠습니다!”도 한다. 나 자신도 그분께 그랬고, 다른 사람들이 그러는 것 역시 내가 종종 봤다.

이쯤 되면 그분이 누구신지 눈치 채는 독자도 있을 것이다.
본인의 아버지보다도 연세가 더 많으신 그 운동꾼 선생님께서 쓰시는 글이나 주장은 내용이 거의 한글교 교리 수준이다. 내가 내 스스로 철도교 신자라고 하는 것만큼이나, 비하나 비꼬는 의미가 절대 아니니 오해하지 마시길.

그분은 늘 강조하셨다. “한글에 희망이 있다. 한글을 잘 활용하여 이 나라를 일으키고 잘 살아 보자. 한글 속에 (심지어) 돈벌이 아이템도 있다.”
과연 그럴까?

한글은 어린 시절부터 나의 오덕질 장난감이었다.
내가 비록 언어학이나 세계 문자학의 권위자는 아니지만, 그래도 주변의 메이저 문자들을 살펴봐도 세상에 조형적으로 이렇게 오묘한 문자는 없다. 단군의 후손들이 세계에 가장 강렬하게 내세울 수 있는 자기 정체성이자 고유 아이템은 아무리 봐도 한글밖에는 없는 게 분명해 보였다.
게다가 이런 문자가 그 정도의 수난사를 겪고 변모해 왔다니 피끓는 젊은 청춘의 감성을 자극하기에 충분한 수준이지 않은가?

2. 나의 적성과 진로 고민

그 원동력으로 본인은 지난 13년간 <날개셋> 한글 입력기를 만들었다.
이 분야와 관련된 완전 독자적인 노하우와 기술만 빼면 나는 그렇게까지 뛰어난 프로그래머가 아니며, 어쩌면 IT쪽 체질 자체가 아닌지도 모른다. 극단적으로 말하면, 10년쯤 뒤에 난 철도로 업종을 바꿔 있다 해도 이상할 게 없다.

남들은 다 대기업, 공무원, 의사 등등을 노리는데 난 도대체 무슨 부귀영화를 바라고서, 사용자가 1억도 안 되는 자국 문자를 위해 이런 일을 한 걸까?
난 지인들로부터 내 능력에 비해 내가 다닌 대학원이나 지금 다니는 회사의 수준은 아깝다는 말을 많이 들었다. 그 사람들의 말도 틀린 말은 아니다.

허나, 예전에도 이미 내 심경에 대해 토로한 바 있듯, 내가 지금과 같은 처지에 있게 된 이유는 간단하다. 나는 그것보다 더 수준 높은 대학원이나 연봉 캡숑 많이 주는 회사에서 하는 일에는 전혀 관심이 없고 그런 게 적성에 맞지 않기 때문이다. 평양 감사도 자기가 싫으면 그만이다. 내가 박사 진학에 괜히 실패했겠나?

<날개셋> 한글 입력기를 만드는 것 말고 다른 스마트폰용 소프트웨어를 개발하거나, 더 빠른 컴퓨터를 만들거나, 대박 내는 온라인 게임을 만드는 일엔 아무 관심이 없다는 것이다. 그건 나보다 더 똑똑한 공돌이들이 알아서 실컷 발전시켜 줄 분야들이다.
그렇다고 초창기 몇 년만 좀 허세 부리며 편하게 살자고 나의 피와 땀이 담긴 날개셋 핵심 기술을 대기업에다 홀랑 다 넘긴 뒤, 나중에 토사구팽 당하는 건 더욱 원하지 않는다. 그러니 나는 현실과 이상을 나름 가장 잘 절충한 지금과 같은 상황에 있게 된 것이다.

덕업일치를 바라지 않을 거면 차라리 나도 애초에 IT와 무관하면서 적당히 편하게 칼퇴근이 보장되는 공무원 사무직 같은 거나 구한 뒤, 퇴근 후의 개인 시간에 오덕질을 실컷 하는 게 좋지 않았을까 하는 생각도 가끔은 한다.

그러나 후회는 없다. 공무원 사무직이 무슨 동네 개 이름처럼 쉽게 구해지는 직업도 아닐 뿐더러, 그랬으면 또 그거 준비하느라 잃었을 기회비용도 만만찮고, <날개셋> 버전 자체가 애초에 지금과 같은 수준으로 올라갈 수도 없었을 것이다. 어쨌든 이 세상에 거저 되는 쉬운 일은 없다.

3. 글꼴 공부 시작

그래서.. 나도 나이가 있고 사회적인 책임이 있으며, 언제까지나 돈 안 되는 오덕질만 붙들고 있을 수는 없다. 어떻게든 내가 하는 일로 부와 명성을 쌓고 싶다. 나도 결혼도 하고 가정도 좀 꾸려야지 이제? -_-;;;

한글을 변형해서 무슨 외국어를 표기하는 문자를 만들고 보급..? 그런 건 지금까지 시행착오를 하도 많이 봐 왔고 이젠 바라지도 않는다.
무슨 맹목적인 한글 쇼비니즘 따위도 허상과 오류를 지금까지 이골이 날 정도로 경험했다.

그러나 그럼에도 불구하고 한글은 scope을 한국/한국어로 한정한다 해도 정말 뛰어나고 멋진 문자이다. 그냥 관습상 쓰던 것처럼만 활용하는 건 너무 아깝다.
한글로 이런 것도 할 수 있다는 것을 세계에 선보일 만한 아이템이 '아직까지는' 있으며, 남이 먼저 발견한 적은 없는 것 같다.
이걸 발굴하면 아까 그 운동가 선생님께서 부르짖으신 메시지가 실현될 가능성이 단 몇 퍼센트라도 더 높아지지 않을까?

그래서 한글 입력기로 시작한 연구를 출력에 해당하는 한글 글꼴로 끝낼 계획이다. 그래서 한글 공학의 종지부를 찍고 그랜드슬램을 달성할 수 있을 것이다.
박사 과정에 진학을 못 한 대신 자그마한 학원을 다니면서 수업을 듣고, 멘토 교수님과 종종 만나면서 연구를 할 생각이다.
2013년은 본인에게 한글 글꼴 연구의 원년이다.

Posted by 사무엘

2013/01/21 08:28 2013/01/21 08:28
,
Response
No Trackback , 5 Comments
RSS :
http://moogi.new21.org/tc/rss/response/786

명조(바탕)체의 역사

오늘날 인쇄물에서 본문용으로 타의 추종을 불허하는 압도적인 지위와 인지도를 자랑하고 있는 한글 서체는 명조, 혹은 바탕체이다.

너무 흔하게 보는 서체여서 잘 모를 뿐이지, 명조는 상당히 미려하고 잘 만든 서체이다.
붓글씨 계열과는 미묘하게 다르고 그렇다고 펜글씨 계열과도 완전히 같지는 않은 그 획과 삐침들은, 명조와 같은 계열로 곁들여져 쓰이는 알파벳이나 한자 서체와는 성격이 다르다. 예를 들어, 한자의 삐침을 그대로 적용한 한글 서체는 '순명조'라고 따로 있지, 일반적인 명조가 아니다. 한글의 명조와 조형이 가장 비슷한 계열을 찾자면 차라리 일본 문자의 명조인지도 모르겠다.

그런데 이 명조체는 생각보다 역사가 굉장히 짧다. 역사가 100년도 채 안 됐다.
영문의 Times체가 1931년에 나와서 Garamond나 Bodoni에 비해서 굉장히 젊은 서체 소리를 듣는다만, 명조는 더 어리다.

한글 서체는 20세기 이전에는 전부 흔히 말하는 옛체든 궁서체든 목판체든 어쨌든 붓글씨 형태가 전부였다.
그러다가 일제 강점기 때 흔히 말하는 성경체(산돌성경체..!) 같은 궁서와 명조 사이의 짬뽕 과도기를 거친 후,
1939년에 소년조선일보를 통해 발표된 '박경서체'에서 그나마 명조의 전신이라 할 수 있는 프로토타입이 나왔다.
이제야 붓글씨 서체가 아닌 활판 인쇄용 한글 서체가 논의되기 시작한 것이다.

그 후 1958년에 국정 교과서 활자체로 지정된 '최정순체'가 오늘날의 모든 명조 파생형의 원조라 할 수 있는 명조다운 명조로 자리잡았다.
그리고, 한글 서체 디자인의 아버지인 최 정호가 원도를 그린 '동아출판사체'도 비슷한 시기에 나와서 해당 출판사에서 나온 책과 사전의 본문에 쓰였다.

사용자 삽입 이미지
* 출처: 명조체의 역사를 한눈에 잘 정리해 놓은 곳

아하! 나 이 서체 기억한다. 'SM세명조'는 이 '동아출판사체'를 얇게만 고친 버전과 거의 일치한다. 어쩐지 비슷하더라. 옛날에 동아 출판사의 책들만 본문 서체의 모양이 약간 다른 게 이유가 있었다.
훗날 1991년에는 명조 계열 한글 표준 서체라는 타이틀로 '문화바탕체'가 나온다. 문화바탕은 동아출판사체 이래로 ㅈㅊ의 세로 꼭지가 오른쪽 끝이 아니라 중앙에서 시작하는 명조 계열을 계승했다.

1990년대엔 PC에서는 아래아한글이 보급한 한양 시스템 명조가 히트를 쳤으나, 출판계의 대세는 최 정호의 원도를 바탕으로 만들어진 SM계열 명조였다.
그러다 21세기에 들어서야 더 동글동글한 명조인 윤명조 시리즈가 유행을 주도하며 오늘날에 이르고 있는 중. 그 전에는 산돌이나 윤 디자인 서체들은 사실상 매킨토시에서나 볼 수 있었다. PC에서도 그런 서체들을 쓸 수 있게 된 건 빨리 잡아도 90년대 후반부터이다.

2000년대 이후부터야 최 정순의 명조 원도에서 더욱 변화를 준 나눔명조, 함초롬바탕 등 여러 본문용 서체들이 계속해서 발표되고 있는 중이다.

이런 우리나라에 비해, 북한은 서체 하나만 봐도 정말 시간이 수십 년 전에서 정지해 있음을 알 수 있다.;;
북한 서체는 여전히 남한으로 치면 1970년대 같고, 틀에 박힌 동일한 조합 로직에다 글자 꼴만 양산형으로 바꿔서 찍어 내는 것 같다. =_=;;
글쎄, 이런 것도 우열이 아니라 문화적 상대성이라고 존중해 줘야 하는 건가..?

북한에서 쓰이는 본문용 서체는 청봉이나, 역시 우리나라 서체와는 형태가 살짝 다르다.
그리고 우리나라의 순명조에 해당하는 서체로 북한에는 '광명'이 있다.
남과 북은 글꼴도 서로 이질적으로 바뀌고 있는 셈이다.

Posted by 사무엘

2013/01/17 08:33 2013/01/17 08:33
, , ,
Response
No Trackback , a comment
RSS :
http://moogi.new21.org/tc/rss/response/784

호머 헐버트(Homer B. Hulbert 1862-1949).
뼛속까지 한국덕으로, 한국인보다 한국을 더 진심으로 사랑한 미국인으로 아주 유명한 분이다. 2013년 새해의 첫 글은 훈훈한 이야기로 시작하겠다. ㅎㅎ

사용자 삽입 이미지

그는 모국어인 영어는 물론 한국어도 자유자재로 구사했으며, 한국의 역사와 문화를 서양에다 소개하고 한반도에 신식 학교를 세우는 등 수많은 좋은 일을 했다.
또한 정치적으로도 구한말 시절부터 고종 황제를 보호하고 헤이그 밀사를 직접 선발하여 조선/대한 제국의 독립 승인을 위해 적극 애썼다.

당시 미국의 대통령이던 시어도어 루스벨트는 한국의 입장에서는 뼈아픈 결정을 내린 사람이었다. 그가 그냥 국제 정세에 따라 일본으로 하여금 조선을 침탈하는 걸 승인했을 때, 헐버트는 자국 대통령을 비판하면서 일제가 조선의 주권을 침탈하게 해서는 안 된다고 주장했다. 그리고 1907년, 일제에 의해 미국으로 쫓겨난 뒤에 본토에서도 이 승만, 서 재필 등의 독립 운동을 도와 줬다.

또한 그가 무엇보다도 감화되었던 것은 한글이다. 한글을 나흘 만에 깨우친 뒤 이게 보통 문자가 아니라는 걸 직감하였으며, 어렵고 비효율적인 문자인 한자를 버리고 온 국민이 한글로 지식을 깨우쳐야 한다고 설파했다. 그리고 한글 정서법에도 띄어쓰기가 있는 게 좋겠다고 제안하여 서 재필이나 주 시경 같은 선각자들에게 영향을 끼치기도 했다.

“조선에서는 사람들이 우수한 자기네 고유 문자를 스스로 천대하다니 이렇게 안타까울 수가!” 이런 말을 미국인이 했다는 게 믿어지는가? 여러 애국 단체들 중에서도 특별히 한글 학회에서 사랑할 수밖에 없는 인물이다.

역사 기록에 따르면 1909년, 이토 히로부미를 저격한 안 중근 의사조차도 일본 경찰로부터 심문을 받던 중에 어쩌다 헐버트 얘기가 나오자, 그는 “헐버트는 한국인이라면 단 하루라도 잊어서는 안 될 민족의 은인이다”라고 증언했다고 한다. 다른 위인의 눈에 보기에도 헐버트는 큰 위인이었던 것이다.

그는 1945년 해방이 ‘정의와 인도주의의 승리’라고 한국을 진심으로 축하해 주었고, “나는 죽어서도 웨스트민스터 사원보다 한국 땅에 묻히기를 원한다”고 말했다. 그리고 실제로 마포 한강변에 있는 양화진 외국인 묘지에 묻혔다.

우리나라의 유명 독립 유공자들은 대체로 1960년대 초에 대대적으로 조사되어 각종 훈장이 추서된 반면, 이분은 아예 서거 이듬해인 1950년 3월 1일에 진작부터 이 승만 정부로부터 건국 공로 훈장 태극장이 추서되었다. 그가 어떤 계기로 그렇게 여러 나라들 중에 하필 한국을 사랑하게 되었는지 궁금해진다.

그는 다트머스 대학 출신이라고 하는데, old timer 프로그래머라면 기억하려나? BASIC 언어를 개발한 존 케메니와 토머스 커즈가 바로 이 대학의 교수이다. 그래서 베이직 언어의 여러 방언들 중에서 특별히 오리지널을 ‘다트머스 베이직’이라고 일컫는다. 한국인이라면 다트머스 대학이 헐버트의 모교이기도 하다는 걸 덩달아 기억할 필요가 있겠다.

한편, 헐버트에 필적하는 대한민국 독립 유공자 외국인으로는 캐나다인인 프랭크 스코필드(귀화명 석 호필)도 있다. 그는 의사이자 제암리 학살 사건 사진을 전세계에 보도한 기자이고, 서울 현충원에 묻혔다. 옛날에 스펀지에서 이 스코필드에 대해서 소개했었는데, 내용이 워낙 훈훈하다 보니 별 다섯 개를 당당히 받은 적이 있다.

그런데 헐버트는 스코필드에 비해서 인지도가 많이 뒤쳐지는 것 같다. 구한말 때는 열정적으로 한반도에서 활동했지만 정작 일제 강점기를 앞두고는 추방당해서 미국에서 지낼 수밖에 없어서 그런 듯.
그래서 작년 여름, 한글 새소식(한글 학회 월간지) 2012년 8월호(통권 480호)에서는 헐버트 박사 특집이 편성된 적이 있다. 우리나라 역사에 이런 분도 있었다는 것을 처음 알았다.

Posted by 사무엘

2013/01/01 08:21 2013/01/01 08:21
, , ,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/777

근황, 소식, 내 계획 짬뽕

1.

2012년이 다 저물어 가고 있다.
일단, 올해 하반기에는 문화· 정치적으로 모처럼 아주 기쁜 소식이 있었으니 그것부터 먼저 회고하고 넘어가야겠다.
바로 한글날이 22년 만에 다시 빨간날로 회복된 것! 그것도 미우나 고우나 이 명박 정권 때 이뤄졌다.
결정이 하도 지지부진하니 내년 달력을 만드는 업자들이 “이거 한글날은 빨간날로 해야 됩니까, 말아야 됩니까? 빨리 결정해 주세요!” 라고 독촉을 할 정도였다고 하는데.. 결국은 통과됐다.

알다시피 한글날은 원래 과거의 식목일처럼 공휴일인 기념일이었다. 그랬는데 노 태우 정권 때 공휴일에서 제외되어, 근처의 '철도의 날', '학생의 날'처럼 안 쉬는 여러 기념일 중 하나로 전락했다.
노 무현 정권 때는 국경일로 승격됐으나, 제헌절처럼 “안 쉬는 국경일”이라는 희대의 이상한 어정쩡한 날이 되었다.

그래서 한글 학회, 한글 문화 연대 같은 순수주의 어문 운동 단체에서는 수 년째 정부를 상대로 청원을 넣고 시민 계몽을 하고, 올해는 특히 온갖 기자 회견과 퍼포먼스를 연 끝에 드디어 승리를 쟁취해 냈다.
너무 무리하게 말을 순화하자는 식으로 약간 극단적인 주장에 모두 공감을 할 수는 없지만, 그래도 이 단체들이 정말 훌륭한 일을 해 냈다. 잘한 건 잘한 것으로 인정하고 이들의 열정을 칭송해 주자.

한글날 공휴일 지정을 가로막아 온 최종 보스는 역시나 경제 단체였다.
경제 단체들의 강력한 반발 때문에 산업 기능 요원 제도도 병무청이 단호하게 못 없앴다는 점을 감안하면, 얘들이 하는 짓이 다 병크는 아니다. 허나 공휴일이 너무 많다는 논리로 한글날 공휴일화를 반대하는 건 이미 안 통하는 논리이다. 안 그래도 우리나라는 노동자들의 근로 시간이 이미 세계 최상위를 다툴 정도로 길며, 우리나라는 대체 공휴일이라는 개념이 없기 때문에 날짜수만 평균 이상이지 실질적인 노는 날 수는 그리 많지 않다.

설령 공휴일이 정말 너무 많다면, 성탄절과 석가탄신일부터 칼질을 하는 게 순리일 것이다. 종교 공휴일 때 노는 나라는 주변의 CJK 중에서도 K밖에 없다. 이것도 합리적이고 이성적인 국민이라면 누구나 공감하는 바인데 왜 국민들 뜻대로 선뜻 안 되는 걸까?

“국경일 중에 삼일절 같은 날은 중요한 날이긴 하지만, 딱히 기쁜 날은 아니다. 그러나 한글날은 해당 국가의 정치나 종교와 관련이 없으면서 오로지 문화적으로 레알, 진정으로 경축할 가치가 있는 기쁜 날이다.” 이 점을 기억하자.
한글날도 공휴일이 됐는데 이제 사형 집행만 좀 부활하면 정말 잃어버려진 과거 회복이고 기쁜 일이 될 텐데...

2.

자, 그리고 비주얼 스튜디오 2012를 드디어 회사에서 깔아서 써 봤다.

외형이 또 심하게 달라졌다. 아무리 버전업이 돼도 3.x나 6.x나 아이콘 하나 안 바뀌고 외형이 심하게 변화가 없는 <날개셋> 한글 입력기에 비하면 MS의 변화를 위한 변화 저력은 정말 대단한 수준이 아닐 수 없다.
2012는 우중충한 군청+보라 배색이던 2010과는 달리, 은색· 회색· 흰색 배색으로 확 바뀌었으며, 2010과는 달리 non-client 영역에 일반적인 thick frame조차도 없다. 무슨 말이냐 하면 옛날의 아래아한글 97급으로 외형이 독자적인 형태가 됐다는 뜻이다.

16컬러풍으로 회귀한 아이콘 디자인, 그러데이션에서 단색(solid color)으로, 동그란 모서리에서 각진 사각형으로 회귀한 건 영락없이 10여 년 전의 VS .NET 첫 버전을 떠올리게 하는 외형이다. 아니, 윈도우 8 자체가 전반적으로 복고풍이다.
물론, 배색만 단순해졌을 뿐, 안티앨리어싱이 적용되어 아이콘의 색상 수 자체는 여전히 트루컬러급이다. 16컬러 “풍”으로 바뀌었을 뿐이지, 진짜 16컬러로 후퇴한 건 아님. ㅎㅎ

외형뿐만 아니라 2012는 기능도 무척 강화되어, IDE 에디터에서는 사용자가 선언한 명칭이 청록색으로 따로 표시되고, 굳이 Ctrl+Space를 누르지 않아도 첫 타부터 인텔리센스 자동 완성이 슝슝 튀어나온다. 오오~~

그리고 성능 분석과 프로파일링 기능이 더욱 강화되었으며, 소스 코드 정적 분석 기능이 드디어 추가되어 고품질 코드를 만드는 데 더욱 기여하게 되었다. 정적 분석 기능은 이전 버전의 VS에서도 있긴 했으나, 제일 비싼 엔터프라이즈급 버전에만 있었기 때문에 개인 인디 개발자가 접하기는 어려웠다.

<날개셋> 당장 다음 버전은 여전히 VS 2010으로 빌드할 예정이나, 이 버전의 사용 기간은 의외로 짧아질지도 모르겠다. 그리고 정적 분석을 돌려서 소수나마 코드에 존재하는 몇몇 논리적인 문제를 해결하기도 했다.

3.

지난 12년간 <날개셋> 한글 입력기를 통해 얻은 것은

  • 수능, 내신 다 씹어먹고 대학 진학 성공
  • 한글 연구 진영에서는 절대부동의 인지도 확보. 병역특례 TO도 사실상 그것 덕분에 얻은 거나 마찬가지
  • 인디 소프트웨어 개발자(개인 개발자) 커뮤니티에서의 인지도 확보
  • 보수적으로 잡았을 때 국내외에 몇천 명 정도로 추정되는 사용자와 잠재적 지지자. 국내는 물론이고, 생각지도 못했던 나라의 현지인이나 교포에게서 한글 로마자 입력 방식, 신세벌식, 세벌식 무한 낱자 수정 등등을 고맙게 잘 쓰고 있다는 연락 받았을 때 굉장한 보람 느꼈음.
  • 몇 차례의 대회/소프트웨어 공모전 입상을 통한 통산 몇백만 원 정도의 상금 수입
  • 거기 들어간 기술의 일부를 떼어 주는 개인 개발 용역으로 통산 1천몇백 만원 정도의 수입 (그리 큰 액수는 아니지만, 상대적으로 쉽고 재미있게 덕업일치를 이루면서 번 돈이라는 게 중요)
  • 학부 시절, 졸업/개별연구 명목으로 5학점 정도의 전공 학점 기여. 학술지 논문 1회 게재
  • 석사 논문 주제와 학위

그리고 무엇보다, 한글을 내가 원하는 어떤 방식으로도 입력하고 다룰 수 있으면서도 마치 기계식 타자기를 컴퓨터로 옮겨 놓은 듯한 한글 오덕질용 작고 가벼운 에디터. 그리고 Windows 운영체제에서는 거의 만렙을 찍은 한글 IME가 내 컴퓨터에 있다는 것에 대한 자부심과 정신적 만족감. 그걸 내가 혼자 다 만들었다는 것에 대한 성취감. 이로부터 파생되는 한글에 대한 자부심, 애국심 등등이다.

다음으로 잃었거나 어쨌든 줄어든 것은..

  • 적절한 대학 GPA (ㅋㅋㅋㅋㅋ)
  • 의대, 공무원, 대기업, 공기업 등에 들어가기 위한 스펙 쌓을 기회 (정말 하나도 거들떠보지도 않았다..)
  • 여타 분야나 IT 기술에 대해 관심을 갖고 익힐 여유
  • 연애와 결혼 기회 (...)

이 정도면 수지 맞는 장사이려나..? ㅋ

4.

내가 개인적으로 아쉬움을 느끼는 것은, '한국어 공학'에 비해서 '한글 공학'의 위상이 굳건하지 못하다는 점이다.
한국어 공학과 한글 공학은 목표는 비슷하지만 다루는 대상과 방법은 상당히 다르다.
그리고 내 관심분야는 '한국어 공학'이 아니라 '한글 공학' 쪽이다.

한글 자체만으로 오덕질을 할 거리가 전혀 없고, 더 발전할 거리가 보이지 않았다면 나도 그냥 사전학, 코퍼스 언어학, 자연 언어 처리 같은 데 관심을 뒀을 수도 있다.
아니, 언어학 쪽에 관심을 둘 필요조차 없이 그냥 자동차나 컴퓨터, 심지어 철도만 연구하는 평범한 공돌이의 길을 갔을 가능성이 높다.
그러나 문자가 저렇게 있는 걸 보니, 그걸 연구하지 않고서는 다른 분야는 도저히 못 파겠다..

물론, 지금 분위기를 이해를 못 하는 건 아니다.
지금이 옛날 같은 타자기나 XT/286 컴 시대도 아니고 문자 기계화 자체만으로 뭘 더 연구할 게 있는지 의아해할 만도 하다.

그래서 '한글 공학'은 문과 계열보다 오히려 언어학을 전공하지 않은 여타 분야 이공계(특히 입력기 쪽)나 디자인 분야(당연히.. 글꼴 쪽) 종사자들이 더 연구하는데.. 그쪽에서는 반대로 언어학 기반이 없으니 연구의 깊이에 한계가 있다.

그러나 한글은 주변의 한자나 라틴 알파벳이나 일본 가나와는 구조가 확연히 다른 문자이고, 그 조합 원리 자체만을 이용해 얼마든지 오덕질을 하고 입출력 기능을 더 다양하게 확장할 수 있다. 내가 늘 말하지만 한글은 두벌식으로만 입력하기에는 너무 아깝고 천편일률적인 정사각형 네모꼴로만 쓰기에도 너무 아까운 문자이다. 그래서 그런 학문 경계들을 허물고, 한글 입력과 출력 모두에서 새로운 솔루션을 만드는 게 꿈이긴 하나...

대학원의 박사 진학은 일단 좌절되었다.
나는 정말 이 분야를 가고 싶고 특정 교수의 학풍을 계승하고 싶은데 실력이 부족해서 떨어진 것이라면, 몇 번이고 입시에 재도전을 했겠지만, 나는 그런 경우가 아니니 내 연구 주제를 감당이나 지도를 못 하겠다고 교수님들이 날 받아 주지 않았다.

내 연구 주제는 특정 단과에 맞아 떨어지는 게 아니기 때문에, 딱 석사를 마쳤던 대학원에서 박사를 안 받아 주면 나는 딱히 다른 대학원을 갈 데도 없다. 그러니 난 최종 학력은 그냥 석사로 만족해야 할 듯하다.
논문 쓰는 게 힘든 한편으로 재미있었고 이런 걸 또 쓰라면 쓰겠는데, 그걸 하지 말라니 어쩔 수 없지. 이해를 하며, 원망은 안 한다.

한편으로는 이게 밥벌이가 돼야 할 텐데 하는 우려도 좀 든다. 당장 내가 몇 달 안으로 생각하고 있는 건,

  • 날개셋 마이너 업데이트 (6.7x. 다음 달 초-중순쯤 나올 예정)
  • 지금까지 내가 만들어 놓은 것들에 대한 문서를 재정비. 홈페이지와 프로그램 도움말 주요 내용을 영작
  • 날개셋 메이저 업데이트 (6.9? 7.0? 윈도우 8용 IME 온전히 완성)

정도. 이미 내가 벌여 놓았고 관성 때문에 계속 진행해야 하는 일들은 이 정도에서 몇 개월 안으로 슬슬 끝을 볼 생각이다.
그 다음으로는 공부가 너무 소홀했던 IT 여타 분야 기술과 지식도 좀 독학하고, 무엇보다도 글꼴로 체제 변환을 하여 비밀 프로젝트를 몇 년간 진행할 예정이다.

그 결과물을 학계와 업계에 발표했는데도 이와 관련된 다른 일자리나 추가 수입이나 반향이 없다면..
2015년쯤 이후부터는 본인도 한글 관련 연구는 다 접고, 그냥 회사에서 시키는 일만 하는 소프트웨어 개발자로 돌아가거나 심지어 철도 업종으로 전업을 하거나, 공무원/고시 준비생-_-으로 돌아갈지도 모르겠다.

뭐, 그 정도의 최악의 상황까지도 각오는 하고 있다. 그러나 나의 20대와 30대 초반을 정말 건전하고 뜻있는 일을 하는 데 정열을 바쳤다는 사실에는 어떤 경우든 후회가 없다.

Posted by 사무엘

2012/11/29 08:29 2012/11/29 08:29
, , ,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/762

스마트폰 지름

난 초등학교 때 컴퓨터를 처음으로 접했고,
중학교 때 PC 통신,
고등학교 때 인터넷과 이메일,
대학교 때 휴대전화와 개인 홈페이지를 순서대로 접했다. 개인적으로는 이런 순서가 아주 점진적이고 자연스럽고 좋았다고 생각한다.

그리고 마지막으로 스마트폰은 무려 대학원 석사를 졸업한 뒤, 2012년 11월에야 장만하게 되었다. 대수로는 제5대째이다.
물론 이것은 어지간한 여타 사람들에 비해서는 시기적으로 굉~장히 엄청나게 늦게 도입한 것이다.

지금까지 스마트폰을 안 쓴 이유는 딱히 없었다.
이게 일부 분야에서 매우 편리한 물건인 건 사실이지만, 난 이미 PC로 필요한 정보 처리와 프로그래밍은 다 하고 있으며 이미 쓰는 전화기를 만족스럽게 쓰고 있고, 스마트폰이 그저 남들이 다 쓴다는 군중 심리만으로 그 가격을 투자하면서까지 쓸 가치가 있는 새로운 물건은 아니라고 생각했을 뿐이다. 다른 기기에 신경을 쓸 겨를이 없었다.

또한 스마트폰은 기존 PC와 본질적으로 거의 동일한 기능이 좀 더 작은 기계에서 돌아간다는 차이만 존재할 뿐, 과거에 컴의 성능이 16비트에서 32비트로, 단색에서 트루컬러로 바뀌던 것처럼 불가능이 가능으로 바뀌는 정도의 신기함이 느껴지지 않았다. 글자를 빨리 못 입력하는 게 크게 불편하게 느껴지기도 했고 말이다.
초등학교 시절부터 일찌감치 컴퓨터를 썼던 경험이, 지금은 오히려 유행에 대한 반응을 둔감하게 만든 셈이다.

그러다가 기존 전화기가 고장이 나면서 스마트폰을 도입하게 됐다. 시대가 시대인데 피처폰을 굳이 수리까지 하면서 쓸 필요는 없으니 말이다.
내가 스마트폰이 특별히 유용하다고 생각하는 면모는 다음과 같다.

  • SNS 앱 연동
  • 지도 + 길/장소 찾기
  • 어디서나 부담없는 크기와 무게의 기기로 무선 인터넷 접속. 노트북은 WIFI에 붙는 것만 가능하지만 폰은 자기가 직접 연결을 할 수 있다.
  • 유용성뿐만 아니라 그와는 별개로 일단 품위와 간지

태생적인 한계이겠으나, 피처폰이든 스마트폰이든 모바일 기기는 문자 입력이 제일 불편한 건 변함없다. 제조사의 특성상 입력 방식이 천지인밖에 없다. 골수 나랏글 유저인 본인에게 천지인은 직관적이지 않아 너무 불편하고, 두벌식 쿼티는 각각의 버튼이 너무 작아서 오타가 잘 난다.

쿼티라 해도 그 작은 기기에서 열 손가락을 다 동원하는 타자 따위는 기대할 수 없으며, 검지-엄지의 독수리 타법의 부활이다. 역시 문자 입력은 PC를 따를 기기가 없음을 느낀다.
카카오톡을 깔고 나니 “오오, 사무엘 님 드디어 카톡 들어오셨어요?” 인사가 막 들어오는데.. 타자가 불편해서 카톡질은 오래 못 하겠다. 카톡이 있으니 PC뿐만 아니라 폰으로도 인스턴트 메신저가 하나 더 생긴 거나 다름없는 반면,. 나의 폰타는 PC에서의 세벌식 타속에 비해 고작 1/4~1/3밖에 안 된다. ㄲㄲ

또한, 쿼티 배열을 쓴다 하더라도 나오는 배열은 1~3단으로 국한이지 4단은 없다. 그래서 모바일에서는 숫자와 기호를 섞어 쓰는 것조차도 매우 심하게 불편해진다. 인터넷 URL 내부에 무심코 들어있는 숫자가 유난히도 입력하기 귀찮고 성가시게 느껴지는 건 PC에서는 접하지 못했던 경험이다.

내가 예전에도 잠시 글로 썼듯이, 스마트폰에서는 두벌식 세벌식 논쟁도 PC에서와 같은 의미는 사실상 없다. 마치 유니코드 앞에서 조합형 완성형 논쟁이 김이 확 빠지고 의미가 없어진 것과 비슷한 맥락이랄까. 어차피 열 손가락으로 제대로 된 타자를 할 수가 없고 장타도, 모아치기도 필요 없으며, 세벌식은커녕 두벌식을 집어넣기에도 화면이 부족한 공간에서 굳이 세벌식에 연연할 필요는 없기 때문이다.

모바일은 두벌식이고 세벌식이고를 떠나서, 두벌 세벌 논쟁의 주 무대이던 타자기 식 글쇠배열 패러다임 자체가 존재하지 않는다. 하지만 죽이 됐든 밥이 됐든 어떻게든 글쇠를 구겨 넣어서 스마트폰에서도 “도깨비불 현상이 일어나지 않는” 원론에 충실한 한글 입력 방식이 좀 있긴 해야 할 것 같다. 신세벌식 같은 글쇠 중첩은 확실히 이런 데서 좋은 방안이 될 수 있을 것이다.

내 직업병이다 보니 문자 입력 얘기가 또 길어져 버렸다.
피처폰에서 스마트폰으로 갈아타면서 굉장히 아쉬워진 것 중 하나는 역시나 배터리 용량이다. 하루를 놔 두니까 진짜 배터리의 절반이 싹 소모되어 버린다. 매일 충전 안 하면 못 견딜 것 같다.

과거의 피처폰은 송· 수신 안 하고 가만히 놔 두면 이틀을 놔 둬도 세 칸이 그대로 유지되었었다.
지난 가을에 회사 야유회로 제주도로 놀러 갔을 때, 본인은 전화기를 완전히 충전시켜 놓은 채로 그대로 가져서 2박 3일을 잘 버티고 돌아왔다. 별도의 충전기를 챙겨 가지 않았다. 제주도까지 가서 딱히 전화질을 할 일도 없을 테니 말이다.

그러나 스마트폰을 쓰는 다른 사람들은? 어림도 없는 소리였다. 숙소에서 하루가 멀다 하고 틈만 나면 자기 전화기를 충전하려고 방의 콘센트마다 난리가 났었다. 멀티탭을 챙겨 다녀야 할 지경이다. 그리고 이제 나도 스마트폰 세상에 끼어든 이상 이 대열에 합류하게 됐다.

난 휴대전화는 모름지기 통화 품질 좋고 배터리 오래 가고, 충격에 강하고 튼튼하면 장땡이라고 생각했다. 하지만 스마트폰은 통화 품질은 모르겠지만 고가의 컴퓨터와 디스플레이와 네트워크 장비를 내장하느라 내구성은 오히려 떨어지고 배터리 많이 먹는 방향으로 변화한 게 틀림없으며, 그건 나로서는 아쉬운 점이다.

아무튼, 난생 처음으로 써 보는 스마트폰은 내 삶의 양상도 앞으로 적지 않게 바꿔 놓을 것 같다. 다만, 내가 앱을 본격적으로 만드는 날이 과연 올지는 모르겠다. 현실은 PC에서 윈도우 8 메트로 따라가는 것만으로도 벅찰 테니.

내가 비록 PC는 맥북을 갖고 있지만 스마트폰은 안드로이드 계열이 선택되었다. 요즘 IT 트렌드를 잘은 모르겠지만, 스티브 잡스 옹의 별세 이후 애플이 잡스 시절의 영광을 재현하지 못하고 어영부영 중이라는 건 틀림없어 보인다. 지인 중에는 아이폰 쓰다가 답답함을 견디지 못하고 다시 안드로이드로 갈아타는 사람까지 있다.
차라리 애플 계열의 모바일 제품은 더 나중에 아이패드를 써 볼까 싶은데, 이건 언제쯤 지르게 될지 아마 까마득히 먼 미래의 일이 되지 않을까 싶다. ㅎㅎ

그나저나, 스마트폰을 장만한 뒤에도 KT를 사칭하는 스마트폰 교체 광고 전화는 시도 때도 없이 걸려 온다.
재고 단말기들을 처분 못 해서 이 인간들이 정말 난리인가 보다.

Posted by 사무엘

2012/11/24 08:35 2012/11/24 08:35
, ,
Response
No Trackback , 15 Comments
RSS :
http://moogi.new21.org/tc/rss/response/760

두벌식과 세벌식 한글 입력 방식을 제각각 가장 극단적인 FM 형태로 디자인해 보면, 다음과 같은 재미있는 차이를 발견할 수 있다.

세벌식은 초성 결합 지향적이고,
두벌식은 종성 결합 지향적이다!

공 병우 세벌식에서 가장 극단적인 FM을 추구한 입력 방식은 바로, 이중모음 정석이 강요되고 겹받침 조합이 없이 모든 겹받침을 반드시 Shift+한 타로만 치게 되어 있는 세벌식 최종이다.

즉, 이 입력 방식에서는 초성 쌍자음을 해당 자음의 연타로 입력하고, 중성 겹모음은 겹모음용 전용 ㅗ와 ㅜ를 통해서만 제한적으로 입력한다. (ㅢ도 반드시 8로만 한 타에 입력해야 하고, ㅡ+ㅣ로는 입력할 수 없음) 끝으로 종성에는 낱자 결합 규칙이 아예 존재하지 않는다.

이런 제약이 존재하는 덕분에 이 입력 방식은 기계식 타자기와 100% 싱크가 가능하다.
세벌식 기계식 타자기는 글쇠가 종이에 찍히는 초점이 두 군데 있으며, 글쇠도 부동(不動)키와 동(動)키로 나뉜다. 초성과 일반 모음들은 동키이고, 겹모음용 ㅗㅜ와 종성은 부동키이다. (한 글쇠에서 아랫글쇠는 동키, 윗글쇠는 부동키가 되는 경우를 대비해 복잡한 지침이 있긴 한데, 이에 대한 자세한 설명은 이 자리에서 생략)

부동키는 글쇠를 찍은 뒤에도 종이가 이동하지 않기 때문에, 당연히 기계식 타자기에서 낱자 결합용으로 쓰일 수 없다. 초성이야 동키이기 때문에 연타로 아쉬운 대로 쌍자음을 표현할 수 있는 반면, 종성은 그렇게 할 수 없는 것이다. 게다가 이미 중성과 종성을 모두 왼손이 담당하고 있다는 특성상(글쇠가 오른쪽에서 왼쪽으로 흐르는 배열인 것도 기계 친화적인 이유가 있음), Shift+한 타로 겹받침을 누르는 것은 왼손의 연타 부담을 경감하는 데도 도움이 된다.

이런 심오한 이유 때문에 공 병우 세벌식은 초성 쌍자음만을 연타로 입력하고 나머지 중성과 종성은 연타를 최소화하는 쪽으로 발전했다.

그에 반해 가장 FM에 충실한 두벌식은 <날개셋> 한글 입력기 6.7에서 추가된 종성 지향 두벌식처럼 자음은 모든 문맥에서 종성과 같은 형태로 결합하는 입력 방식이다.

아래아한글 같은 일부 프로그램의 한글 입력 방식에서는, 두벌식도 마치 세벌식처럼 초성과 종성의 낱자 결합 규칙이 따로 적용되어서 쌍자음을 해당 자음의 연타로 입력할 수 있는 구현체가 있다. 그러나 FM대로라면 초성이든 종성이든 쌍자음은 반드시 Shift+한 타로 입력해야 한다. 애초에 '국가'와 '구까'를 모두 구분하여 연달아 입력하려면 쌍자음은 그렇게 입력해야만 한다.

따라서 두벌식은, 겹받침을 Shift+한 타로 입력하는 세벌식과는 정반대로 초성 쌍자음을 Shift+한 타로 입력하며, 초성에 낱자 결합 규칙이 존재하지 않는다. 흥미로운 사실이 아닐 수 없다.

다만, 세벌식은 그런 극단적인 이념을 추구함으로써 컴퓨터와 기계식 타자기 사이의 글자판 통일을 이루었으며, 기계적으로 유리한 점과 빠르고 편한 타자 사이의 상당히 괜찮은 합의점까지 잘 찾아 낸 반면, 두벌식은 그런 일관성과 통일성이 없다.

두벌식 타자기는 어차피 받침은 Shift부터 반드시 먼저 누르고 쳐야 하기 때문에 치는 방식이 컴퓨터와 다를 뿐만 아니라, 결국은 ㄲ과 ㅆ, 그리고 자주 쓰이는 겹받침이나 겹모음은 예쁜 자형으로 찍기 위해 별도의 글쇠로 따로 있어야 할 수밖에 없다.

단적인 예로, 똑같이 한 타로 입력하는 겹자음이라도 ㄲ과 ㅆ은 초성과 종성에서 모두 쓰이지만, 나머지 ㄸ, ㅃ, ㅉ은 초성에서만 쓰인다. 이것을 기계식 타자기로 어떻게 구분하겠는가? 게다가 Shift+ㄱ은 어차피 ㄲ이 아니라 초성 ㄱ과 받침 ㄱ을 구분하는 데 써야 하는데? 결국은 겹자음의 처리가 두 그룹이 서로 달라질 수밖에 없다. 두벌식으로는 기계간의 글자판 통일을 이루는 게 불가능하다는 게 이 말이다.

두벌식에 대한 이해도가 깊어지니 그 반대편에 있는 세벌식에 대해서도 예전보다 더 잘 알게 되는 것 같다. 내가 다시 말하는데 그 알량한 글쇠 수 좀 줄이려고 PC에서 한글을 두벌식으로 쓰는 건 너무 아깝다. 얻는 것보다 잃는 게 너무 많다.

두벌식이 완전 백해무익한 쓰레기라는 말이 아니라, 가능한 한 세벌식이 엄연히 main이 되고 두벌식은 sub가 되어야 한다는 뜻이다. 세벌식으로는 간단한 기본 오토마타를 토대로 하여 더 발전하는 응용이 가능한 반면, 두벌식은 지금 있는 꼼수를 체계화하는 데에만 온갖 노력을 들여야 한다. 내 학위 논문이 주장하고자 한 바가 바로 이것이다.

여담이지만 컴퓨터 소프트웨어의 아이콘에서 '한글'을 나타낼 때 쓰는 한글 글자는 대개 '가' 아니면 '한'이다. <날개셋> 한글 입력기는 이를 모두 활용하며, 현 글자판이 세벌식으로 판단되면 '한'이 나오고, 두벌식이면 '가'가 나온다. 꽤 옛날 버전부터 이어져 온 관행인데 이게 나름 합리적인 디자인인 것 같다.

Posted by 사무엘

2012/10/24 08:18 2012/10/24 08:18
, ,
Response
No Trackback , 11 Comments
RSS :
http://moogi.new21.org/tc/rss/response/747

1.

<날개셋> 한글 입력기는 제어판에서 불러다가 곧장 쓸 수 있는 20여 개의 다양한 예제 입력 방식들을 덩달아 제공하고 있다.
6.7 이후 다음 버전에서는 예제 데이터에 아래와 같은 여러 변화가 생길 예정이다.

- 6.7에서 잘 알다시피 종성 지향 두벌식을 활용하여 'MS 두벌식'이라는 유형 파일이 추가되었는데.. 여기에다가 한글 자모 외의 숫자와 기호는 글쇠를 먹지 않게 하는 입력 스키마 설정도 추가했다. (지난 6.5에서 추가된 글쇠 인식 customize 기능으로) 어차피 시스템의 영문 글자판과 똑같은 글자는 IME가 입력시키는 게 아니라 아예 글쇠 자체를 가로채지 않고 응용 프로그램으로 넘겨 준다는 뜻.
이것까지 갖춰 주면 진짜 MS IME와 고증이 100% 일치하게 된다. 특히 외부 모듈에서 말이다.

- 네벌식이 글쇠배열 *.key이 아니라 오토마타와 낱자 결합 규칙을 갖춘 유형(*.ist) 파일로 승격되었다.
받침을 입력하려면 모음을 아무 모음이나 써도 되는 게 아니라 타자기 설계 차원에서 받침용으로 의도된 모음을 써야만 하며, 그렇지 않으면 받침은 다음 글자로 튕긴다.

모음의 용도를 구분하는 건 다양한 방법으로 할 수 있다. 비받침용 모음은 0으로 대응하는 가상 받침을 같이 입력되게 하여 여타 받침과의 결합을 차단시킬 수도 있는데, 본인의 경우 두벌식 모음과 세벌식 모음으로 구분하여 오토마타가 O 변수를 써서 구분하도록 하는 방법을 썼다.

이 외에도 네벌식 오토마타는 초+중(+종)과 중+종은 허용하지만, 초에서 바로 종은 허용하지 않게 설계되어 있다. 97 이전의 도스용 아래아한글이 이런 오토마타를 갖추고 있었다. 또한 ㅒ, ㅖ가 바로 입력 가능하지 않다는 특성상 ㅑ+ㅣ, ㅕ+ㅣ로 해당 모음을 입력할 수 있게 했다.

네벌식은 그나마 옛날 타자기 표준이라는 역사적인 의미가 있고, <날개셋> 기능 활용면에서 의미가 있어서 추가했을 뿐, 타자 관점에서 효율적인 입력 방식은 절대로 아니다. 특히 공 병우 세벌식에 비하면 이런 허접하고 불편한 타자기로 한글 입력을 해야 했을 옛날 타자수들을 생각하면 그저 안구에 습기가 찰 뿐이다.

- 일명 '한소프트 세벌식'과, '드보락 호환 두벌식' 글쇠배열은 효용성이 떨어진다고 판단하여 삭제했다.
특별히 '한소프트 세벌식'에 대해 보충 설명을 하자면, 정체가 불분명하고 원문 자료를 제공하던 사이트도 운영이 중단되어 접속이 불통된 지가 이미 수 년이 지난 상태이다. 글쇠배열도 어차피 그리 잘 만들어진 것도 아닌지라 퇴출을 결정했다. 특히 숫자를 저렇게 Shift를 누른 채 양손으로 입력하게 해 놓으면 도대체 어쩌라는 건지? -_-

2.

현재 '세벌식 순아래' 글쇠배열이라는 게 있어서 예제 파일도 아니고 아예 프로그램에 내장되어 있는 배열 중 하나이다.
그러나 이것은 장기적으로는 *.key 급으로 격하될 예정이다. 내장 데이터로 쳐 주기에는 너무 듣보잡화해 있기 때문이다.

공 병우 박사의 이념을 물려받은 권위와 정통성 있는 세벌식 연구 기관에서--한글 문화원이라든가, 한글 문화원이라든가...-- 앞으로 390과 최종을 통합하는 새로운 세벌식 표준안을 제정한다면, 그 새 배열이 지금 순아래가 있던 자리를 대체하게 될 것이다.

그리고 그 통합안은 더 장기적으로는 390을 또 대체하게 될 수도 있다. 과거에 390이 389를 대체했듯이 말이다.
통합안은 기호 문제 때문에 최종보다는 390에 훨씬 더 가깝게 만들어질 것이다.
그 반면 2000년대부터 세벌식을 접한 사람들은 390보다는 최종이 더 많다. 본인도 최종 사용자.
최종은 27개 겹받침 모두 수록이라는 궁극의 아킬레스건이 있기 때문에 상징적인 의미가 크며, 통합안이 나온 뒤에도 별도로 존속할 가능성이 높다.

이런 이유로 인해, 기존 390 사용자들만 통합안으로 갈아타면, 최종과는 달리 390은 존재의 의미를 상실하여 역사 속으로 사라지게 될 것이다. 이것이 나의 짧은 생각이다.

3.

내 프로그램에는 역사적으로나 설계 방식면에서 의미가 있는 세벌식 글쇠배열 몇 개가 key 파일로 제공되고 있다. 세벌식 389는 받침 배열이 390과 최종의 짬뽕 같으면서도 숫자가 노트북 PC의 키패드 배열과 일치한다는 특징이 있으며, '송 영상'(닉: 길동무)이라는 분이 고안한 영상 세벌식은 세벌식계의 떡밥인 왼쪽부터 시작하는 세벌식을 나름 독창적으로 구현한 배열이다.

누가 만들었는지 모를 왼손/오른손 세벌식은 no shift로도 모자라서 진짜 말 그대로 한 손으로 타자를 치는 것에 특화되어 있다. 내가 알기로 영문 드보락 자판에도 이런 왼손/오른손 변종 배열이 있다. 아마 옛날에 도스용 에디터 같은 데서 이것저것 수집한 자료이지 싶다.

이런 것들은 역사적인 의미 외에 실용적으로 쓰일 가능성이 높지 않으며, 오토마타나 낱자 결합 규칙 같은 것도 그냥 일반적인 PC용 한글 입력기의 설정을 그대로 가져와 쓰는 것만으로도 충분하기 때문에, 유형 파일이 아니라 글쇠배열 형태로만 간단히 제공된다.

4.

현재 프로그램이 기본 제공하는 예제 입력 방식이 20여 개가 있다지만, 파일 하나가 겨우 몇백~몇천 바이트밖에 하지 않으니, 다 합쳐도 크기는 3만 바이트가 채 되지 않는다.
본인은 <날개셋> 한글 입력기의 사용자가 만든 UCC..는 아니고 UCI (user-created input methods) 데이터를 받는다.
마음에 드는 건 프로그램의 다음 버전에다 같이 수록도 흔쾌히 해 줄 것이다. 사실은, 이런 데이터만 공유하는 커뮤니티가 좀 있으면 좋겠다.

선정 기준은 다음과 같다. 하나 이상을 잘 만족하면 된다.

- 아이디어가 기술적으로 독창적일 것: 복벌식이나 신세벌식 같은 것. 이런 식으로 <날개셋>의 조건부 수식과 오토마타, 가상 낱자, 더 나아가 특수 글쇠 따위를 잘 활용하여 두벌식과 세벌식 사이를 왔다 갔다 하는 독창적이고 기발한 한글 입력 방식은 얼마든지 웰컴이다. 수록 0순위임. 다만 한 아이디어 당 한 개, 많아야 두 개로 국한임.

- 역사적 가치가 있거나, 인지도· 권위가 있을 것: 역사성이라 함은 앞서 언급했던 여러 legacy 세벌식 글쇠배열 말이다. 아니면 다수가 쓰거나 명목상의 표준이기라도 해야 한다.
북한 국규 표준은 나름 그쪽에서 권위를 가지고 통용되는 입력 방식이니, 통일을 대비해서라도 예전에 key로만 제공되던 것을 최근에 완전한 유형 형태로 격상했다. 아래아한글 97과 맥 OS, MS 두벌식 같은 기존 메이저 소프트웨어가 미묘하게나마 차이가 존재하는--그것도 오토마타 차원에서!-- 독창적인 한글 입력 방식을 제공하는 것도 바람직한 일이다.

휴대전화용 3대 표준 입력 방식(천지인, 이지한글, SKY-II)은 기술적 독창성과 권위를 모두 갖추고 있으니 두 말할 나위도 없이 수록이다. 사실 이것들을 포인팅 장비로 써 볼 수 있는 보조 입력 도구(패드)도 만들어야 하는데, 아직 6.7에서는 숙원을 못 풀었다.

- 타자 행동 관점에서 아주 효율적이거나 독창적일 것: 모바일용 입력 방식은 워낙 기술적인 메커니즘이 많은 반면, PC용 입력 방식은 딱히 그런 trick은 없이 그냥 글쇠배열 논쟁으로 흐르는 경향이 있다.
역사적인 뿌리나 인지도가 없고 그렇다고 기술적인 독창성도 없는 마이너 글쇠배열이 <날개셋>의 예제로 등재되기 위해서는 진짜 타자 효율이라도 압도적으로 좋다는 증거가 있어야 한다. 그게 아니면 순아래/한손 배열처럼 장애인 접근성 분야라도 파든가.

'영상 세벌식'은 타자 능률까지는 모르겠지만 왼쪽에서 오른쪽으로 흐르는 세벌식이라는 점이 독창성을 인정받아 예제 데이터로 수록되어 있다. 앞서 말한 기술적인 독창성 말고, 배열 자체가 독창적이라는 뜻이다.

- 한글 입력과 관련된 실생활에서 유용할 것: <날개셋> 한글 입력기는 기본적으로 한글 입력에 특화되어 있기 때문에 예제 데이터도 한글 입력 방식을 우대함을 원칙으로 한다. 한글이 아닌 문자는 한국 문화권에서 한글과 같이 즐겨 쓰이는 문자들로 국한한다.

가령, 일본어 문자는 아무래도 아랍· 태국-_- 문자보다야 한국에서 더 친숙하며, <날개셋> 고급 입력기의 사용자 정의 조합 기능을 이용해서 간단히 커버 가능한 예이기 때문에 히라가나와 가타카나가 모두 수록되어 있다. 구결도 마찬가로 국어 정보학 분야에서 유용하기 때문에 수록이다.
콜맥 글자판은 한글 입력과 관계가 없는 영문이지만, 드보락 다음으로 나름 인지도가 있는 마이너 배열인지라 영문 배열은 딱 하나만 선택해서 넣었다.

이상으로 내가 예제 입력 데이터를 선별하여 수록하는 대원칙을 공지했다.
저런 조건 중 하나 이상을 만족하고 기존 예제들과도 완전히 다른 입력 방식이 과연 얼마나 있을지는 잘 모르겠지만, 내 프로그램을 통해 여러 창의적인 한글 입력 방식이 많이 만들어지고 쓰이면 좋겠다.

<날개셋> 한글 입력기는 한글 입력과 관련된 그런 지적 재산들을 모두 구현하고 관리할 수 있는 프로그램이니 말이다.
그런 기반을 마련하기 위해 초창기엔 가장 엄밀한 극단이라 할 수 있는 공 병우 세벌식부터 추구한 뒤, 점차 더 generic한 쪽으로 내려오고 있는 중이다.

여담이지만, '한글 로마자 입력 방식'처럼, 그 자체가 한 입력 방식이 아니라 특정 포괄적인 아이디어 하에서 세부적으로 다양한 입력 방식이 파생되어 나올 수 있다면, 그건 유형 파일이 아니라 아예 별도의 '빠른설정'이라는 플러그 인 프로그램이 담당하게 된다.

Posted by 사무엘

2012/09/13 19:18 2012/09/13 19:18
, , ,
Response
No Trackback , 6 Comments
RSS :
http://moogi.new21.org/tc/rss/response/732

<날개셋> 한글 입력기를 오래 써 본 분들은 아미 아시겠지만, 이 프로그램에서 두벌식 글자판의 자음 글쇠는 내부적으로 다음과 같은 수식으로 표현된다.

T<=1 ? 초성: 종성

그래서 ㄱ을 예로 들면,

T<=1 ? H2|G_: H2|_G

그 반면, 세벌식 글쇠는 간단하게 해당 자모 하나로 끝이다.

H3|G_ (초성 ㄱ) 아니면
H3|_G (종성 ㄱ)

H3은 세벌식 자모를, 그리고 H2는 두벌식 자모를 뜻하는 날개셋문자 접두사이다. G는 ㄱ을 뜻한다. 다만 알파벳 한 글자만 있으면 변수와 구분이 되지 않기 때문에 부득이 뒤에 _가 추가되었다.

종성은 앞에 _를 추가하는 것으로 초성 명칭과 구분한다. 그리고 이렇게 하는 것만으로 명칭의 길이가 두 글자를 넘어섰으므로 뒤에 별도로 또 _를 추가하지는 않는다. <날개셋> 한글 입력기의 헤비 유저라면 이 정도 수식은 이미 다 익숙할 것이다.

두벌식에서 번거롭게 수식이 추가된 이유는 한 글쇠가 상황에 따라 초성 역할도 하고 종성 역할도 해야 하기 때문이다. 오토마타에서 1번 상태는 통상 초성을 첫 입력받은 상태이기 때문에 그때까지는 ㄱ을 초성으로 내보내고, 중성이나 종성이 입력된 뒤부터는 종성으로 내보내라는 뜻이다. 한 마디로 말해 두벌식 타자기에 존재하던 ‘받침’ 글쇠를 이 수식이 담당한다고 생각하면 된다.

세벌식이 아닌 두벌식 자모는 종성을 처리할 때 세벌식 자모에 비해 다음과 같은 두 가지 추가 작업이 행해진다. 두벌식 글자판에서 한글이 입력되는 과정을 생각해 보면 자명한 것들이다.

첫째, 두벌식 종성 다음에 두벌식 중성이 이어지면, 잘 알다시피 도깨비불 현상이 일어난다. 직전에 입력되었던 마지막 종성 한 타가 다음 글자의 ‘초성’이 되고, 그 글자와 중성이 한데 결합한다.

둘째, 두벌식 종성이 계속 입력되었는데 기존 종성과 새 종성이 결합이 불가능하면 새 종성은 다음 글자의 종성이 아니라 ‘초성’으로 넘어간다.


두벌식을 세벌식에다가 추가적인 처리를 덤으로 하는 관점에서 한글 입력기를 설계하면 대체로 이런 식의 구현체가 나온다. <날개셋> 한글 입력기도 그렇고 아래아한글도 그렇고, 심지어 맥 OS의 한글 입력기도 그러하다.

특히 맥 OS는 두벌식과 세벌식의 낱자 결합 규칙이 완전히 동일하다. 초성은 쌍자음을 원시 자음의 연타로 입력할 수 있는 반면 종성(ㄲ, ㅆ)은 그렇게 할 수 없는 것이 둘 모두 똑같다. 초성의 결합 규칙과 종성의 결합 규칙이 분명히 구분되어 있으며, 두벌식에서 다음 음절로 이어진 첫 자음도 응당 초성으로 간주된다.

그런데 ‘초성’이 아닌 ‘종성’ 관점의 두벌식 한글 입력 방식도 생각할 수 있으며, 사실 이것이 초성과 종성의 구분이 없는 진정한 두벌식다운 두벌식이라 할 수 있다. 이 사상이 반영된 구현체는 마이크로소프트 Windows의 한글 IME가 유일하다.

MS IME의 두벌식은 초성과 종성의 구분이 없고 자음 입력은 어떤 경우에든 종성 문맥으로 간주된다. 그렇기 때문에 모음 없이 자음을 바로 입력할 때도 ㄳ, ㄻ 같은 겹자음을 만들 수 있다. 심지어 그 상태에서 ‘ㄱ (ㅏ) 가 (bksp) ㄱ (ㅅ) ㄳ (ㅗ) ㄱ소’ 같은 자유로운 입력도 가능하다.

이것은 <날개셋> 한글 입력기에서는 지금까지 가능하지 않았다. 수식 없이 H2|_G 같은 기존 두벌식을 종성만 배당하면, 모음 없이 당장 겹자음을 만드는 것을 비슷하게 흉내는 낼 수 있다. 그러나 완전히 똑같게는 못 한다. 계속해서 다음 음절로 입력되는 자음은 어차피 종성이 아니라 초성이 되어 버리고, 종성의 낱자 결합 규칙이 적용되지 않기 때문이다.

또한 두벌식 종성으로 자음, 그 다음으로 모음을 입력한 뒤 Bksp를 눌러 보면, 첫 타에 해당하는 자음은 종성이 아니라 초성으로 바뀌어 있는 것도 볼 수 있다. 내부적으로 두벌식 종성과 두벌식 중성 사이에는 도깨비불 현상이 한번 일어나서 종성이 초성으로 넘어간 걸로 간주되기 때문이다.

이 문제를 해결하고 종성 위주 두벌식을 도입하기 위해, 본인은 <날개셋> 한글 입력기의 어느 부분을 개량하면 좋을지 굉장히 많이 고민했다. 기존 패러다임과 새 패러다임을 어떻게 조화시킬까?
어느 구조체를 확장할까, 어느 API에다 옵션 플래그를 추가할까, 아예 날개셋문자에다가 새로운 타입을 추가할까..? 이런 결정을 내려야 할 때가 정말 내가 엔지니어로서 현역이고 살아 있음을 느낀다.

API 호환성을 깨뜨리지 않고 가장 후폭풍이 적은 방법을 며칠간 고민하던 중, 결국은 날개셋문자에다 타입을 추가하는 게 가장 바람직하겠다는 결론을 도출하였다. 그래서 H2에 이어 일명 H2J라는 타입이 도입되었다. 일명 ‘두벌식 종성’ 타입. <날개셋> 한글 입력기 다음 버전인 6.7에서 바로 볼 수 있을 예정이다.

현재 한글 입력과 관련된 날개셋문자 타입은 H3과 H2 말고도 H3의 자매격에 해당하는 다중 자모가 둘 더 있다. <날개셋> 한글 입력기는 기존 H3만으로도 ‘ㅏ+종성ㄴ’ 같은 다중 자모를 배당할 수 있다. 초성 ㄱ을 입력 중에 저걸 누르면 곧바로 ‘간’이 되고, ‘오’를 입력하던 중에 저걸 누르면 곧바로 ‘완’이 된다. 다중 자모는 동시치기 같은 것과는 전혀 다른 개념이므로 그런 것과는 절대로 혼동하지 말라.

그런데 디폴트인 H3은 ‘초-중-종’을 순서대로 적용하는 반면, 여타 다중 자모는 ‘중-종’만 적용 후 음절을 끊고 다음 글자 초성을 또 입력시키거나 ‘종’만 적용 후 ‘초-중’은 다음 글자로 넘긴다. 세벌식은 음절 경계와 관련된 변칙적인 처리가 없으니 이런 다중 자모까지도 생각할 수 있는 반면, 두벌식은 다중 자모까지는 갈 수 없고 음절 경계 처리에만 치중한 파생 타입만을 생각할 수 있는 셈이다.

‘두벌식 종성’ 타입으로 입력된 종성은 도깨비불 현상이나 결합 실패로 인해 다음 글자로 넘어갈 때 초성으로 바뀌는 게 아니라 종성이 그대로 유지된다. 그리고 그 상태에서 중성을 입력하더라도 종성은 초성으로 바뀌지 않고 종성 상태로 그대로 보존된다.

이 타입을 쓰면 두벌식으로도 자음을 배당할 때, 골치 아픈 수식을 쓸 필요 없이 언제나 마치 세벌식처럼 H2J|_G라고 언제나 종성 형태만 넘겨 주면 끝이다. 다만, <날개셋> 편집기처럼 초-중-종성의 형태를 완벽하게 보존하는 한글 글꼴 체계에서는 처음에 초성을 입력했는데 초성이 아니라 종성이 나타나기 때문에 마치 도깨비불 현상만큼이나 보기가 어색할 것이다.

이 어색함은 표준 한글 자모를 호환용 한글 자모로 치환해서 표시해야 덜해진다. 즉, 애초에 초성과 종성의 구분이 없는 글자판은 역시나 초성과 종성의 구분이 없는 글자 코드와 글꼴을 동반해야 자연스럽다는 뜻. 실제로는 한글의 구성 원리를 어기고 전혀 자연스럽지 않은 처리가 추가로 행해지는 셈이다. 오버헤드는 ‘세벌식 < 기존 세벌식 관점에서 추가로 구현된 두벌식 < 새로 도입된 종성 지향 두벌식’의 순으로 많아진다.

H2J 타입을 쓰면 <날개셋> 한글 입력기로도 MS IME의 두벌식과 완전히 동일하게 동작하는 입력 방식을 구현할 수 있다. 사실 내 프로그램은 세벌식 자판과 관련된 응용 기능들은 거의 1.x 시절부터 제공해 온 반면, 두벌식을 두벌식답게 지원하는 편의 기능들은 훨씬 나중에 도입되어 왔다. 특수 도깨비불 규칙(3.9부터)이라든가, 초-종성 공유 낱자 결합 규칙(6.0)에 이어, 종성 지향 두벌식(6.7)의 순이다.

알면 별로 어려울 것 없는 내용인데 이 글 내용을 제대로 이해한 분이 얼마나 되려나 모르겠다. <날개셋> 한글 입력기는 올해로 개발 12주년이고 무려 7.0을 바라보는 시점인데 아직도 한글 입력의 본질과 관련된 새로운 기능이 추가되고 향상된 게 있다는 게 내게는 무척 흥미롭고 의미심장하게 느껴진다.

Posted by 사무엘

2012/08/08 08:20 2012/08/08 08:20
, , , ,
Response
No Trackback , 6 Comments
RSS :
http://moogi.new21.org/tc/rss/response/717

1.

<날개셋> 한글 입력기는 잘 알다시피 글쇠배열 수준을 넘어서 한글 조합 로직을 완전히 외부에 expose하고 사용자가 이를 입력 옵션의 일부로서 마음대로 고칠 수 있는 유일한 한글 입력 프로그램이다.

한글 조합 로직은 전산학에서 오토마타라고 불리는 '정규 문법'(regular grammar)으로 흔히 모델링되며, 보통은 그 알고리즘이 해당 한글 입력 프로그램의 소스 코드 내부에 복잡한 switch문의 형태로 하드코딩되어 있다. 그러나 <날개셋> 한글 입력기는 그렇지 않으며, 아예 C언어 수식의 문법 형태로 오토마타를 사용자가 일일이 지정이 가능하다.

정규 문법은 옛날에 1996년도 한국 정보 올림피아드 경시부(본인이 그 시절에 정올 공부를 한 세대여서.. ^^)에서 출제되었던 잠수함 코드 식별 문제와 같은 차원의 난이도이다. 주어진 규칙대로 상태를 쭉쭉 switch해 나가다가 코드가 yes로 끝나면 잠수함이고, 그렇지 않으면 noise이다. 한글 입력 오토마타도 그런 수준이라는 뜻이다.

첨언하자면, 이것보다 한 단계 더 복잡한 차원의 문법은 그 이름도 유명한 문맥 자유 문법(CFG)이다. 이제는 다단계의 여닫는 식별 부호를 재귀적으로 처리할 정도가 되어야 하고, 제대로 파싱하기 위해서는 스택이 필요하다. 여기서 스택은 한글 입력 순서를 기억하는 그런 스택이 아니라, 각 재귀 단계별 상태를 기억하기 위한 스택이다. 정규 문법이 Windows의 INI 파일 정도의 복잡도라면, 문맥 자유 문법은 XML 정도 된다고 보면 된다.

전산학 전공자라면 데이터 구조 시간에 복잡한 괄호와 연산자가 들어간 수식을 처리하는 프로그램을 만든 적이 있을 텐데, 그게 바로 간단한 문맥 자유 문법을 인식하는 프로그램을 구현해 본 것이다. 그러나 한글은 초-중-종성으로만 구성되지 '초성-여는 중성-종성-닫는 중성'이라든가, '여는 초성-중성-여는 종성-닫는 종성-닫는 초성' 처럼 글자 자체가 재귀적으로 이상하게 전개되는 형태는 아니므로, CFG가 아닌 정규 문법만으로 표현이 충분히 가능하다.

사람이 다루는 자연어든, 컴파일러가 다루는 프로그래밍 언어 소스가 아니어도, 컴퓨터라는 계산 기계가 인식과 생성과 처리 가능한 모든 파일 포맷은 결국 이런 문법으로 formal하게 생성 규칙을 나타낼 수 있으며 그럴 수밖에 없다. 텍스트 파일이든, 그래픽 포맷이든, 심지어 기계어 코드의 포맷이든 말이다. 그래서 오토마타 이론은 전산학에서 매우 중요하게 다루어진다.

2.

다시 본론으로 돌아와 한글 입력기 얘기를 계속하겠다.
한글 입력기도 구현체가 제각각이기 때문에 프로그램마다 동작 방식이 대동소이한 차이가 있었다. 예를 들어 “중성+종성 형태의 미완성 한글의 입력이 가능한가? 그리고 세벌식의 경우 초성+종성 미완성 한글도 입력 가능한가?” 하는 것 말이다. 오토마타는 바로 이런 세밀한 로직을 바꿀 수 있다.

아래아한글은 도스용 3.x까지만 해도 그런 게 가능하지 않다가 윈도우용으로 넘어오면서 어느 샌가 미완성 한글의 표현이 가능해졌으며, 특히 97 때는 전무후무하게 초-종-중 순의 입력도 가능해서 아주 초보적인 형태의 모아치기까지 지원했었다. 그게 워디안 이후부터는 다시 없어졌지만 말이다.

<날개셋> 한글 입력기는 그런 것들을 구분하기 위해서 일반적인 이어치기 오토마타뿐만이 아니라 미완성 한글의 입력을 불허하는 오토마타도 따로 갖추고 있다.
PC 환경이 도스에서 윈도우로 넘어가면서 한글 코드의 주류도 조합형에서 완성형으로 넘어갔다. 완성형은 구조적으로 낱자의 초성과 종성을 구분하는 게 불가능하고 미완성 한글도 표현할 수 없기 때문에, 한글 입력 오토마타도 그에 맞춰서 설계되는 게 불가피했다.

그런데 맥 OS가 제공하는 한글 입력기는 동작 방식이 흥미롭다. 두벌식은 별 차이가 없는데 MS의 한글 입력기와 큰 차이를 보이는 부분은 세벌식이다.
오토마타가 '미완성 한글을 허용 안 하는 이어치기'의 변종이다. 초성과 중성의 단독 입력은 허용하지만, 종성 단독이나 여타 미완성 한글의 입력은 아예 무시하여 허용하지 않는다. 또한 받침 ㄲ, ㅆ은 ㄱ, ㅅ의 연타로 입력을 못 하고 반드시 한 타로만 쳐야 한다.

입력 무시는 <날개셋> 한글 입력기의 오토마타에서 -1이라는 음수 상태로 정의되어 있으므로 이런 입력 로직도 <날개셋> 한글 입력기로 어렵지 않게 구현할 수 있다.

0 → A ? 1 : B ? 3 : C ? -1 : 0
1 → A ? 1 : B ? 2 : C ? -1 : 0
2 → B ? 2 : C ? 4 : 0
3 → B ? 3 : C ? -1 : 0
4 → C ? 4 : A|B ? 0 : -1

초기 상태에서는 종성 C만 -1로 빠지게 하여 무시하면 된다. 그리고 초성이 입력된 상태인 1번 상태에서도 C만 무시하면 된다.
초성과 중성이 모두 입력된 2번 상태에서만 종성의 입력이 허용되며, 이 경우 오토마타는 4번 상태로 가게 된다.
중성만 단독으로 입력된 상태인 3번에서도 중성만 동일 상태로 받아들이면 되고 종성은 여전히 무시한다. (C ? -1: 0)

끝으로 문제가 되는 건 초-중-종성이 모두 입력된 4번 상태이다. 받침 ㄴ+ㅎ=ㄶ 같은 결합은 계속 허용해야 하지만 더 결합할 수 없는 받침은 입력을 무시해야 한다. 그리고 초성과 중성은 다음 글자로 입력을 받아들인다. 이 상태를 어떻게 표현하면 좋을까?

<날개셋> 한글 입력기는 오토마타로부터 양수 상태값을 얻어서 결합 가능 승인은 받았지만 실제로는 낱자 결합 규칙이 존재하지 않아서 추가 결합이 불가능해진 낱자가 발견될 경우, 성분 변수 A~C에다가 모두 0을 집어넣어서 해당 상태에 대한 오토마타 함수값을 다시 구한다. 그렇기 때문에 C에 값이 있을 때는 일단 4번 상태를 계속 유지하게 하되, 초성이나 중성에 값이 있으면(A|B) 다음 글자로 넘어가서 조합을 진행하게 하고(0), 진짜로 세 변수가 모두 0일 때만 -1로 조합을 무시하게 하면 된다.

요컨대 초성과 중성만 단독 입력이 가능하고 정확하게 초-중-종 순서를 따르지 않은 unexpected 종성은 입력을 무시하게 한 오토마타인데, 이것도 좀 오래 써 보니 오타 방지 차원에서는 나쁘지 않은 것 같다.

3.

이제 오토마타 얘기 말고 다른 기술적인 얘기로 넘어가겠다.
맥 사용자라면 이미 충분히 아시겠지만, 매킨토시 컴퓨터는 별도의 한/영이나 한자 키가 없기 때문에 한/영 전환이 cmd+space이고, 한자 변환은 opt(alt)+enter이다.

다만 약간 불편한 점은, 두벌식이든 세벌식이든 겹받침을 입력하는 방법이 없다는 것이다. 두벌식에서 ㄱ+ㅅ을 누르면 둘은 따로 떨어지며, 세벌식은 아예 겹받침 단독 입력이 불가능하기 때문이다.

초성+한자로 특수문자를 입력하는 기능도 맥에는 없다. 일반 PC에서는 그야말로 도스 시절에서부터 존재한 오랜 전통임에도 불구하고, 맥은 그런 것의 영향을 지금까지 전혀 받지 않은 채 지내 왔다니 놀라울 따름이다. 전/반각 모드 같은 것도 맥에서는 찾을 수 없다.

윈도우에서는 두벌식/세벌식이 한 한글 IME 내부에서의 설정치로 존재해 왔지만 맥은 각각의 벌식이 마치 영문 쿼티/드보락처럼 별개의 입력 방식으로 다뤄진다. 어찌 보면 이게 더 직관적인 디자인인 건지도 모르겠다. 그래서 입력 환경 설정 대화상자에는 글자판을 선택하는 옵션은 없으며 backspace 키의 동작 방식 같은 것만 있다.

Windows는 95 이래로 조합 중인 한글을 깜빡이는 네모 커서로 나타내는 관행을 도스 시절 프로그램으로부터 확실하게 도입하여 정착시켰다. 이 당연한 관행이 3.1때까지만 해도 없었기 때문에, 한글을 조합 중일 때 커서는 그냥 해당 한글의 앞에 똑같은 길쭉한 형태로만 보였다. 당시 윈도우 3.x용 MS 워드 6.0이 예외적으로 IME를 자체 처리하여 네모 커서를 자체 구현하던 수준이었다.

그에 반해 맥은 조합 중인 한글을 그냥 일본어나 중국어의 조합을 표시하듯이 밑줄로 처리한다. 즉, 맥에서는 깜빡이는 네모 커서를 볼 일이 없다는 뜻. 사실, 깜빡이는 네모 커서는 도스 시절 이래로 오랫동안 봐 왔기 때문에 심리적으로 편하기는 하지만, 한글 조합을 두 글자 이상의 길이로 표현하는 가능성을 차단했다는 큰 제약도 존재한다.

그래서 MS 운영체제에서는 전통적으로 한글 조합을 단어 단위로 잡는 기능이 존재한 적이 없다. 한자 입력할 때를 빼면 사실 전/반각만큼이나 별로 필요하지도 않은 것도 사실이긴 하지만 말이다. 그 반면 맥에는 그 옵션이 있다.

이런 점들을 감안하면, 한글 입력 하나를 두고도 맥과 윈도우는 문화가 상당히 다름을 알 수 있다. 차이는 이것으로 그치지 않는다. 오류가 없는 100% 정확한 세벌식 최종 글자판이 윈도우에서는 무려 비스타와 오피스 2007 타임라인에 와서야 겨우 제공된 반면, 맥에서는 공 박사님의 영향력 덕분인지 그야말로 OS X도 아니고 20세기 클래식 시절부터 당연히 기본 제공되어 왔음도 감안할 필요가 있다.

Posted by 사무엘

2012/07/20 19:21 2012/07/20 19:21
, , , , ,
Response
No Trackback , 3 Comments
RSS :
http://moogi.new21.org/tc/rss/response/709

« Previous : 1 : 2 : 3 : 4 : 5 : 6 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/04   »
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30        

Site Stats

Total hits:
2667235
Today:
2473
Yesterday:
1937