탈네모 글꼴에 대한 생각

한글 타이포그래피에서 탈네모 글꼴은 만년 떡밥인 것 같다. 지금 까지 그래와꼬 아패로도 그렇겠지

한글 가변폭 글꼴: 한글 글꼴 중에서 명조, 고딕 내지 한자 같은 부류와는 달리, 글자의 폭이 획일적이지 않고 글자마다 차이가 있는 글꼴을 일컫는다. 본문용으로는 잘 쓰이지 않고 특이한 제목이나 장식용으로 쓰인다. 아래에서 설명될 세벌식 글꼴과는 살짝 다른 개념으로, 세벌 글꼴은 굉장히 높은 확률로 한글 가변폭 글꼴이지만 모든 가변폭 글꼴이 세벌 글꼴은 아니다.

세벌식 글꼴: 공 병우 세벌식으로 만들어진 기계식 타자기로 글자를 쳤을 때 찍혀 나오는 자형과 같거나 최소한 상당히 유사한 구조를 하고 있는 글꼴. 일명 샘물체 내지 안상수체, 공한체 계열이다. 초중종을 이루는 벌수가 매우 적으며 글꼴 크기가 대체로 아주 작고 가볍다. 세벌식 글꼴은 거의 필연적으로 가변폭 글꼴이 되며, '가'과 '강'에서 '가'의 모양이 같아서 세로로도 기복이 크다는 특성상 '탈네모 글꼴'이라고도 분류된다.

그런데 문제는, 획일적인 정사각형을 탈피한 한글 글꼴에 대한 개인 호불호 편차가 굉장히 크다는 것이다. 국어학자, 타이포그래피 디자이너, 한글 기계화 연구인 중에서도 그런 발상 자체를 완전 개혐오하는 분이 좀 있다. 수 년 전, 한겨레 신문사가 이질감을 최소화하려고 무늬만 세벌 글꼴 흉내를 살짝 낸 한겨레결체로 본문 서체를 과감하게 바꿨는데, 당시엔 그것만으로도 “이거 도대체 뭐야?”(성경에 나오는 '만나'의 의미가 정확하게 이것이다-_-) 하는 반발이 벌써부터 터져나오기도 했다고 한다.

애초에 과거 기계식 타자기 시절에 네벌식, 다섯벌식 같은 불편한 입력 방식이 있었던 것도, 세벌식만으로 타자를 하면 자형이 너무 들쭉날쭉하고 못생겼기 때문이었다. 그만큼 사람들의 문자 습관이라는 건 무척 보수적이다.

그 반면에 서양 먹물 좀 먹었거나 일말의 선각자 자질이 있는 분은, 한글 자형이 정사각형 일색이기만 해서는 로마자(p, d, v 같은 들쭉날쭉 다양한 글자가 있는) 같은 가독성이 살아나질 않는다면서 그래도 탈네모 글꼴에 희망을 걸고 있는 경우가 있기도 하다. 그렇잖아도 국어 정서법에는 대문자도 없고, 고유명사도 없고, 영문 정서법 같은 엄격한 띄어쓰기가 정착해 있지 않으며, 문장 부호의 활용이 활발한 것도 아니다. 어찌 보면 굉장히 난감한 상황이 아닐 수 없다. 한글 전용론자라면 맨날 한글이 우수하다고 자뻑만 할 게 아니라, 현실에서 드러나는 한글의 단점을 한글로 해결하는 방법도 연구해야 하지 않겠는가?

컴퓨터용으로 만들어진 세벌식 글꼴은 최소한의 보정을 거친다. 가령, 간의 ㄴ은 감의 ㅁ보다 약간 위로 올라가며(공간이 너무 벌어지니까), 진짜 곧이곧대로 타자기 FM대로 1*1*1벌이라기보다는 최소한 2*1*2벌(특히 글자별 폭의 격차를 줄여서 디자인할 때) 이상이 시도되기도 한다.
<날개셋> 편집기에 존재하는 샘물이나 타자기 같은 글꼴은 에디팅 엔진의 한계 때문에 폭은 불변폭이나, 너그럽게 보면 세벌식 글꼴의 범주에 들어간다.

세벌식이라는 이념은, 한글을 풀어쓰기 형태로 파괴하지 않고 최소한의 형태와 원리를 유지하는 한편으로, 또 사람과 기계 모두에게 편리한 간결한 방법으로 한글을 입출력할 수 있는 정점을 찍은 일종의 교리이다.
탈네모 가변폭 한글 글꼴이라는 개념 자체는 글자판과는 별개로 일부 디자이너들이 시도하기도 했지만, 세벌식이 한글 글꼴에 그런 맥락의 변화를 시도하는 데에도 응당 영향을 끼쳤다고 볼 수 있는 셈이다.

이 이념의 영향을 받아 1980년대에 이미 안 상수 교수가 캐드를 이용한 디자인으로 안상수체 내지 안체를 개발했으며, 1990년대에는 한 재준 교수가 공 병우 박사와 합작으로 공한체와 한체 시리즈를 내놓았다. 대표적인 가변폭+세벌 글꼴이다.
안상수체는 아래아한글 2.1 (1993)에서 처음으로 도입되었고, 공한체/한체는 아래아한글 96에서 도입되어 우리에게 친숙해졌다.

여러분은 이런 탈네모, 세벌, 가변폭 한글 글꼴에 대해서 어떻게 생각하시는가?
일단, 이런 글꼴들은 생김새가 이질적일 뿐만 아니라 기존 네모 글꼴과는 디자인된 metric이라고 해야 하나, 전반적인 크기가 전혀 어울리지 않아서 같이 쓰기가 더욱 힘들다. 같은 크기로 맞췄을 때 저 글꼴은 여타 네모 글꼴들보다 훨씬 더 작아 보인다.

탈네모 글꼴을 처음으로 시도한 디자이너들은, 단순히 '생소하고 디자인이 정착해 있지 못하며, 완성도 높은 탈네모 글꼴이 아직 나오지 않아서 거부감이 드는 것일 뿐이다'라고 생각했다. 즉, 시간이 탈네모 글꼴의 문제를 점차 해결해 줄 거라고 생각했다. 실제로 2011년이 된 오늘날, 굳이 세벌이 아니더라도 가변폭 글꼴에 대한 국민적인 이질감은 예전보다는 줄어든 것 같다.

그러나 그래도 갈 길이 멀다. 아무래도 탈네모 글꼴이 명조· 고딕의 벽을 완전히 넘을 수 있을 것 같지는 않다. 특히 정사각형 안에 차곡차곡 자모가 질서정연하게 배치되는 명조· 궁서· 문화바탕 같은 미려한 서체의 완성도는, 탈네모 글꼴 주장자들이 결코 무시해서는 안 된다.
그런 글꼴이 괜히 수십~수백 년의 짬밥을 먹으면서 국민들로부터 사랑받고 살아남은 게 아니다. 탈네모 글꼴은 여전히 세리프 계열 글꼴이 빈약하며, 그나마 세리프 축에 드는 공한체는 진짜 무늬만 세리프이지 명조 같은 급에 비할 바가 못 된다. 즉 여전히 실험적인 수준을 벗어나지 못하고 있다는 뜻 되겠다.

하지만, (또 반전을 해야겠다)
그럼에도 불구하고
한글은 한자 같은 아예 픽토그램급의 상형문자가 아니고 일정한 규칙과 체계가 있는 '자질문자' 시스템인데..
천편일률적인 정사각형에만 맞춰 쓰는 건 많이 아까운 것도 사실이라고 본인은 생각한다.
이것이 앞으로 한글 타이포그래피가 풀어야 할 숙제 중 하나이다.

믿거나 말거나. MS 워드는.. 2007의 바로 직전의 2003 버전까지만 해도 가변폭 한글 글꼴이 전부 불변폭처럼 고정폭으로 찍혔다! 한글은 한자와 마찬가지로 무조건 정사각형이라고 전제를 했던 것 같다.
워드패드--정확히 말하면 그 밑에서 돌아가는 리치 에디트 컨트롤-- 도 초창기 버전은 마찬가지였는데, 이건 아마 윈도우 2000/XP 타이밍 무렵부터 개선되었지 싶다.

과거의 아래아한글 97은 정사각형 글꼴을 쓸 때는 안 그런데 공한체나 안상수체 같은 가변폭 글꼴로 한글을 입력하면 매번 줄 전체가 번쩍거리며 바뀌는 게 보여서 불편했다. 이 문제는 차세대 엔진 기반인 워디안/2002부터 바로 개선되긴 했다.

Posted by 사무엘

2011/08/25 09:23 2011/08/25 09:23
,
Response
No Trackback , 7 Comments
RSS :
http://moogi.new21.org/tc/rss/response/560

본인은 윈도우 플랫폼용 한글 입력기의 개발자이다. 그런데 진짜 옛날 도스 시절, 텍스트 모드가 따로 있던 시절에 한글 입출력 바이오스 같은 건 어떻게 구현했는지가 무진장 궁금해질 때가 있다.
출력은 그렇다 치더라도 입력은 어떻게 구현했을까? 게다가 한글도 모자라서 한자 입력은?
그리고 한글 정도면 양반이지 도스 시절에 일본은 사정이 어땠을까? 한자 변환까지 포함한 일본어 입력이 가능했을까? -_-;;

IBM 호환 PC는 그렇게 그래픽에 최적화돼 있지도 않던 놈이었고.. 영어 아스키 코드밖에 모르는 이런 기계에다가 없는 문자를 찍기 위해서는 막대한 양의 오버헤드가 필요했다.

요즘은 잘 알다시피 사운드 카드, 랜 카드 따위는 마더보드에 통합되어 버린 지가 오래이고 GPU, PPU 같은 거나 별도로 부착하는 CPU 애드온이다. (그리고 이마저도 요즘은 본격 통합 기세-_-)
허나 한 25~30년 전에는 한글 카드라는 별도의 하드웨어가 있을 정도였다. '한글 도깨비'. 그때는 그만큼 컴퓨터의 성능이 열악했다.

한글 입출력 바이오스를 만들려면, 일단 바이오스의 글꼴을 다른 걸로 대체할 수 있을 정도로 하드웨어에 정통해야 했고 메모리 사용량이든 계산량이든 극도의 최적화 작업이 필수였다. 한글 모드에서는 텍스트의 스크롤 속도가 한 2, 30% 정도 감소하는 효과가 있었기 때문. -_-;; 더구나 기본 메모리 640KB는 그야말로 1K라도 아껴야 하는 귀중한 영역이기 때문에, 한자 글꼴 같은 건 XMS/EMS 같은 확장 메모리에다 저장하는 테크닉도 필수였다.

VGA의 기본 텍스트 모드는 잘 알다시피 가로 80글자, 세로 25글자이다. 그런데 아주 신기하게도 한 글자의 크기는 너무나 컴퓨터스럽게 잘 떨어지는 8*16이 아니라, 9*16이다. 그리고 화면 해상도는 640*400도, 640*480도 아니요 720*400이다. 정작 mode 12H 같은 그래픽 모드 중에는 640을 넘는 해상도가 없던 시절이었는데 왜 텍스트 모드만 한 글자의 폭이 8이 아닌 9였는지는 모르겠다.
한글 바이오스들은 16*16 크기의 한글· 한자 글꼴을 사용했으며 640*400 해상도의 텍스트 모드에서 동작했다.

그뿐만이 아니다. 그때 VGA 텍스트 모드에는 화면 전체의 테두리 색이라는 게 있었다! 베이직에서 COLOR문은 보통 글자색과 배경색을 의미하는 A,B만이 쓰이는데, 셋째 인자도 있어서 이걸 지정하면 화면의 테두리에도 색깔을 줄 수 있었다. 이런 기능을 누가 썼고 왜 만들었는지는 모르겠지만...
이건 DosBOX나 VMware 같은 에뮬레이터들도 지원 안 하고 있는 기능이다.
그 테두리가 차지하는 픽셀 수는 얼마나 됐을까? 이것까지 감안한 화면 해상도는 얼마였을지를 생각하면 옛날에 비디오와 관련된 하드웨어 제어는 심오함 그 자체였겠다는 생각이 든다.

텍스트 모드의 바이오스 글꼴을 다루는 테크닉을 구사한 프로그램은 흔치 않았다. 도스용 노턴 유틸리티(Norton Utility)는 이걸 환상적으로 조작해서 텍스트 모드에서 준 GUI 수준의 비주얼을 만들고 심지어 그래픽 모양의 마우스 포인터까지 구현하는 용자짓을 했다. 그리고 Screen Thief라는 캡처 프로그램은 당시로서는 흔치 않게 텍스트 모드를 색깔과 바이오스 글꼴까지 감안한 실제 그래픽 화면 픽셀 그대로 캡처하는 기능이 있었다.
뭐, 한글 바이오스가 구동된 상태에서 노턴 유틸리티 같은 프로그램을 GUI 모드로 동시에 실행했다간 '영 좋지 않은 곳에 하드웨어 접근이 일어나서' 대략 불상사가 발생했겠지만 말이다. "내 컴이 다운이라니!!"

그때는 마우스의 존재 여부를 알아오는 테크닉만큼이나 한글 바이오스의 존재 여부를 알아오는 테크닉도 있었고
이는 텍스트 모드에서 실행되는 프로그램이 선문자를 깨지지 않고 맞게 출력하기 위해서 필수였다. 도스용 V3이나 MDIR 같은 프로그램들 말이다.
그러고 보니 한글 모드에서는 아스키 번호 1~31번 제어 문자도 원래 얼굴 모양 등 각종 도형이던 게, 1바이트 선문자로 바뀌었던 것 같다.

당연한 말이지만, 한글 바이오스는 바이오스의 글자 크기가 8*16이기만 하면, 텍스트가 아닌 그래픽 모드에서도 물론 동작했다.
하지만 그래픽 모드에서까지 텍스트를 찍는 프로그램은 전혀에 가깝게 없을 테니 이건 그리 의미는 없는 기능이었다.
그래픽 모드에서 동작하던 프로그램이 crash가 발생하는 바람에 그 상태 그대로 도스로 빠져나가서 도스 프롬프트가 찍힌 게 아닌 이상 말이다.
텍스트 모드에서는 cursor가 아주 빠르게 깜빡거렸지만 그래픽 모드에서는 cursor가 깜빡이지 않는다는 중요한 차이가 있었다.

그럼, 말이 나온 김에 옛날에 접했던 도스용 한글 바이오스들을 추억 차원에서 몇 개 예나 좀 들어 보자.

1. 본인이 난생 처음으로 접했던 IBM 호환 PC는 대우 전자에 개발한 286 AT였는데, config.sys의 DEVICE 문을 통해 구동하는 자체(대우에서) 개발 소프트웨어 기반 한글 바이오스가 들어있었다. 즉, 일단 load된 후엔 메모리에서 제거하는 방법이 없어서 불편했다. (그 당시 sys 파일은 com 실행 파일과 기술적으로 비슷한 구조가 아니었겠나 싶다.)
Alt+한영을 누르면 한글 바이오스 메뉴가 떠서 영문 전용/조합형/완성형 같은 모드를 바꿀 수 있었고, Alt+한자를 누르면 일시적으로 영문 전용 모드로 전환할 수 있었다.
대우 전자에서 개발한 만큼, 조합형과 완성형뿐만이 아니라 당시 악명 높던 DH 완성형도 지원했는데, 얘는 알파벳 소문자+대문자를 묶어서 한글을 표현하는 경우도 있었던 걸로 기억한다. 물론 한글 코드의 표준화가 일단락되면서 깔끔하게 묻혀서 역사 속으로 사라졌지만.

텍스트 + 한글 모드일 때는 화면의 맨 아래에 자그마하게 현재 한글/영문 모드인지, 완성형인지 조합형인지 같은 상태가 파란 배경의 줄에다 떴다. (그래픽 모드일 때는 그런 거 없음) 텍스트 모드에서 그런 걸 어떻게 구현했는지 지금 생각하면 정말 신기하기 그지없다.
물론 아까 말했던 VGA 테두리도 그보다 더 아래에 표시되었다.

한글을 입력하다가 bksp를 누르면 그냥 바이트 단위로 지워졌다. 즉, '한'을 입력하다가 bksp를 누르면 '하'가 되는 게 아니라 그대로 조합이 끝나면서 KS 완성형 기준 '한'을 구성하는 %C7%D1 중 %C7만 남아서 깨진 문자가 보였다.
우연히 한글 초성만 입력해 놓고 한자 키를 누르니까 지금까지 듣도 보도 못한 온갖 특수문자들이 펼쳐져서 이것도 신비로움 그 자체였다.

2. 한글 MS-DOS를 판매한 MS도 응당 자체 한글 바이오스를 갖추고 있었다.
그런데 지금까지 생각해도 참 대단한 건, MS에서 만든 한글 제품은 텍스트 모드에서도 깨진 문자를 보여주는 법이 없었다.
조합 중인 문자든 조합이 끝난 문자든, 한글은 알아서 자동으로 2바이트씩 한꺼번에 지워졌다. 조합 중인 글자를 조합의 역순으로 차곡차곡 '한' -> '하' 식으로 지워 주기에는 도스 환경이 너무 열악했고, MS가 개발한 한글 바이오스는 그냥 한글을 한꺼번에 지웠다.

GWBASIC, QBASIC 같은 프로그램은 한글판이 따로 있었는데, 한글 바이오스를 구동하지 않고 한글판 프로그램을 실행하면 글자만 깨지는 게 아니라 그대로 컴퓨터가 다운됐었다!
그러나 텍스트 모드에서 GUI를 구현한 한글판 프로그램들을 잘 살펴보면, 메뉴 같은 게 배경에 있는 한글의 2바이트를 반으로 가르게 될 경우 나머지 1바이트도 알아서 지워서 표시해 줬다. 어떤 경우에도 깨진 한글의 잔해 바이트가 표시되는 일이 없었다.

아마 한글 바이오스뿐만이 아니라 응용 프로그램 차원에서 무슨 특수한 처리를 한 것 같긴 한데, 그 대신 당시 MS에서 만든 한글판 프로그램들은 한글 바이오스가 없으면 동작하지 않고, 속도도 느리고 이래저래 파워 사용자들에게서 욕 많이 먹었다. 특히 QuickBasic 한글판은 라이브러리 파일이 영문판과 호환되지 않는 등 최악의 제품이었다.

<날개셋> 한글 입력기는 현재 '마소바탕'이라고 하여 MS 한글 바이오스가 내장한 조합형 글꼴을 그대로 지원하고 있다. 조합 구조가 전통적인 8*4*4벌 도깨비 글꼴과는 다른데 이런 것까지 복원해 냈다.

3. 끝으로 태백한글이라는 프로그램이 있었다. 1994~95년까지 32비트 코드로까지 비교적 오래 개발되었고, 도깨비 글꼴을 그대로 지원한다는 점이 무척 좋았다. 얘는 아마 조합 중인 한글을 음소 단위로 지우는 기능이 있었지 싶다.

도스도 모자라서 영문 윈도우 3.x에서 한글을 구현해 냈다는 한메한글 같은 프로그램은 운영체제의 무슨 계층에서 훅킹을 해서 도대체 어떻게 만든 걸까? 파워 사용자 중에는 영문 윈도우+한메한글이 오히려 한글 윈도우보다 더 안정적이고 좋았다는 말을 할 정도였으니 말이다.
32비트 시대가 도래하기 전에 한글 IME는 DLL이 아닌 EXE이긴 했는데, 그때는 구체적으로 어떤 메카니즘을 썼는지 잘 모르겠다. 물론 그 시절에는 한 프로세스가 시스템 전체에 어떤 영향을 끼치기가 지금보다 훨씬 더 쉬웠을 테니까 그 원리가 그렇게 복잡하고 어려운 건 없었을 것이다.

이것저것 잡설이 길어졌는데, 추억에 공감하시는 분이 있다면 용자.

한글 윈도우 3.1은 실행 전에 언제나 아래와 같은 경고문이 떴었다.
보다시피 MS는 분명히 Hangeul이라는 명칭을 썼었다. 허나 지금 대세는 Hangul이 압도적으로 굳어져 버린 듯. <날개셋> 한글 입력기도 6.0부터는 표기를 Hangul로 바꿨다.

Warning: For correct execution of DOS Box in Hangeul Windows 3.1,
You should use Hangeul Windows 3.1 standard HBIOS.

Warning: Your DOS is not compatible with Hangeul MS-DOS. You may have
some problems when you use Hangeul Windows 3.1.

Press any key to continue...

Posted by 사무엘

2011/06/30 08:47 2011/06/30 08:47
, , ,
Response
No Trackback , 10 Comments
RSS :
http://moogi.new21.org/tc/rss/response/533

세벌식 찬사

요즘 <날개셋> 타자연습에서 추가된 "김 화백 어록" 연습글로 재미있게 타자 연습을 하고 있다. 이런 연습글을 진작에 추가할 생각을 왜 못 했는지 모르겠다. ㅋㅋㅋㅋ

본인은, 사람이 타자를 하는 동작이 컴퓨터 CPU가 돌아가는 과정과 비슷한 구석이 있다는 생각을 오래 전부터 해 왔다.
연습글은 기계어 인스트럭션들이고, 글을 읽는 사람의 눈은 디코더. 타자 속도는 클럭 속도.-_-;;
CPU에 캐쉬 메모리가 있고 파이프라이닝이 있는 것처럼, 사람이 타자를 하는 것도 사실은 글자 단위가 아니라 최소한 단어 단위, 덩어리 단위로 하게 된다. 영문 독해를 빨리 하려면 단어 하나하나가 아니라 덩어리가 통째로 머리에 들어와야 하듯, 타자도 마찬가지이다. 글자 나부랭이 깨작깨작 눌러가지고는 마치 독수리 타법만큼이나 속도가 빨리 날 수가 없다.

세벌식이 두벌식보다 우수하고 속도가 빠른 이유는, 겨우 자모 단위가 아니라 그렇게 머릿속의 덩어리를 그대로 글자판의 손동작으로 옮기는 데 두벌식보다 월등히 더 유리한 구조이기 때문이다. 익숙한 어절이 등장하면 그 초중종성 낱자와 손 모양이 일대일 일심동체가 되어 머리의 지시가 마구잡이로 손으로 전달되고, 머리는 그 글자의 다음 글자가 이루는 손 모양까지 예측하게 된다. 일명 날타. 이런 최적의 조건이 잘 만족되면 세벌식으로 단문은 900~1000타도 어렵지 않게 나온다.

CPU로 치면 파이프라인이 쫙쫙 잘 되는 인스트럭션이라 할 수 있는데 공 병우 세벌식은 우-좌 리듬감 덕분에 이런 게 잘 된다. 쭈루루룩~ 그냥 타자를 치고 싶어진다. '한글날' 같은 글자... 쫘르륵~ 파이프라인이 최적이다.

날타는 오타가 나기 쉽다. 그런데 세벌식은 모아치기라든가 각종 한글 입력 설정 보정을 통해서 그런 오타를 보완하는 시스템까지 갖출 수 있으니, 심리적으로 더욱 편하고 막힘없이 타자를 할 수 있다. 꽤 오랫동안 지치지 않고 장문을 단문 치듯 치는 게 가능하다.
물론 세벌식에서도 '예의, 엽, 까'처럼 좌우 교대가 어긋난다거나 동일 손가락 연타가 발생하는 글자는 미스가 발생하긴 하지만, 종성과 초성 사이의 불규칙한 왼손 연타로 온통 얼룩져 있는 두벌식의 불편함에 비할 바야 물론 아니다.

또한, 앞에서 예를 든 것처럼 대놓고 손가락 움직임이 어긋나는 연타까지는 아니지만 세벌식으로 치기 좀 어려운 글자가 또 있다. '불량률' 같은 단어는 검지의 운지가 1단에서 4단까지 들쭉날쭉해서 세벌식을 10년 넘게 쓴 본인에게도 여전히 쉽지 않다. 이런 글자는 날타가 안 통하고 한 낱자씩 속도를 줄여서 또박또박 쳐야 한다. CPU로 치면 공간 locality의 위배 때문에 캐쉬 미스가 나는 메모리 접근에 비유할 수 있겠다. 날타냐 정타냐를 잘 결정해야 오타 없이 빠른 타자를 할 수 있다. 오타가 한 번 나면 손실이 가히 엄청나기 때문에.

두벌식은 4단을 안 쓰고, 치기 편한 글자와 치기 불편한 글자 사이의 편차가 세벌식만치 심하지는 않다.
하지만 평균적인 타자 experience가 세벌식보다 훨씬 나쁘다. 세벌식은 입체 교차이고 두벌식은 신호등이 있는 평면 교차..

어차피 800타, 900타 치지도 못하고 스마트폰용으로 작은 화면에다 그냥 버튼 수 적은 입력 방식을 만들 때야 두벌식이든 그보다 더 복잡한 입력 방식이든 크게 상관할 바가 아니다만... 생업을 목적으로 방대한 양의 글을 입력할 수 있는 정도의 규모를 갖춘 기계에서 한글을 입력하는 데 세벌식을 생각하지 않는다는 건 어불성설이다.
특히, 타자기를 지나치게 폄하하는 의견에 본인은 다음과 같은 관점에서 동의하지 않는다.

첫째, 타자기의 형태를 거의 그대로 답습한 지금 같은 키보드보다 더 보편적이고 빠른 문자 입력 스키마는 지금까지 나오지 않았으며, 본인은 앞으로도 키보드가 그렇게 호락호락 없어질 거라고는 생각하지는 않는다.
참고로 한 10년 전부터, 스마트폰 같은 게 없던 시절부터도 앞으로 음성 인식 기술 때문에 키보드가 없어질 거라는 낭설이 떠돌았었다. 과연? -_-

둘째, 사람들은 공 병우 세벌식이 타자기를 고려하느라고 뭔가 굉장히 많은 걸 희생했다고 생각하는 경향이 많다. 그러나 그렇지 않으며, 공 병우 세벌식은 기계의 물리적 호환성과 사람의 편의· 심리라는 두 토끼를 매우 훌륭한 형태로 모두 잡았다.

그리고.. 늘 하는 말이지만, 오토마타가 장땡이 절대 아니다.
두벌식은 오토마타가 있으니까 컴퓨터에서나 겨우 문제될 게 없는 수준인 반면,
세벌식은 이론적으로 오토마타가 아예 없어도 되고, 있으면 당연히 두벌식보다 훨씬 더 앞서갈 수 있다.

세벌식이 글쇠 수가 좀 많은 것은.. 그래 솔까말 손가락이 짧은 사람에게 물리적으로 약간은 불편할 수 있다.
그러나 글쇠배열 자체가 외우기 힘들다거나 배우기가 그렇게 엄살 부릴 정도로 힘든 건... 절대 절대 아니다.
정말로 두벌식을 두 시간 만에 익혔으면 세벌식은 세 시간, 아니면 그래 까짓거 네 시간 만에 익히는 정도.
그러고 나서 평생 그 글자판을 쓰는 시간은 얼마나 되며, 평생 만들어 내는 글자는 몇 자나 될까?
이게 비교나 되는 게임이란 말인가?

그 글쇠 조금 더 익히는 대신에 얻는 것, 그리고 그 글쇠 좀 줄여서 잃는 것...
내가 보기엔 전자가 훨씬 더 남는 장사인데 사람들이 고작 그것만 갖고 야단법석을 떠는 게 안타깝다.

흔히, 지금 아무리 비용이 들더라도 100년 앞을 내다보고 미래를 위해서 해야 하는 투자의 예로 남북 통일도 있고, 독립 운동-_-도 있고 220볼트 승전도 제시되곤 하는데,
세벌식을 쓰는 건 그런 것보다도 더 비용이 덜 들고, 휠씬 '덜 극단적인' 예이다.

공 박사가 아니었으면 공 병우 세벌식 같은 글쇠배열은 도대체 얼마나 더 나중에야 나오게 됐을까, 아니 지구가 멸망하기 전에 발명되는 게 가능하긴 했을까?
컴퓨터는커녕 글을 기계로 쓴다는 생각 자체가 없던 시절에 그런 걸 만들 생각을 했다면, 공 박사는 얼마나 천재이고 시대를 앞서간 사람이었던가?

오늘은 모처럼 아주 고전적인, '클래식'한 주제를 다시 꺼내 보았다.
내가 이렇게 이따금씩 세벌식에 '자뻑'하는 건.. 다 이유가 있어서이다. ^^;;

Posted by 사무엘

2011/06/19 19:22 2011/06/19 19:22
, , ,
Response
No Trackback , 8 Comments
RSS :
http://moogi.new21.org/tc/rss/response/528

언어 잡설

오랜만에 전공 관련 잡설을 끄적인다.

1. 요즘 나오는 옥편이라면 각 한자들마다 글자의 유니코드 번호는 꼭 수록해 줘야 하지 않을까 싶다. 컴퓨터 시대에 저 정보는 하다못해 필순보다도 훨씬 더 필요하고 유용할 것이다.

2. 한자는 입력하고 다루는 데는 굉장히 불편하지만, 뜻글자라는 특성상 한자가 적당히만 쓰이면 형태소 분석과 의미 파악에는 굉장히 유리하다. 한-일 번역과 일-한 번역의 난이도의 차이를 생각해 보면 명백하다. 일본어는 처음에 입력하기가 느리고 불편하지만, 나중에 자연어 처리에는 다소 편할 수 있다는 뜻.
그와 반대로 한국어는 한글로 입력은 전광석화처럼 할 수 있지만 그만큼 소리만으로 기계가 힘들게 유추해야 하는 정보가 많으며, 언어 자체도 구조가 미치도록 판타지 다이나믹 귀걸이 코걸이 식이다 보니 자연어 처리 입장에서는 여간 까다로운 게 아니다.

3. 카이스트에서는 100% '재수강'이라는 용어만 쓰이지만, '재이수'라는 말도 있다는 건 연세대에 가서 처음 알았다.
카이스트에서는 봄학기, 가을학기라고 학기를 구분하지만 연세대는 그냥 고등학교 이전처럼 1학기, 2학기를 쓴다.
인문계 대학원에서는 교수가 다른 교수를 일컬을 때나 강의실에서 학생이 교수를 부를 때 '선생님'이라는 말을 쓴다. 심지어는 나이 많은 학생끼리도 친해지기 전에는 서로 선생이라고도 한다.
그러나 이공계 대학원에서는 여전히 '교수님'이 주도적인 것 같다.
이런 일련의 차이를 혹자는 '학교 방언'이라고 풀이하더라.

4. 이기다, 지다, 틀리다, 맞다, 모르다 같은 용언은 영어와 비교했을 때 용도에 따라 시제가 조금씩 일치하지 않는 면모가 있다.
격투 게임 같은 데서 흘러나오는 You win 같은 멘트를 '네가 이긴다'라고 번역하지는 않으며,
You are wrong도 '네가 틀리다'라고는 절대로 번역되지 않는다. wrong, incorrect를 언제나 과거 시제로 번역하다 보니 정작 현재 시제인 '틀리다'는 자꾸 '다르다'라는 뜻으로 이상하게 꼬이고 있는 것 같다.

5. 학교에서 구수한 옛한글들이 잔뜩 찍혀 있는 어느 옛날 한글 성경을 봤는데... '밥팀례'라는 희한한 단어가 있더이다. 밥티슴(baptism)과 침례의 합성어인지? 우리 선조들의 작명 겸 번역 센스에 감탄했다.
아울러, 개역성경도 '사단'이라고 적어 놓은 Satan을, 훨씬 더 옛날 성경이 '사탄'이라고 더 정확하게 표기하고 있었다.

6. 폐사: 가축이 폐사하는 것 말고 弊社 또는 ?社는 자기 회사를 겸손하게 낮춰 일컫는 말이다.
그러니 비즈니스 메일이나 광고에서 자주 볼 법도 한 단어 같은데.. 본인은 태어나서 지금까지 폐사라는 단어를 본 곳은 자동차 취급 설명서가 전부이다. -_-;;; 그 업계만의 방언이기라도 한 걸까? '폐사가 보증하는 순정 부품을 사용하시기 바랍니다. / 주행 중 이 경고등이 갑자기 켜진다면 폐사 서비스 센터에서 정비를 받으시기 바랍니다.'
IT 업계에서도 쓰지 말라는 법이 없을 텐데. '모 제품에 이런 버그 내지 보안 취약점이 발견되었으므로 사용자께서는 폐사가 제공하는 업데이트를 반드시 받으시기 바랍니다.'
아무리 겸손한 비하라지만 졸(졸고, 졸저)도 아니고 '폐'가 들어가니까 부정적인 느낌이 더 강하게 느껴지는 것 같다.

7. 또 자동차 취급 설명서 이야기.
요즘 차 취급 설명서에 '핸들'이 '스티어링 휠'이라고 적혀 있는 걸 보고 놀랐다. 호치키스가 스태플러로 바뀌듯, 국민들의 평균적인 영어 실력이 증가하면서 콩글리시도 점차 바로잡혀 가는 것 같다. ^^;;;
하지만 백미러는 그냥 실외 미러라고 표기했고, 진짜배기 영어인 리어뷰 미러라고 하지는 않은 듯하다.

8. 세월이 흐르면서 아래아한글 97이 이제 완전히 역사 속으로 사라졌기 때문에, <날개셋> 한글 입력기도 구닥다리 한컴 2바이트 코드에 대한 지원을 차츰 줄여서 지금은 이게 변환기 유틸에서나 볼 수 있는 존재가 돼 있다.
그런데 맨날 옛한글 말뭉치 자료를 다루는 이 바닥 사정을 들여다 보니까, 한컴 2바이트 코드가 그렇게까지 죽은 포맷은 아닌 것 같다. 한컴 2바이트 코드를 기준으로 만들어진 형태소 분석기 같은 툴들이 아직까지 쓰이고 있어서 말이다. 현실이 그만큼 낙후해 있다는 뜻 되겠다.

본인이 다니는 이 대학원에 있으면서 좋은 점을 꼽자면 이러하다. 국어학 쪽의 진짜 전공자, 현업 종사자들의 언어학적 소견과 역사 증언을 접할 수 있다는 것이다.
말글 쪽으로는 '운동꾼'이기만 할 뿐 비전문가의 편협한 주장만을 접한 것과는 다르다. 비록 자기 전공 분야에서는 공학 박사이고 뭐 별별 업적을 남긴 분이라 하더라도 국어학 계열로는 이상한 지론에 빠져 이상한 주장을 밀어붙이는 분이 안타깝지만 꽤 있다. 나는 그렇게 되지 않으려 한다.

Posted by 사무엘

2011/05/13 08:39 2011/05/13 08:39
, ,
Response
No Trackback , 6 Comments
RSS :
http://moogi.new21.org/tc/rss/response/510

날개셋 한글 입력기 개발 소식

독자 여러분 중에 혹시
“이 블로그 주인장은 요즘 온통 철도에 미쳐서, 본업이던 <날개셋> 개발 같은 건 이제 때려치웠나 보군.”이라고 오해할 분이 있으실 것 같아서
오늘은 오랜만에 내 본업의 근황을 좀 알리도록 하겠다. ㄲㄲㄲㄲㄲㄲㄲㄲ

걱정 마시라. <날개셋> 한글 입력기는 현재 6.0의 개발이 활발하게 진행 중이다.
5.x 버전도 졸업이 임박했고 드디어 6.0 시대 개막이다.
킹 제임스 성경 발간 400주년과, 내 홈페이지 개통 10주년을 기념하여 5월 초순에 출시 예정이다.

10년 전이나 지금이나.. 이번 새 버전에도 어김없이 버그 고치고 새로운 기능 단장한 게 많다. 물론 대부분의 버그는 세벌식 최종+모아치기+드보락 정도의 용도로나 프로그램을 사용하는 분들은 발견할 일이 없는 것들이기 때문에, 문서화하지도 않은 것도 여럿 있다.
하지만 이제는 더 고칠 게 없겠지 싶어도, 새 버전 릴리즈 후 한두 주 정도가 지나면 프로그램 소스 코드를 어김없이 건드리게 되더라.

이번 6.0에서는 외부 모듈에 지금까지 알려져 있던 버그들은 모두 해결했다. gvim (한영 상태), MS Outlook (영문 덧입력), 로그인 UI (아이콘 외형)처럼 비록 프로그램의 안정성 관련은 아니지만 자잘한 문제가 있던 게 해결되었고, 해당 버그 제보자에게는 버그가 고쳐졌다고 메일로 다 따로 통보를 오래 전에 했다.

이런 bugfix만 있다면 새 버전의 번호를 6.0으로 올리기에 부족한 감이 있을 것이지만, 새 버전에는 한글 입력과 관련된 깔끔한 새 기능이 들어간다.
첫째, 일정 시간 동안 키 조작이 없으면 음절 구분을 위해 지금 조합을 자동으로 끊고 음절을 구분하는 기능이 추가된다. 천지인 같은 휴대전화 입력 방식을 구현할 때 필요하다.

둘째, <날개셋> 한글 입력기의 역사상 최초로, 초성과 종성이 한 낱자 결합 테이블을 공유하는 기능이 추가된다. ㄱ->ㅋ->ㄲ 같은 조합 로직은 하나만 구현해 놓으면 초성과 종성이 자동으로 공유하고, 종성에다가는 ㅄ, ㄶ처럼 도깨비불 처리가 필요한 겹받침 결합 규칙만 정하면 된다. 이걸 이용하면 ㄴㅅ, ㄴㅇ, ㄴㅊ 등 온갖 복잡한 경우의 수를 따져야 하는 휴대전화 입력 방식을 디자인하기가 지금보다 훨씬 더 쉬워진다.

물론 이 기능이 추가됨으로써 GUI상의 변화와 입력 설정 데이터 파일의 변경은 말할 것도 없고, 이미 지금 있는 가상 낱자와 특수 도깨비불 테이블과의 연계라든가.. 타수 복원 알고리즘의 추가 구현 같은 작업량이 아주 많다. 그러나 이것은 굉장히 중요한 변화이다.

6.0 이후로는 <날개셋> 한글 입력기는 자잘한 버그 수정이나 자그마한 편의 기능 추가,
아니면 여러 입력 패드 추가, 지금보다 더 복잡하고 다양한 글쇠 입력을 받아들이는 입력 스키마의 추가 등으로 최소한 6.x 중반까지는 버전업이 계속될 것이다.

그 중, 한 글자가 아닌 단어 단위의 한자 변환 기능은 6.0은 아니지만 6.0 완성 이후에 상당히 높은 작업 우선순위를 두고 있다.
MS IME는 무려 2003년도 버전부터(MS 오피스 2003) 지원했고 윈도우 비스타부터는 아예 기본으로 들어간 기능인데 내 프로그램은 다소 늦은 감이 있다. 물론 한글 입력 쪽보다야 중요도가 훨씬 더 낮기 때문에 지금까지 구현이 미뤄져 온 것이다.

내가 10년이 넘게 한글 입력기만 파고들 수 있었던 원동력은.. 간단히 말하면 한글이 너무 대단하고 세벌식 글자판이 너무 신기해서였다.
프로그래밍 하듯이 각종 테이블과 오토마타 로직을 바꿔서 한글 입력기의 동작 방식을 바꾸고, 내가 원하는 방식으로 마음대로 한글을 입력하고, 내가 원하는 한글 성분을 바로 고치고, 이미 입력된 문자열도 조작하는 걸 보니까 뭔가 밥 안 먹어도 배가 부른 것 같고, 정신적으로 만족과 자아 성취감을 느낀다. 이런 걸 '제대로' 구현하려면 누가 뭐래도 세벌식 글자판이 없으면 안 된다. 세벌식으로는 더 편리한 걸 만들 수 있지만 두벌식으로는 잘 해야 기본밖에 못 만든다.

보너스로...
모 지인이, 북한의 붉은별 OS가 쓰는 한글 글꼴의 비트맵을 완성형으로 추출하여 파일을 보내 줬다.
매우 흥미롭다. 남한과 북한의 운영체제에서 쓰이는 완성형 한글 비트맵 글꼴이 한데 집합했다.

사용자 삽입 이미지

광명은 순명조 컨셉이고, 붓글은 우리나라에도 비슷한 모양의 서체가 간판 같은 데서 쓰인다.
천리마는 뭔가 투박한 느낌이 나는 가는돋움 스타일.
그리고 청봉은 신명조 윤곽선 글꼴을 힌팅을 아주 잘 해 줬을 때 나올 법한 미려한 본문용 서체이다.

북한은 그렇게도 민족, 주체 사상을 좋아하면서 한글 글자판이나 코드는 다 남한과 비슷한 스타일로 표준을 정했다.
북한도 평범한 두벌식을 쓰고(왼손이 자음인 것도 동일함), 2350자보다는 약간 더 많지만 그래도 역시 2천여 자의 완성형을 쓰는 것까지도 똑같다. 세벌식이나 조합형 같은 건 주체 사상하고 별 관련이 없나? 그냥 김일성, 김정일만 따로 특수문자로 배당해 놓으면 장땡인 건가? ㄲㄲㄲㄲㄲㄲㄲ
아울러, 북한이 안상수체나 공한체 같은 탈네모꼴 글꼴을 만들었다는 얘기도 본인은 못 들었으니 글꼴 쪽도 별 변화가 없는 셈이라 하겠다.


Posted by 사무엘

2011/03/07 08:33 2011/03/07 08:33
, ,
Response
No Trackback , 23 Comments
RSS :
http://moogi.new21.org/tc/rss/response/476

제임스 맥콜리 교수에 이어 한글을 사랑한 해외 석학 시리즈의 둘째 시간을 마련하게 됐다.
이번에 소개하는 사람은 재레드 다이아몬드(Jared Diamond) 교수. 1937년생으로, 제임스 맥콜리와는 나이 차이가 1년밖에 안 난다. 2010년 현재 생존 인물이다.
‘재레드’라는 이름을 보고 성경 인물을 떠올릴 수 있겠는지? 창세기 5장을 보면, 무척 기이한 이름인 마할랄레엘이라는 사람이 있는데, 그의 아들이 야렛(Jared)이다. 야렛은 962세까지 산 인물이며 그 이름도 유명한 에녹의 아버지이기도 하다.

이 사람에 대해서 프로필을 조사해 보면, 프로필마다 그의 종사 분야가 제각각이라는 것에 놀라게 된다. UCLA의 교수이긴 한데, 어디서는 생리학과 교수라고 나와 있는 반면 이거 웬걸, 연구 분야가 역사학, ‘지리학’, 조류학 등등등...;;
그렇다. 그는 학문에 대한 관심과 열정, 집중도가 상상을 초월하며 뼛속까지 학자 타입이다.
학계에서 큰 명성을 쌓은 것은 물론이고 경제적으로, 사회적으로도 그 공부 오덕질 하나만으로 성공한 불세출의 천재이다.

처음엔 의사가 될 목적으로 의학을 공부했으나, 어렸을 때부터 ‘새(bird) 덕후’였던지라 분야를 살짝 바꿔 케임브리지 대학에서 생리학 박사 학위를 받았다.
그러나 새에 대한 미련을 버리지 못하고 조류학자 행세를 하고, 그러다 비슷한 시기에 언어학에도 깊이 심취했다. 이 사람이 라틴어, 그리스어, 독일어, 프랑스어, 러시아를 다 구사한다는 건 잘 알려진 사실. ㅎㄷㄷㄷ;;;

그의 덕질은 여기에서 그치지 않았다.
의학과 생리학, 조류학, 진화 생물학에서 시작된 이과 기질은 언어학을 거치면서 점차 인문학적 기질로 바뀌었다.
사람에 대한 관심이 생기면서 이번엔 역사학, 문화인류학까지 섭렵하기 시작했는데, 필력이 좋았던지라 <네이처>, <디스커버> 같은 잡지에 과학과 인문학을 융합한 각종 글을 쓰며 본격 과학 작가 반열에도 올랐다.

그리고 <제 3의 침팬지>, <총, 균, 쇠>, <문명의 붕괴> 같은 책을 쓰면서 생리학자로서의 다이아몬드 교수 이미지는 완전히 묻히고 말았다....;;; 이공계 천재이기도 하지만 인문계 천재 기질이 그걸 능가해 버린 셈. 퓰리처 상도 한번 받았다.

그런데, 이 천재도--그렇잖아도 언어학 덕후이기도 했음-- 제임스 맥콜리 교수와 동일한 어느 문자를 보고는 놀라지 않을 수 없었다. 바로 한글이다. 관심 분야가 ‘진화론 → 생물의 진화 → 인간 세상 → 문자의 진화 → 한글’의 순으로 뻗쳤다고 하는데...;;

첫눈에 반한 그는 저렇게 과학과 인문학을 융합한 각종 글을 권위 있는 학술지에다 실을 때, 한글 얘기를 했다!
바로 Discover지 1994년 6월호에 Writing Right(흠 언어유희를 의식한 제목인가?)라는 글을 실어서 한글의 우수성을 극찬하였고, 이에 비하면 언문일치가 개떡인 영문 내지 온갖 난잡한 문자를 섞어 쓰는 일본의 글자 생활은 매우 열악하다고 지적했다.

그는 <세계로 한글로> 다큐멘터리에도 출연하여 한글이 왜 우수하고 대단한지에 대해 다음과 같은 네 가지 요지로 증언했다. 라틴 알파벳밖에 안 써 본 서양인의 관점에서, 또 자기 특유의 덕후 관점에서 한글을 요모조모 뜯어보니까 이런 특징이 발견되더라는 것이다.
귀찮아서 동영상은 생략.. -_- 아래 사진에서 왼쪽의 인물이다.

사용자 삽입 이미지

1. 소리와 글자가 딱 잘 대응한다. 영문은 그렇지 못하다.
2. 자음과 모음이 시각적 변별되고, ㄷㄴㅌ, ㅅㅈㅊ 같은 그룹화가 가능하다.
3. 입모양을 본뜬 모양 자체도 경이롭다.
4. 모아쓰기를 하는 음절문자여서 글자의 식별이 용이하고 시각성이 더욱 향상된다.

그런데 다이아몬드 교수에게 질문을 하는 한국인 인터뷰어가 “why do you think so ...” 이렇게 묻는 건 좀 압박스럽다. 뭔가 피의자를 취조하는 듯한 느낌이 드니까. what makes you think so가 훨씬 더 정중하고 좋았을 텐데 말이다. (인터뷰어는 국문과 교수임.)

그는 워낙 관심 분야가 다양한 덕후이다 보니, 그로부터 15년이 지난 지금은 한글 역시 그의 지적 호기심을 만족시킬 수많은 장난감 중 하나로 지나갔을 수도 있다. 그는 딱히 맥콜리 교수처럼 한글날을 20년째 기념했다거나 하지는 않았다.
하지만 우리가 아무 생각 없이 일상적으로 쓰는 한글이라는 이 문자가, 알고 보면 저 천재마저 감탄시킬 정도로 정말 엄청난 문자라는 것을 또 한 번 느낄 수 있다.

과학과 철학을 겸비하고 대중적인 인기도 많은 석학 중엔, 웬지 무신론자 내지 개독안티가 많은 경향이 있다. 리처드 도킨스나 칼 세이건처럼. 저 사람도 대중적으로 유명하고 또 진화론을 연구한 사람이기까지 하지만, 딱히 자기 종교색을 공개적으로 드러낸 적은 없는 것 같다. 어쨌거나 학자로서 여러 모로 대단하고 존경스러운 분이다.
말이 나왔으니 말인데, 본인, 언젠가 창조와 진화에 대해서도 글을 쓸 일이 있을 것이다. 무진장 재미있을 것 같다.

Posted by 사무엘

2011/01/30 08:45 2011/01/30 08:45
,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/457

경주, 동국대, 변 정용 교수

본인의 고향은 경주이다.
그리고 본인의 고향집에서 가장 가까운 대학은... 바로 동국 대학교 경주 캠퍼스이다.

어렸을 때는 집에서 시내로 가는 길이 시청과 경주 역 쪽으로 가거나, 아니면 꼬불꼬불한 산길을 따라 동국 대학교 정문을 경유하는 경로밖에 없어서 동국대 일대는 본인에게 아주 친숙했다. 아, 그러고 보니 동국대 경주캠도 정문 근처 아래로 중앙선 철길이 지난다. (야 신난다)

사용자 삽입 이미지

그리고 이 경로를 경유하여 경주를 순환하는 41번과 40번 시내버스가 경주의 서울 지하철 2호선과 같은 황금 노선이었다. 20년 이상이 지난 지금까지도 번호조차 바뀌지 않고 살아 있다.
내 기억으로 41이 일명 외선 순환, 40이 내선 순환 격이나 다름없는데, 서로 경로가 미묘하게 달라지는 부분도 있어서 별도의 번호가 부여된 것이지 싶다.

경주에는 경주대도 있다. 하지만 경주 시내에서는 꽤 멀리 떨어져 있고 본인이 거기 갈 일은 없었다.
지금까지는 없었는데, 이제부터는 이따금씩 좀 구경할 일이 생겼다.
왜냐고? 집에서 KTX 신경주 역까지 가는 길목에서 늘 경주대 입구를 경유하게 됐기 때문이다.
경주는 도시 크기에 비해서 고속철 지나지, 고속도로 있지, 중앙선 밤차 이용할 수도 있지.. 교통이 굉장히 편하다.

신경주 역은 경주 대학교보다도, 심지어 고속도로 경주 IC보다도 더욱 외곽에.. 거의 건천읍에 있다.
그래 봤자 본인의 서울 거처에서 연세대까지의 거리와, 경주 집에서 신경주 역까지의 거리는 서로 아주 비슷하다.
그럼에도 불구하고 연세대보다 신경주 역이 집에서 훨씬 더 멀리 느껴진다. 그 이유는 당연히 경주와 서울이라는 도시 자체의 크기 차이와 대중교통 인프라의 차이 때문이다.
연세대는 지하철만으로 아주 손쉽게 갈 수 있는 반면, 신경주 역은 버스로 가려면 1시간은 잡아야 하고 현실적으로 택시 아니면 자가용이 답이다. 게다가 택시 타면 시외 구간이라고 할증 붙는다. -_-;;;

이래서 지방의 외곽에 세워진 고속철 역은 연계 대중교통이 절실하다. 그래도 신경주 정도면 고속철 초창기 계획에 애시당초 포함되었던 역이고, 경주 자체가 굉장히 작은 도시여서 외곽처럼 느껴질 뿐 절대적인 거리가 심하게 먼 건 아니다.
그러나 울산(울산 고속도로 타고 한참을...)이나 김천구미(구미 시내와는 아예 산으로 가로막혀 있고 김천 시내와도 그리 가깝지 않은..) 같은 역은 시내와의 접근성이 정말 안습하기 그지없다.
뭐 근본적으로 지금 고속철은 역을 너무 많이 만든 것부터가 문제이긴 하지만 말이다...;;;

흠 좀 쓸데없는 얘기가 길어졌으니 다시 동국대 얘기로 돌아오겠다.
잘 알다시피 경주에 있는 것은 동국대의 이원화 캠퍼스이고 본캠은 서울 중심부에 있다. 서울 지하철 3호선에 아예 '동대입구'라는 역이 있다.
본인은 경주캠에 있는 건 의대, 간호대, 관광학과 정도가 전부인 줄 알았는데, 거기도 나름 컴퓨터/전산학과가 있는 모양이다.

그리고 거기에 변 정용 교수가 계시는데...;;
이분이 국어 정보학 바닥에서는 아주 잘 알려진 한글 에반젤리스트이다.
아래의 짤방은 1996년 <세계로 한글로> 다큐멘터리에 출연한 모습.

사용자 삽입 이미지

뭐, 한글 예찬론자들의 문자관이 다 서로 일치하는 건 아니다.
자음은 왼손, 모음은 오른손으로 글자판 배열이 가능하다는 게 두벌식 사고방식으로는 대단한 발상이지만,
본인 같은 "세벌식 학파"-_-의 관점에서는 더 좋은 방식을 놔두고 겨우 저런 걸 자랑한다는 게 안타까운 일일 것이다.

본인은 이분이 의심의 여지 없이 서울캠에 계실 거라고 생각했는데.. 놀랍게도 근무하시는 곳이 경주캠.
쉽게 말해 본인 고향에서 제일 가까운 곳에.. 좀 과장 보태면, 엎어지면 코 닿을 곳에 계시는 국어 정보학자이다. 홈페이지는 여기... 동국대 소속답게 아주 독실한 불자이신 듯하다.
본인과 아는 사이인 분이어서가 아니고, 그냥 좁고 좁은 세상이 놀라워서 인물 탐방 블로그 포스트를 또 올리게 됐다. ^^;;
아주 옛날, 정부 과천 청사에서 글자판 전문 위원회 할 때 저분과 서로 대면한 적은 있다.

Posted by 사무엘

2010/12/28 09:10 2010/12/28 09:10
, ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/439

본격 한글 기계화 논평.

1. 나랏글의 장점
- 왼쪽이 자음, 오른쪽이 모음인 구조여서 양 손가락--양 손 아님--의 교대가 얼추 되는 게 아주 좋음 (천지인은 상하 구분)
- 모호성이 없고 구조가 직관적임. 동일 키의 3연타가 없는 것도 좋음
- 2003년부터 7년이 넘게 사용해 왔기 때문에 개인적으로 아주 익숙함

2. 나랏글의 단점
- 12키가 모두 한글을 입력하는 데 쓰이기 때문에 문장 부호 하나만 입력하려 해도 모드를 바꿔야 함. 아주 불편한 점
- 자음과 모음을 가리지 않고 시도 때도 없이 가획 키를 누르는 게 마치 Shift를 누르는 것처럼 번거롭게 느껴짐

3. 천지인의 장점
- 일부 나랏글로 복잡하게 가획을 해야 하는 자음이 적은 타수로 입력될 때 심리적으로 편안함을 느낌. 마치 세벌식에서 Shift를 눌러야 하는 받침 ㄷ· ㅌ 같은 걸 두벌식으로는 곧바로 입력하듯이.
- 10키만 사용하는 관계로, 한글 모드에서 *, # 키를 통해 문장 부호와 일부 기호를 곧바로 입력할 수 있어서 아주 편리함

4. 천지인의 단점
- 역시 천지인으로도 일부 된소리는 타수가 길며, 3연타가 필요하기까지 함.
- ㅝ 같은 복잡한 모음을 천지인 세 자만으로는 조합하기가 힘듦을 느낌
- 모호성이 존재해서 음절 연속 입력이 안 되는 게 굉장히 불편하고 부자연스러움

제각기 일장일단이 있지만, 본인은 나랏글과 천지인 둘 중 하나만 고르라면 위와 같은 장단점을 종합했을 때 나랏글을 더 선호한다.
다만, 기호 입력은 천지인이 부럽다.
그런데 나랏글에다가 천지인의 기호 입력이라는 장점만 따 오는 방법은 의외로 매우 간단하다.

가획과 쌍자음 키는 어차피 한글을 조합하는 중일 때만 의미를 가지며, 한글을 조합하고 있지 않을 때는 아무 기능도 하지 않는다. 이들 키는 다른 한글 기본 자모부터 먼저 누른 뒤에 누르기 때문이다.
그렇기 때문에 한글 조합 상태가 아닐 때 *나 #를 누르면 천지인처럼 . , 라든가 ~ ! ? 따위를 다중타로 입력하게 하면 된다. 쉽죠?

물론, 이 방식을 쓰면 한글을 조합 중일 때 곧바로 마침표를 찍지는 못한다.
그때는 마치 천지인에서 '국가'와 '구카'를 구분하듯이, 한글 조합을 강제 종료한 뒤에 * #을 눌러야 한다. 그래도 음절 구분한답시고 한 타를 누르는 건, 입력 모드를 아예 기호로 잠시 바꿨다 돌아오는 것보다야 오버헤드가 월등히 작으며 훨씬 덜 불편하다. 그리고 천지인처럼 아예 한글 음절 구분이 강제로 필요한 것보다도 훨씬 낫다.

이렇게 나랏글 입력 방식에다가 천지인의 기호 입력 기능만 부분적으로 덧붙여도 전화기 문자질 생활이 훨씬 더 편리해질 것 같다는 상상을 해 본다.
다만, 나랏글밖에 모르다가 천지인이라는 신문물을 접함으로써 본인이 휴대전화 한글 입력 방식에 대해서 뭔가 대조를 하고 비교 분석을 하는 안목이 약간이나마 생긴 건 사실이다. 긍정적인 효과임.

한동안 '중국의 한글 공정' 때문에 나라가 시끄러웠다. 본인은 명색이 세벌식 지지자이고 한글 입력기 개발자이다 보니, 본인에게도 현 시국에 대해 어떻게 생각하냐는 문의가 주변에서 적지 않게 들어왔었다.

그런데 본인은 그에 대해서 이렇다 할 입장이 없다. -_-;; 사실 내가 보기엔, 한글 공정이라는 말 자체가 옛날 광우병 사태만큼이나 과장되고 부풀려진 게 많았다. 중국이 뭔데 무슨 수로 무슨 권한으로 한국 당사자부터가 통제를 못 하고 있는 남의 나라 휴대전화 입력 방식을 좌지우지한단 말인가?

과거 타자기 시절에야 글쇠배열의 통일이 절실했다. 세벌식이냐 네벌식이냐에 따라 당장 기계를 하드웨어적으로 만드는 방식이 바뀌고 타자기 모양에 따라 글꼴이 바뀌고 후폭풍이 너무 컸다.
그러나 휴대전화 세상은 모든 게 프로그래밍하기 나름이고 유동적이다. 터치스크린은 근본적으로 3*4라는 배열 자체도 customize 가능하며 특정 scheme에 조금도 얽매일 필요가 없다. 또한 태생적으로 사람의 손으로 빨리 치는 게 불가능하기 때문에, 우수한 입력 방식과 조금 열등한 입력 방식의 성능 차이가 PC/타자기만치 크게 나지도 않으며 세벌식이 그렇게 큰 의미를 갖는 곳도 아니다. (아니라면 반론 요망)

과거에 세벌식, 네벌식, 다섯벌식 타자기가 공존하는 건 국가적으로 큰 혼란이었고 누구나 글자판 통일을 염원하고 있었다. 그러나 휴대전화에서 나랏글과 천지인이 공존하는 건 사람들이 크게 불편을 느끼지 않으며, 사람에 따라서는 오히려 국가가 나서서 강제 통합하려는 걸 반대하기도 한다.

마치 철도에서 경전철은 어차피 기존 표준궤 철도와 직통 운행이 불가능한 것처럼, 휴대전화의 한글 입력 방식은 타자기와 컴퓨터 같은 기종간 글자판 통일이라는 대명제와는 다소 어긋나는 면이 있다.

내 개인적인 생각은 12키 혹은 그보다 조금만 키 수를 늘린 15~18키(스마트폰은 화면 버튼 레이아웃 디자인이 자유로우므로) 환경용으로 음절 경계 모호성도 없고 도깨비불 현상도 없는 세벌식 입력 방식은 그 실용성을 떠나서라도 어떤 형태로든 상징적인 차원에서 하나 존재는 해야 한다. 그에 대한 연구가 계속되어야 할 것이고 좀더 현실적이고 개인적인 염원으로는 아까 언급했듯이 천지인의 기호 입력 기능이 덧붙여진 나랏글 방식이라도 있으면 좋겠다.

앞으로 사람은 더욱 다양한 방법으로 기계에다 문자를 입력하게 될 것이나... 과연 200년 전에 발명된 타자기의 형태를 그대로 답습한 PC 키보드보다 더 빠른 입력 장치는 과연 나올 수 있을까? 여타 작은 입력 방식이 컴퓨터에서 닷넷 바이너리나 자바 바이트코드라면, PC 키보드는 네이티브 기계어 코드와 같은 존재로 언제까지나 남을 것 같다. 다만 손가락을 휘게 만들지 않게 좀더 인체공학적 개선은 계속되어야 할 것이다.

*****************
<날개셋> 한글 입력기 5.8과 <날개셋> 한글 입력기 3.22
간신히 공개합니다. ㄲㄲㄲㄲㄲ

Posted by 사무엘

2010/11/22 07:49 2010/11/22 07:49
, , , ,
Response
No Trackback , 11 Comments
RSS :
http://moogi.new21.org/tc/rss/response/416

안경이 제아무리 시력을 강화해 주고 눈을 보호해 주고 얼굴 외모를 살려 주고 온갖 좋은 액세서리 기능이 있다고 해도, 안경 쓸 필요가 없는 건강한 눈보다 좋지는 못하다.

휠체어가 제아무리 푹신한 웰빙 좌석이 있고 심지어 컴퓨터도 달려 있고, 전동이어서 이동도 힘 안들이고 편리하게 된다고 하더라도 사람의 건강한 다리 자체를 대신할 수는 절대 없다.

이것은 본인이 컴퓨터에서 일본어를 입력해 보면서 느낀 점이다.
자, 이제 본인이 무슨 얘기를 꺼낼지 눈치 빠른 분이라면 상상이 될 것이다.

일본어 입력기는 뭔가 휠체어 같은 존재라는 느낌이 든다.
제아무리 일본어 IME에 일본어 사전이 통째로 들어있고 환상적인 한자 변환, 전/반각 변환, 히라가나/가타카나 변환에 상용구, 맞춤법 검사기 기능까지 워드 프로세서에나 있을 법한 기능을 죄다 옮겨 놓았다고 해도..
IME 자체가 아예 필요 없이, 치는 대로 아무 제약 없이 곧바로 입력이 접수되는 알파벳/숫자 입력만치 편리할 수가 있을까?

글자 하나로도 모자라서 어절 전체를 본문에다 바로 넘겨주지도 못하고 조합 영역으로 잡고, 또 변환하고, 잘못 변환한 게 있으면 교정하고, 사전 업데이트해서 신조어 등록하고..;

수분이 몸을 무겁게 하는 것보다도 한자는 문자 생활을 더욱 무겁게 한다. 문자를 처리하는 인간의 시간을 낭비하고 비효율을 초래한다.
뭐, 한자라는 문자가 만들어진 것 자체가 인류 역사의 비극이고 한자는 당장 없어져야 할 개 쓰레기라는 식의 초딩스러운 주장을 하겠다는 게 아니다. 본인은 한자의 그 무한한-_- 제자 원리에 담겨 있는 오묘함을 인정하며, 인류가 오랜 시간 동안 한자를 이용해서 축적한 동양 문화 자산의 가치도 존중한다.
다만, 오늘날처럼 PC· 노트북도 모자라서 스마트폰까지 등장한 정보화 시대에 한자는 너무나 거추장스러운 legacy로 전락해 있다는 객관적인 현실만을 얘기하고자 할 뿐이다.

출처는 잘 모르겠다만 누군가가 말하길, 일본의 경쟁력을 떨어뜨리는 3N 중의 하나가 이런 일본어 정서법이라고 '카더라'. (일본의 무슨 메이저 통신 회사, 나리타 공항, 그리고 일본어-_-)
MS 연구소에서 근무하는 어떤 엄청 똑똑한 사람이.. 일본의 문자 입력 체계는 진짜 ㅂㅅ 장애인급이라고 혹평을 한 글을 썼다는 소식도 본인은 들은 기억이 있다.

이런 점에서 보면 한국과 일본은 태양계의 행성 중 마치 지구와 금성처럼 지리적으로는 굉장히 가깝지만, 문화적으로나 특히 문자에 관한 한은 정말 지구와 금성의 대기 구성의 차이만큼이나 극과 극인 것 같다.

물론, 아무리 눈이 건강한 사람이라도 눈을 보호하기 위해 필요하다면 가글이나 선글라스를 써야 하고,
아무리 다리가 정상인 사람이라도 빨리 이동하려면 다른 교통수단을 이용해야 한다.
<날개셋> 한글 입력기는 한글 문자 입력이라는 분야에서 휠체어 같은 존재가 아니라, 오토바이나 자동차 같은 존재이고 싶다. 이것이 본인이 생각하는 개발 철학이다.

원래 한글은 글꼴과 글자판과 코드 체계만 약간 튜닝을 하면 로마자처럼 직결식--중간 조합 상태가 존재하지 않으며 치는 대로 곧바로 찍히는-- 입력이 가능하다. 풀어쓰기가 아니라 모아쓰는 체계를 유지하면서도 말이다. 세벌식 타자기가 그 예이며 그 원리를 발견해서 처음으로 실용화한 분이 잘 알다시피 공 병우 박사이다.

하지만 그렇게까지 극단적인 튜닝을 일상화하기에는 현실이 못 따라 주는 만큼(네모 글꼴, 음절 단위 한글 인코딩, 두벌식 글자판 등), 한글 IME라는 계층이 일단 컴퓨터에서 필요는 하다. 물론 그래 봤자 중국· 일본어 IME에 비해서 한글 IME의 동작 구조는 훨씬 더 간단하긴 하다. (또한, 전화기 같은 환경에서는 워낙 글쇠 수가 적다 보니, 사실은 영문조차도 다중타 같은 IME 계층을 거쳐서 입력하며, 심지어 사전을 이용한 단어 자동 완성 기능이 존재하기도 한다.)

"기왕 IME라는 계층을 넣을 거면 IME 없이는 도저히 할 수 없는 편리한 한글 입력 기능도 넣어 보자. 세벌식은 원래 직결식 입력도 가능한 체계인데, 굳이 그 가벼움을 포기하고 이왕 중간 조합 상태를 만들 것이라면 세벌식으로만 가능한 편의 기능을 넣어 보자. 흔히 세벌식 하면 글쇠 수가 많은 걸 단점으로만 보는 경향이 있는데, 초중종 글쇠가 모두 따로 있음으로써 더 편리해지는 점도 있을 것이다."

는 것이 10년 전의 <날개셋> 한글 입력기 1.0 시절부터 지금까지 변함없는 철학이었다. 모아치기, 특정 낱자 바로 지우기, 앞 글자로 자동 달라붙기 등..! 그리고 그걸 연구하는 과정에서 덤으로, 한글 입력 방식을 범용적으로 기술하는 데 필요한 요소들을 체계적으로 정리하고 계층을 나누게 된 것이다. 여기까지 생각을 안 해 본 사람이라면, 무슨 게임이나 업무용 소프트웨어도 아니고 한글 입력기 같은 간단한(?) 프로그램이 어떻게 정올에서 입상을 했는지, 내 프로그램이 정확하게 무슨 의미가 있는 프로그램인지도 잘 이해를 못 할 것이다.

그런데, 만들고 만들고 또 버전업을 거듭하고도 <날개셋> 한글 입력기는 계속 더 만들 게 생기고, 넣고 싶은 기능이 떠오르는지 모르겠다. 지금까지 10년을 연구한 것처럼 앞으로 또 10년은 더 투자해야 정말 한글 입력기로서는 더 개선할 게 없는 완전체가 나오려나? 앞으로 두고볼 일이다.

끝으로 생각해 볼 게 있다.
그런 후진 문자를 쓰는 일본도 과학이야 그렇다 치더라도 노벨 문학상까지 배출한 상태인데 왜 우리나라는 그 우수한 문자를 갖고도 해 놓은 게 없냐는 것이다.
기술이 있는 것과 그 기술을 바탕으로 자본과 산업 인프라가 탄탄히 '축적'되어 있는 것은 다르다.
단순히 함수 f(x)의 값이 큰 것과, 그 f(x)의 값들이 꽤 긴 구간 동안 적분된 것은 차원이 다른 개념인 것이다.

제아무리 한글이 우수한 문자여도 한국어로 만들어진 고차원적인 철학 사상이나, 과학 기술 용어가 없으니 무용지물이다. 그걸 이제 와서 살려 보려고 해도 답이 별로 없다. =_=;;
아래아한글이 혼자서 제아무리 날고 기는 워드 프로세서라고 해도 워드· 엑셀· 파워포인트가 한데 뭉쳐 있는 오피스 스위트슈트를 이길 수는 없으며(실제로 아래아한글이 그런지와는 별개의 문제),
고대인들이 아무리 과학 기술이 뛰어났어도 오늘날처럼 자동차와 컴퓨터, 인터넷을 만들어내지는 못했음이 자명한 것과 비슷한 맥락이 아닐까 한다.

Posted by 사무엘

2010/10/11 09:09 2010/10/11 09:09
, , , ,
Response
No Trackback , 17 Comments
RSS :
http://moogi.new21.org/tc/rss/response/389

1945년 8월 15일, 2차 세계대전 연합국의 반대편에 서서 끝까지 막장테크를 가며 저항하던 일본이 인류 역사상 최초로 '뉴클리어'를 두 방 맞고서 무조건 항복했다. 이로써 2차 세계 대전이 끝나고, 당시 우리나라를 포함해 일본의 식민지 점령 하에 있던 민족들이 모두 주권을 되찾았다.
한국은 잘 알다시피 이 날을 광복절이라고 부르고, 일본에서는 이 날을 종전 기념일이라고 부른다.

일각에서는 일본의 갑작스러운 항복 때문에 광복군이 참전 못 했고 이 때문에 우리나라가 2차 세계 대전 전승국이 되지 못한 것을 애석해한다.
오히려 교활한 소련이 일본과의 불가침 조약을 어기고 다 이겨 놓은 싸움에 기회를 잘 보고 참전함으로써 전승국이 되었으며, 이것이 우리나라의 미래에도 치명타로 작용한 것이 사실이다. 특히 김 구 존경하는 진영에서 이 사실을 더욱 애석해하는 경향이 있다.

물론 그 말도 일리가 있을지 모른다.
그러나 일제의 갑작스러운 패망은 국어학의 관점에서는 최소한 다음과 같은 큰 행운도 안겨다 주었다는 사실을 알 필요가 있다.

첫째, 조선어 학회 사건으로 투옥되어 있던 외솔 최 현배 박사는 1945년 8월 18일에 총살 예정이었다. 주 시경의 제자이며, 연세 대학교(전신인 연희 전문학교 포함)의 교수를 역임하고 해방 후 미군정 때 당장 국어 교과서를 만든 한글학자 말이다.
그분도 나중에야 그 사실을 들었다고 한다. 광복이 딱 사흘만 더 늦어졌다면...;;; 더 이상의 자세한 설명은 생략한다.

그뿐만이 아니다. 전세가 불리해지고 이판사판 눈이 뒤집혀 있던 일본은 그 당시 9월이라든가 아니 8월 17일에만 해도, 신사 참배 거부나 조선어 학회 사건 등으로 투옥돼 있던 수많은 애국자, 지식인, 독립 운동가, 크리스천 내지 본토 거주 조선인들에 대해 홀로코스트 수준의 학살을 계획하고 있었다.

관동 대지진 때처럼, 아니 그때와는 비교도 안 되게, 어차피 내가 못 먹을 떡이면 남도 못 먹게 다 작살을 내 버리고 가자는 간악한 심보였다. 그게 실현됐다면 진짜 우리나라의 운명은 어찌 됐을까? 그 사이에 광복군이 참전해 봤자 국제적으로 얼마나 큰 영향력을 행사했겠나 하는 의문은 차치하고라도 말이다.
한글이면 한글, 교회사면 교회사, 그리고 김 삼웅 지은 <일제는 조선을 얼마나 망쳤는가> 같은 여러 분야 문헌을 봐도 동일한 결론이다.

둘째, 조선어 학회 사건 당시에 빼앗겼던 <큰사전>의 작업 원고도 일제가 허겁지겁 도망간 덕분에 서울 역 창고에서 되찾았다. 이때 조선어 학회의 사전 편찬 위원들의 기쁨은 이루 말할 수 없었다.
내가 보기엔, 일제의 통치가 장기화됐다면 이 원고는 영원히 못 찾았을 수도 있다. 일제가 불태워 버리든, 아니면 본토로 가져가 버리든 무슨 짓을 해도 했을 것이다. 민족 말살 정책에 정면으로 위배되는 작업물을 일제가 그냥 뒀을 리가 있나?

우리나라 정부는 1962년, 최 현배 박사에게 건국 훈장 독립장을 수여했으며(아직 살아 계실 때), 국가보훈처는 이번 2010년 10월, 이 달의 독립 운동가로 이분을 선정했다.

사용자 삽입 이미지

지금 한국어는 나름대로 사용 인구 세계 1x위를 당당히 차지하는 언어이며, 외국에서도 학습자를 찾을 수 있다. 이제 최소한 국력이 약해서 정치상의 이유로 말살당할 수는 없는 탄탄한 지위를 획득했다는 뜻이다. 공대의 특성상 온통 영어 일색이던 학부 시절과는 달리, 이 대학원에서는 한국어를 유창하게 구사하면서 한국어 교사를 꿈꾸는 중국인, 일본인 유학생들을 본인은 심심찮게 본다.

앞으로도 우리나라가 경제적으로 계속 잘 살아 주고 대외 이미지가 좋아야 한국어로 먹고 살려는 사람들도 어깨 펴고 살 텐데 말이다.
그러나 요즘 현실은 자국인들부터가 못 살겠다고, 먹고 살기 힘들다고 결혼 기피하고 애 안 낳는다. -_-;; 캐안습.

Posted by 사무엘

2010/10/09 08:03 2010/10/09 08:03
, , , ,
Response
No Trackback , 4 Comments
RSS :
http://moogi.new21.org/tc/rss/response/388

« Previous : 1 : 2 : 3 : 4 : 5 : Next »

블로그 이미지

철도를 명절 때에나 떠오르는 4대 교통수단 중 하나로만 아는 것은, 예수님을 사대성인· 성인군자 중 하나로만 아는 것과 같다.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2021/10   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

Site Stats

Total hits:
1670218
Today:
311
Yesterday:
598