김 용묵의 절대공간

Search Results for '언어 정보학'

124 POSTS

« Previous : 1 : ... 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : 10 : ... 13 : Next »

한글 연구 진영에 대한 생각

Posted at 2015/06/08 08:28
Filed under 언어 정보학/한글 기계화

외국인 중에서 한글에 대해서 정말 경이로운 체계를 가진 우수한 문자라고, 심지어 라틴 알파벳보다도 더 훌륭하다고 극찬을 늘어놓은 석학들이 있다. 개중엔 재레드 다이아몬드처럼 언어학이 아니라 단순히 다른 인문학 분야를 전공한 사람도 있지만, 언어학을 본격적으로 전공한 학자, 그것도 레알 엄청난 괴수 중에도 한글 예찬론자가 있다.

이것 자체는 기록이 다 남아 있고 출처 검증도 가능한 엄연한 팩트이므로 더 의심하지 않아도 된다. "무슨 소수 민족에게 한글 보급"과 같은 급의 루머가 아니다.
또한, 창조과학은 생물학이나 지질학, 천문학을 직접 전공하지 않은 타 분야의 공학 박사나 의사들이 민다고 까이는 반면, 한글 예찬론은 일부나마 실제 현업 언어학자들로부터 지지를 받고 있으니 성격이 좀 다르다.

시카고 대학교의 제임스 맥콜리 교수는 잘 알다시피 한글날은 전세계의 언어학계가 다함께 경축해야 하는 날이라면서 10월 9일엔 휴강을 했던 것으로 유명하다.
연세 대학교가 배출한 가히 세계적인 언어학 석학인 김 진우 교수도 학부 모교로 돌아와서 석좌교수 명목으로 잠시 강의를 하던 때엔, 2학기에 한글날이 낀 주엔 문자의 역사 강의를 했다. 내가 수업을 듣던 시절에도 종종 한글 감탄을 늘어놓았으며, 한글날이 국경일이 아닌 것은 정말 통탄할 일이라고 말씀을 하셨다. (2011년, 아직 국경일이 아니던 시절에)

물론 꼭 그렇게까지 감흥을 느끼지는 않는 학자들도 있으며, 오히려 저런 식의 생각을 문화 제국주의니, 한글 쇼비니즘이니 뭐 이상한 꼬리표를 붙여서 불쾌하게 받아들이는 사람들 역시 없지는 않다.
이런 와중에 미천한(?) 본인이 한글이 우수하네 어떻네 하는 오래 된 고리타분한 논쟁에 불을 추가로 지피고 싶지는 않다. 그러나 관찰을 통해 발견할 수 있는 분명한 팩트를 하나 지적하고자 한다.

"한글은 뭔가 천재들을 매료시키고 오덕질 거리를 제공하기에 충분한 특성은 갖추고 있는 것으로 보인다."
그렇지 않고 단순히 한글이 한국어만 잘 표기해 내는 세계의 여러 평범한 문자들 중 하나일 뿐이라면, 한국어가 모국어가 아닌 외국의 언어학 석학 중에 한글 예찬론자가 나타날 수가 없었을 것이다.
또한 공 병우 박사처럼 언어와는 거의 관계 없는 전공이던 천재 공돌이 의학자가 갑자기 하필이면 한글 덕후 타자기 덕후로 돌변할 수도 없었을 것이다.

그래서 지금 있는 한글 자모나 한글 맞춤법 체계에 만족하지 못하고 한글을 외국어의 다른 음성을 표기하는 용도로도 쓸 수 있게 확장해야 한다고 주장하는 분들이 여럿 있다. 이 역시 주장자 중에는 이공계 박사나 의사 등, 스펙이 비범하긴 하지만 언어학만을 깊게 공부하지는 않은 사람이 있는가 하면, 음성· 음운론을 통달한 저명한 언어학자도 있다. 이 현복 교수 같은 엄청난 분도 그 중 하나이니까.. 그러니 이것은 단순히 비전문가 한글 덕후의 마이너한 재야 학설 정도로 마냥 치부할 문제도 아니다.

지금의 암호 같이 배배 꼬인 IPA 부호보다 더 체계적이고 알아보기 쉬운 음성 부호 체계가 한글의 제자 원리를 바탕으로 만들어진다면 그건 나름 의미있는 일일 것이다. 단, 거기에는 여러 전제조건과 단서가 붙어야 하고 현실적인 한계를 감안해야 할 것이다.

1. 당연한 말이지만, 그것은 지금 한국어를 표기하는 한국어 정서법(일명 한글 맞춤법)과는 완전히 별개로 따로 가는 체계가 되어야 한다. 한글의 표기 능력 같은 걸 떠나서 한국어에는 영어 F나 TH 같은 음가 따위는 존재하지 않는다. R과 L을 똑같이 ㄹ로 적는 이유는 한글을 모독하기 위해서(?)가 아니라 그게 한국어에서 음운론적인 변별 요소가 아니며, 고로 굳이 구분해서 적을 필요가 없기 때문이다.
과거에 조선어 학회가 무단으로, 혹은 심지어 일제와 결탁까지-_-해서 옛한글 자모를 없애고 훈민정음을 한글로 절뚝발이로 만들어 버렸다고 얘기를 하는 분을 보면.. 으음, 숨이 탁 막힌다. 나머지 뒷부분의 주장까지 신뢰성이 팍 깎이게 된다.

2. 옛한글 자모는 어떻게 활용할 것이며 한국어에 없는 소리를 어떤 규칙대로 새로운 글자에다 대응할지.. 통일이 잘 돼야 한다. 허나, 국내에 계신 한글 확장 연구가들은 내가 알기로 제각각 정말 개성 넘치고 자기 지론과 고집이 강한 분들이다. 과연 호락호락 합의가 가능할까? 아래아의 음가조차도 정확하게 모르는 마당에 하물며 다른 글자들은.. 글쎄다.
또한 한글이 기본적으로 제공되는 모음이 풍부한 건 사실이지만, 발성 기관의 모양을 본뜬 자음과는 달리 모음은 기하학적인 수직· 수평선과 점뿐이다. 이런 제자 컨셉만으로 단순히 이중모음이 아니라 IPA의 온갖 이상한 모음들을 다 그려낼 수 있을지에 대해서도 생각해 봐야 한다.

3. 알다시피 유니코드가 제정되고 BMP 영역은 마치 IPV4 주소만큼이나 사실상 고갈이 임박한 이 시점에서..
인제 와서 컴퓨터에서 예전에 없던 문자를 새로 만들어 통용하는 건 굉장히 부담이 큰 모험이다. 더구나 조합을 해서 상황에 따라 달리 표현하는 건 거의 불가능에 가까워졌다고 봐야 한다. 새로운 한글 확장 부호가 겨우 PUA 영역에만 머무르는 듣보잡이 아니라 정식으로 등재되어 쓰이려면, 국가 표준이든 대중적인 표준이든 정말 갈 길이 멀다. 그런데 그것이 과연 가능할까.

4. 새로운 한글 입력법을 같이 제안하는 분도 있다. 단, 이들도 PC에서의 표준 두벌식 글자판과 대놓고 싸우지는 않는다.
그나마 표준 두벌식 다음으로 인지도가 제2순위로 높고 모든 데스크톱 운영체제에서 이미 지원까지 되고 있는 가장 이상적이고 합리적인 대안이 바로 공 병우 세벌식인데.. 이마저도 전체 사용자 수는 1%가 채 안 된다.

그러니 하물며 이것보다도 더 마이너들은 동일한 조건에서는 전혀 승산이 없다고 봐야 한다. 그 대신 다른 차별화 요소를 통해 틈새시장을 공략하는데, 크게 (1) 모바일, (2) 장애인 접근성, (3) 지금까지 얘기했던 외국어 표기를 위한 다른 정서법으로 나뉜다. 허나 내가 보기엔 이것들도 이젠 그 많은 연구자들이 아웅다웅 다투기에는 그릇 크기가 너무 작은 레드 오션이다.

마치 이족 보행 로봇이 창작물이 아니라 현실에 등장할 가능성만큼이나 이건 녹록치 않은 문제이다.
그래서 나는 없는 정서법을 새로 만들려는 시도는 감히 하지 않는다.
개인적인 생각으로는, 음성 부호 연구보다는 이미 있는 한글 체계에 대해서 세벌식 글자판 연구나 훨씬 더 중요하게 국가 차원에서 진행했으면 좋겠다. 한국어+한글 기성 체계만으로 domain을 한정하더라도 입출력 기술 쪽으로 한글의 고유한 특성을 활용해서 새로 개발해야 할 것이 즐비하다. 그리고 그것이 나의 관심사이다. 자세한 사항은 아직 기밀이다만.

각 사람들이 자기 오덕 기질과 똘끼를 발휘하여 한글을 응용한 솔루션을 내놓고, 그것이 자연스럽게 시장의 선택을 받아서 채택되거나 도태한다면 나쁠 게 없는 현상이다. 허나 시장이라는 게 그렇게 건전하게만 돌아가는 게 아니고, 또 얼치기 한글 장사꾼이 나랏돈 타서 병크를 다 저질러 놓음으로써 나중에 동일 분야의 후학에게 돌아갈 혜택과 지원까지 막아 버린다면.. 이건 좀 큰 문제이고 비극인 것 같다. 이 문제를 어찌하면 좋을지 고민된다.

한 줄 요약: 한글은 독창적이고 과학적이고 충분히 우수한 문자인 건 틀림없다. 허나, 한글의 우수성을 살리고 싶다면 솔까말 음성 부호 연구보다는 지금 상황에서는 세벌식 연구가 훨씬 더 필요하고 절실하다.

Posted by 사무엘

Tag: 한글
Response: No Trackback , 4 Comments
RSS :: http://moogi.new21.org/tc/rss/response/1102

Comments List

허국현 2015/06/10 09:04 # M/D Reply Permalink

외국인 한글 교육 사이트를 돌아 다니다 보면, 자주 보이는 질문들 중 하나가, "ㄱ은 K인가요? G인가요?"입니다. 사실 변종도 많습니다. (ㅈ은 j인가요? ch인가요?, ㄷ은 d인가요? t인가요? ㅂ은 B인가요? P인가요? 등)

한국어 자음는 발음의 세기에 따라 정해지지, 유성음, 무성음에 따라 정해지지 않습니다. 그러다 보니, 이 부분이 헷갈릴 수밖에 없습니다. 규칙이 있는가 알아 보려고 했는데, 첫번째 나오는 것은 무성음이다 외에는 두번째 나오는 것부터는 답이 없더군요. 정말 그때그때 달라요였습니다. "이히리기우구추" 수준으로 다 외우세요밖에 답이 없을 정도로...

아마 한글로 음성 기호를 만든다면 유성음, 무성음 문제도 해결해야 할 것입니다.
1. 사무엘 2015/06/10 10:23 # M/D Permalink
  
  네, 그렇습니다. 듣보잡 나라 언어도 아니고 당장 이웃 일본어를 표기하는 데에도 유· 무성음의 구분이 필요하죠. F 같은 것만 신경 쓸 때가 아닙니다.
  뭐 사잇소리만 해도 정말 답이 없는 지경인데, 유/무성음이 설마 그거보다 더 복잡하겠어요? ㅎㅎ
김재주 2015/06/10 14:10 # M/D Reply Permalink

오랜만에 한글 얘기 나왔으니 말인데요. 혹시 노마 히데키 교수의 "한글의 탄생" 이란 책 읽어 보셨는지요? 예전에도 추천했던 것 같은데, 일본인들을 대상으로 한자->구결->가나로 이어지는 전통적인 한자 기반 문자체계를 소개하고, 그와는 완전히 독창적인 한글이 어떻게, 누구에게서 탄생했는가, 어째서 한글이 과학적인 문자인가 등등을 민족주의적 시각에서 벗어나 상당히 객관적인 시점에서 서술하고 있습니다(저자가 일본인이니까요)

우리말로도 번역이 되어 있는데, 한국인 입장에서도 꼭 읽어봐야 한다고 생각합니다.
1. 사무엘 2015/06/10 17:04 # M/D Permalink
  
  네, 오랜만에 한글 얘기 하지요? ㅎㅎ
  전에도 한번 언급하신 적이 있었습니다. 저 같은 연구자에게 꼭 필요한 문헌이랍니다.
  한번 보려고 생각은 했는데 미처 그러지 못했네요. 검색을 해 보니 마침 학교 도서관에도 비치돼 있고.. 지금 기말 과제 때문에 빌린 책을 반납해야 할 때가 곧 오니 그때 도서관에서 꼭 볼 생각입니다. ^^

우리말 관련 생각들

Posted at 2015/06/05 08:42
Filed under 언어 정보학/우리말

또 오랜만에 우리말 관련 뻘생각들을 투척한다.

1.
여자의 멸칭 '년'은 한자어가 전혀 아닌데, 남녀를 싸잡아 부르는 멸칭은 왜 '년놈'이 아니고 '연놈'이라고 두음법칙이 과잉 적용돼 있는지 나로서는 전혀 이해가 되지 않는다. ㄴ 음가를 빼서 ㅇ으로 바꿔야 할 하등의 이유가 없다.

2.
'박다'와 '받다'에는 모두 다의어 명목으로 '충돌하다/부딪치다'라는 뜻이 있다. 그런데 둘의 차이가 뭘까? 표준 국어 대사전의 풀이는 다음과 같다.

박다 01
「9」머리 따위를 부딪치다.
받다 02
「1」머리나 뿔 따위로 세차게 부딪치다.

공식 석상에서 더 정확한 단어로 인정되는 것은 '받다'인 듯하다. '들이받다'가 있으니까.
그런데 <블랙박스로 본 세상> 같은 프로를 보면, 사람들은 전부 '박았다'라고 말을 하는데 자막은 온통 '받았다'라고 보정을 해서 나가는 게 본인이 보기엔 굉장히 어색했다.

차와 차가 부딪친 것은 '들이받다'뿐만이 아니라 '꼬라박다' 같은 말도 쓴다.
사전의 뜻도 비슷해 보이는데, 현실을 반영하여 '박다'와 '받다'에 대한 더 정확한 관계가 정립되어야 하지 않나 싶다. 구어 말뭉치까지 분석을 해야 하려나?

3.
현재 사전에 '뱃속'이라는 단어는 오로지 다음과 같은 비유적인 의미만 풀이되어 있다.

‘마음01’(사람이 본래부터 지닌 성격이나 품성.)을 속되게 이르는 말.

즉, 뱃속에 있는 것이 마음의 상징인 심장이라고 본 것이다.
그러나 현실에서 뱃속은 마음과는 다른 뜻으로 훨씬 더 많이 쓰이며 이는 말뭉치를 분석해 보면 금방 알 수 있는 사실이다.
"뱃속의 아기", "뱃속에 들어간 음식" 등, 소화기관이나 자궁 용례가 더 많다. 배의 속에는 심장만 있는 게 아니기 때문이다. 이런 것을 국어사전이 반영해야 하지 않나 싶다.

4.
언어학에는 동사가 기술하는 동사의 방향성을 나타내는 '태'(voice)라는 개념이 있다.
그런데 우리말에서 한자어에 접사가 붙어 동사가 되는 단어들을 보면, 태는 그 단어 자체의 의미에 의해 결정될 때가 있는가 하면, 그 접사에 의해 결정될 때도 있다. 이게 굉장히 뒤죽박죽이며, 국어사전은 이런 걸 딱히 명확하게 결정하지 않는 편이어서 혼란이 더욱 가중된다.

시키다: 남을 하게 함
하다: 자기가 뭘 함(자동사), 남을 뭘 하게 함(타동사?)
되다: 자기가 뭘 당함
되어지다: (비공식. 마치 이중과거만큼이나 이중피동?)

단어마다 위의 태 매핑이 정확하게 어떻게 되는 걸까?
예를 들어 지금 킹 제임스 흠정역 성경에는 창세기부터 계시록을 통틀어 '소멸하다'라는 단어가 없다. '소멸되다'와 '소멸시키다'만 있다. 남을 없애는 건 '시키다'이고, 자기가 없어지는 건 '되다'로만 옮겨졌다.
'소멸하다'라고만 써 놓고 consuming fire을 '소멸하는 불'이라고 써 놓으면, 이게 꺼져 가는 불인지 아니면 다른 걸 태워 없애는 불인지 언뜻 봐서 분간이 안 된다는 것이다.

비슷한 이유로 인해 '오염'이나 '마취' 같은 단어도 동사가 될 때엔 '시키다' 아니면 '되다'만 붙지, '하다'는 거의 안 붙는 실정이다. 이런 현상에 대한 국어사전의 공식적인 규명이 필요하다고 여겨진다.

5.
(1) And의 처리 문제랑, (2) 정관사 the의 표현 문제, (3) 과거 시제를 "-니라"라고 뭉뚱그리는 건
우리말 성경의 번역에서 정말 영원한 아킬레스건으로 남지 싶다.
뭐 특정 역본만의 문제는 아니다. 한국어의 구조적인 한계에 가깝기 때문에.
그리고 And it came to pass도 이거 번역하는 방법이 없을까?

6.
'장'은 page(페이지 수 단위)랑 chapter가 굉장히 헷갈리고,
'절'은 verse랑 clause(주어 술어가 갖춰진 안긴문장 단위)가 굉장히 헷갈릴 때가 있다.
우리말 순화를 연구하려면 괜히 잘만 쓰이고 있는 다른 외래어들을 다듬을 게 아니라 이런 것들부터나 좀 확실하게 구분하는 우리말을 만들어서 국립국어원 차원에서 밀어 붙였으면 좋겠다.

7.
"어머니께서 내게 과자를 만들어 주셨다"라는 문장을 길게 영작하면 My mother made cookies for me. 정도가 된다.
그런데 잘 알다시피 요건 그냥 My mother made me cookies. 라고 해도 된다. 중학교 영문법상으로는 전자와 후자는 각각 3형식과 4형식이다.

하지만, 맨 첫 예문에서 목적어가 me 정도가 아니라 엄청나게 길면.. 예를 들어 children who have never eaten anything since yesterday 정도 되면.. 영어는 길고 복잡한 덩어리는 뒤로 빼는 걸 좋아하는 언어이다. 오죽했으면 가주어 it까지 있을 정도이고.. 그러니 그때는 cookies for children who ... 이렇게 가는 게 훨씬 나은 작문이다. 또한 영어는 3음절 이상 정도 되는 긴 형용사는 비교/최상급도 -er, -est를 안 붙이고 more / most로.. 이것 자체도 형용사인데 부사로 임시로 품사통용이 된다.

이것과 비슷한 맥락으로, 길이에 대한 선호 편차가 한국어에 존재하는 대표적인 예는 아마 긴 부정과 짧은 부정이지 싶다. '안'이 자연스럽게 붙을 수 있는 용언과, 그렇지 않고 '-지 않다'로 써 줘야 하는 용언의 차이를 규명하라고 하면 한국어 토박이에게도 쉽지 않을 것이다.

8.
우리말에서 품사 통용 때문에 헷갈리는 문법 요소 4천왕은 조사, 어미, 접미사, 의존명사이다. 이를 다음과 같이 표로 정리해 보았다.

	어미 (E*)	접미사 (X*)	의존명사 (NNB)
조사 (J*)	완전히 다름. AND: 와/과/랑(조사) vs 고/며 (어미)	너희들(접미사) 다 안녕들(조사) 하신가?	너뿐(조사)만이 아니라 나도 그렇게 했을 뿐(의존명사)이었다.
어미		그림(명사 파생 접미사)을 잘 그림(명사형 전성어미).	이곳에서 산 지(의존명사)는 오래 됐지만 계속 여기서 살지(어미)는 모르겠다.
접미사			그 김 씨(의존명사)는 김씨(명사 파생 접미사) 집안의 자랑이다.

위의 표는 헷갈리기 쉬운 품사 위주로 둘씩만 비교했지만, 실제로는 한 단어가 셋 이상의 품사가 통용되기도 한다. 예를 들어 '지'는 위의 표에서는 언급되지 않았지만 명사 파생 접미사도 되며, '들'에도 의존명사 의미가 있다.

9.
그리고.. 이건 아마 예전에도 했던 말일 텐데,
개인적으로 '다르다'와 '틀리다'는 반드시 구분해서 쓰도록 하고 국어사전에서도 different를 '틀리다'라고 쓴 것은 "'다르다'의 잘못"이라고 선을 그어 줬으면 좋겠다.
그 반면에 '서, 세, 석' 같은 단순 발음 편의를 위한 불필요하고 쓸데없는 구분에 대해서는 관용을 베풀어서 "'세'로 통일을 원칙으로 하되 '석 장'도 허용" 같은 식으로 나갔으면 좋겠다.

그리고 '맞다/맞는다'가 개판인 것, 그리고 '와/과'가 접속조사(and)뿐만 아니라 부사격조사(with)의 뜻도 있어서 굉장히 불편한 것 역시 이미 예전 글에 언급돼 있기 때문에 여기서는 생략하겠다.

Posted by 사무엘

Tag: 언어, 한국어
Response: No Trackback , No Comment
RSS :: http://moogi.new21.org/tc/rss/response/1101

여러가지 글꼴 생각

Posted at 2015/05/10 08:27
Filed under 언어 정보학/폰트

1.
요즘 대세가 복고풍 타이포그래피인지? 옛날목욕탕체, 배달한나체가 정말 인기 많다. 영화 국제시장도 그 성격상 복고풍 서체로 포스터가 만들어졌다.
옛날에는 복고풍 서체라 하면 정말로 궁서체와 휴먼옛체 정도밖에 선택의 여지가 없었는데 이런 분야에도 다양한 서체가 존재한다는 건 그만큼 우리나라가 문화적으로 풍족해졌음을 의미한다. 게다가 라틴 알파벳과는 달리, 한글 서체는 주 사용 인구가 1억도 채 안 되는 내수 시장에서밖에 수요가 없는데도 말이다.

한글에 대해서 옛날 스타일 서체를 꾸준히 고집하고 있는 곳이 최소한 두 곳 떠오르는데
하나는 철없는 전직 부사장이 저지른 땅콩 회항 사건 때문에 이미지를 제대로 구겼던 대한항공이고, 그리고 다른 하나는 육사 부대 마크이다.

비행기 동체의 윗부분에 큼직하게 KOREAN AIR라고 써 놓은 거 말고, 앞부분 아래에 자그맣게 '대한항공'이라고 쓴 부분이 내게는 오래 전부터 인상깊게 와 닿았다. 저 한글 로고그래피는 대한항공이 지금과 같은 치약 하늘색 도색과 영문 CI를 도입하기 전부터 계속 써 오던 물건이다.

육사 부대 마크는 무려 1947년부터 써 오던 것이니 보수적인 군대에서 앞으로도 당연히 계속 쓸 테고.
대한항공이든 육사든, 한번 정한 서체는 자기 정체성을 걸고 안 바꾸고 계속 썼으면 좋겠다.
개인적으로는 서울 지하철 초롱테크 지하철체.. 시각적으로 아무 문제 없는데 무단으로 뜯어고치고 바꾸는 거 마음에 안 든다.
그나저나 옛날 철도 간이역 역명판 서체들도 디지털로 복원하고 싶다. 자료를 많이 모아야 할 텐데.

2.
요건 출근길 지하철 안에서 본 광고판이다.
이 정도면 복고풍 서체가 아니라 혹시 북한 서체이지 않나 싶어서 원전을 찾아보니..
ㅇ의 모양, 그리고 '교'의 모양이 북한 서체를 아슬아슬하게 비껴 가긴 한다.
하지만 첫인상이 여전히 서로 굉장히 닮아 보인다.

3.
베트남은 언어는 중국어와 비슷하게 성조도 있고 1음절 1형태소 1글자 고립어 형태인 것 같은데 그럼에도 불구하고 문자는 프랑스 선교사의 주도로 개혁을 해서 한자를 완전히 없애 버리고 라틴 알파벳을 쓴다. 그래서 분위기가 이색적이었다.
단, 성조를 표기하려고 알파벳의 위· 아래에 이상한 부호들이 많이 달려 있다.

그리고 베트남이 자체적으로 서체를 만들 만한 나라는 아니니, 간판들을 보면 다들 MS Word 95나 아래아한글 96처럼 10년, 20여 년 전부터 기본으로 내장돼 있던 듯한 1990년대 기성 서체들 위주이다.
Cooper Black을 정말 많이 봤고, 그 외에 Copperplate Gothic, Impact, Matura MT Script도 있었다.
그 글꼴이 처음 만들어지던 시절에는 굉장히 참신한 디자인이긴 했지만, 이것도 익숙해지니까 식상하다.

그건 그렇고, 이건 뭘까?

대문자 A의 외곽 획이 활처럼 둥글게 휜 윗줄의 서체도 많이 쓰이는 편이었는데 개인적으로는 좀 낯설다. 그 반면 아랫줄 서체는 우리에게도 비교적 친숙할 것이다.
바로 한미디어에서 개발하고 MBC가 2000년대 초까지 자사 CI에다 썼던 문화방송체이기 때문이다.
저 사람들이 설마 한국산 서체를 썼을 리는 없으니 저것도 영문 원도가 따로 있는가 보다. 알고 보니 원조는 Banco라는 별도의 서체라고 한다.

4.
본인은 직접 써 본 경험은 전무하지만, 클래식 맥 OS에 대해 어느 정도 동경을 하고 있다. 특히 쟤네들의 기본 서체가 참 개성 있다고 생각해 왔다. 아래 그림에서 File, Edit 같은 메뉴, 그리고 System Tools/Folder를 표현하는 서체 말이다. 맥 OS의 Windows System 같은 서체나 마찬가지이다.

이 맥 OS의 서체 이름은 Chicago이다. Windows 95의 코드명인 그 시카고. 나중에는 비트맵뿐만이 아니라 윤곽선 글꼴로도 만들어졌다. 특히 V와 w 같은 글자의 모양을 보노라면 비트맵과 윤곽선 글꼴이 싱크가 잘 맞는 것 같다.

그러고 보니 타이포그래피와 디자인을 좋아하고 컴퓨터를 하드/소프트 독점 일체형으로 만들었던 애플에서는 OS가 이름이 없이 그냥 System이고 애플 전속 서체는 이름이 있었던 반면, 처음부터 소프트웨어에 초점을 뒀던 마소의 Windows는 프로그램이 이름이 있고 서체는 딱히 이름이 없이 그냥 System이다. 아주 재미있는 차이가 아닐 수 없다.

Windows쪽 얘기를 좀 하자면, 1과 2 시절에는 시스템 기본 글꼴이 고정폭이었다. 그러다가 3.0때부터 오늘날과 같은 가변폭 System이 도입되고 예전의 글꼴은 그 유명한 Fixedsys라는 이름으로 개명당했다. 모노크롬 시절에는 byte align이 힘들어서 성능 오버헤드가 더 크기도 했을 텐데 맥은 처음부터 과감하게 1.0때부터 가변폭 글꼴을 채용했다.

Fixedsys는 Windows 1.0 시절에 비트스트림이라는 유명한 서체 회사에 외주를 줘서 개발한 것인 반면, 오늘날의 가변폭 시스템은 마소에서 자기네 정체성을 담아 자체 개발한 글꼴이다. 그러니 System을 그 모양 그대로 윤곽선화해서 이름을 붙일 법도 했을 텐데 마치 현대 자동차에서 포니, 엑셀, 스텔라 같은 이름에 애착이 없는 것만큼이나 마소에서는 그 옛날 글꼴에는 더 애착을 갖고 있지 않은 듯하다.

이미 구닥다리의 상징에, 시스템 리소스가 다 떨어졌을 때에나 나오는 fallback 이미지가 너무 굳어져서인 듯. 게다가 NT 계열 부터는 리소스 제약도 없어져서 더 볼 일이 없어졌다. -_-;; 동아시아 Windows에서 이상하게 MS Sans Serif 대신 System을 쓰던 구닥다리 Visual C++ 6.0 IDE가 마지막이다.

System, Fixedsys 같은 건 트루타입 글꼴이 개발되기 전부터 도입됐기 때문에 당연히 TTF 형태가 아니다. 그래도 운영체제에 완전히 하드코딩으로 박힌 물건은 아니고, 오늘날도 Windows\Fonts 디렉터리에서 vgasys.fon, vgafix.fon이라고 실물 파일을 확인할 수 있다. 1980년대까지는 '장치 독립적인 글꼴'이라는 개념이 없었기 때문에 신기하게도 글꼴 이름이 저런 형태이다. 맥은 그 시절에 어떠했나 모르겠다.

뭐 그런 것과는 별개로, 본인은 한글 전산화의 역사와 추억이 깃든 과거의 16*16 비트맵 조합형 글꼴들도 윤곽선 글꼴로 리메이크가 많이 됐으면 좋겠다. 이야기체나 둥근모 같은 것들. 가장자리를 동그랗게 혹은 적절한 곡선으로 복원해 주면 이런 것이야말로 진정한 복고풍 서체의 위업을 달성할 수 있지 않겠나 싶다.

Posted by 사무엘

Tag: 폰트
Response: No Trackback , 4 Comments
RSS :: http://moogi.new21.org/tc/rss/response/1091

Comments List

정 용태 2015/05/20 21:46 # M/D Reply Permalink

16*16 글꼴의 리메이크 버전 저도 기다리고 있습니다! ㅋㅋ 그러고보니 예전에 자주 볼 수 있었던 "Seoul"체 (한글매킨토시 OS 번들글꼴) 이 많이 보이지 않네요.
1. 사무엘 2015/05/21 01:50 # M/D Permalink
  
  지금은 '서울'이라는 이름이 붙은 다른 서체들에 가려서 제대로 검색이 안 되지만, 클래식 맥 OS의 그 투박한 한글 글꼴을 말하는 거라면 저도 뭘 말씀하는지 알겠습니다.
  요즘은 전광판도 다 고해상도 LCD가 등장하면서 16*16 글꼴은 정말 빠른 속도로 사라지고 있지요. 얼마 못 가 <날개셋> 편집기 같은 왜곬스러운 프로그램에서나 보게 될지도 모르겠습니다. 그래도 얘도 언젠가는 복고풍 서체로 복원되는 날이 분명 올 거라 생각됩니다. ^^
pastopia 2016/03/02 20:24 # M/D Reply Permalink

안녕하세요. Copperplate Gothic 서체의 상업적 이용이 가능한지 찾고 있습니다.
혹시 알고계시면 알려주실 수 있으세요?
1. 사무엘 2016/03/02 23:00 # M/D Permalink
  
  그 글꼴은 원도가 만들어진 지 100년도 더 됐고, Office 같은 프로그램에서 이미 번들로 제공하거나 인터넷에 굴러다니고 있지 않나요? 저도 정확한 정보는 알지 못하지만 상업적 이용에 다른 문제는 없을 겁니다.

우리나라의 IT 원로 열전 & 공 박사와 성 박사의 만남

Posted at 2014/08/13 08:35
Filed under 언어 정보학/한글 기계화

가끔은 컴퓨터라는 물건이 발명된 지가 아직 100년도 채 안 됐다는 게 도저히 믿어지지 않을 때가 있다. 세상을 이렇게 완전히 180도 뒤바꿔 놓은 기계가 역사가 그렇게도 짧다니! 그 내력이 최소한 전화기나 자동차의 역사 정도는 될 법도 해 보이지만 실제로는 그렇지 않다. 하긴, 텔레비전이 컴퓨터보다 약간 더 일찍 발명된 정도다.

오늘날의 컴퓨터와 비슷한 컨셉이라도 탑재된 물건이 최초로 등장한 시기는 아무리 일찍 잡아도 2차 세계 대전 이후이다. 전자식+2진법+튜링 완전+프로그램 내장형 같은 기본 중의 기본 단서만 추가해 줘도 시기는 더 늦어진다. 그리고 그것마저도 덩치와 성능은 오늘날 우리가 쓰는 노트북과 스마트폰하고는 차마 비할 바가 못 됨은 주지의 사실이다.

컴퓨터가 2차 세계 대전 이후의 산물이라는 건, 다시 말해 단군의 후손들이 역사상 컴퓨터라는 걸 접한 시기는 오로지 '대한민국' 시대가 유일하다는 뜻이다. 일제 강점기나 조선 시대엔 그런 거 없었다. 그러니, 세계의 컴퓨터 역사뿐만 아니라 그 컴퓨터를 처음으로 우리나라에 도입하고 전산망을 개설한 선구자들의 전설의 레전드를 공부해 보는 것도 전산/컴공 전공자이든 비전공자이든 흥미로운 경험이 될 것이다.

우리나라에는 이 분야의 거장으로 성 기수 박사(1934-), 전 길남 박사(1943-)가 있다. 난 성 박사는 고등학교 때 어느 인터넷 사이트를 통해 아주 아주 대단한 분이라고 우연히 알게 됐다. 전 박사는 알지도 못하다가 대학에 진학해서야 내가 다니는 학교의 학과에 소속돼 있는 만렙 명예교수 중의 한 분 정도로나 접하게 됐다.

두 분 다 업적이 워낙 전문적이고 비가시적인 곳에 있는지라 대중적으로 유명하지는 않다. (2011년 10월에 1주일 간격으로 나란히 세상을 떠났음에도 불구하고 스티브 잡스와 데니스 리치의 대외 인지도의 차이를 생각해 볼 것!)
그러나 굳이 따지자면 아무래도 전자보다는 후자가 약간 더 유명하다. 우리나라 인터넷의 아버지라고 최근에 웹툰도 올라왔고 이게 각종 SNS에 퍼날라지면서 반짝 뜨곤 했다. 독자 여러분에게도 일독을 권한다.

(1982년 5월 15일, 구미 전자 기술 연구소와 서울 대학교 사이에 국내 최초 원거리 컴퓨터 네트워크 교신에 성공. 이건 모뎀이냐 랜이냐 뭐냐? 무슨 물리 메커니즘으로? 으음...;;)

저분은 은퇴한 뒤에도 활발히 활동하고 계시고, 게다가 저 웹툰을 보고는 작가에게 고증 오류 피드백까지 친절하게 해 주셨다고 한다. 여담이지만, 저분의 배우자가 여성 운동가인 조한 혜정 교수라니 깜짝 놀랐다.

최근의 강연 내지 인터뷰에서 전 박사는 인터넷은 너무나 대중적으로 퍼진 만큼 앞으로는 좀 더 안전해져야 한다고 거듭 강조한 적이 있다. 안티바이러스 프로그램의 개발자로 유명한 카스퍼스키는 강력한 인터넷 규제와 신원 확인에 찬성하는 의견을 피력하는 사람인데 그것과도 비슷한 맥락인가 싶었다. 초창기에 인터넷의 각종 규격을 설계했던 엔지니어들은 이 비싼 통신 인프라가 어중이떠중이가 다 쓰는 보편적인 물건이 될 거라고는 감히 생각을 못 했었을 것이다. 그러니 보안보다는 성능과 효율을 훨씬 더 중요하게 생각할 수밖에 없었겠지.

난 전산학의 여러 분야 중에서도 네트워크, 보안 쪽은 제일 까막눈 문외한이다 보니..;; 저런 분을 보면 그냥 입 쩍 벌리고 대단하다는 말밖에 안 나온다.

그럼, 다음으로 성 기수 박사 얘기를 좀 하겠다.
이분도 완전 날고 기는 수재였으며 하버드 대학교에서 석· 박사를 3년 만에 뚝딱 마친 것은 오늘날까지도 유학생들 사이에 전설로 회자된다고 그런다. 원래 전공은 기계· 항공 공학 쪽이었으며 전자· 전산이 아니었다. NASA 같은 데에나 들어가서 우주선과 로켓 엔지니어가 됐을 분이 “아무래도 우리나라엔 컴퓨터가 필요하다”는 신념 하에 한국으로 돌아와 KIST 전산실 실장을 맡았다.

전 길남 박사가 라우터 등 인터넷 기술을 자체 개발하여 우리나라를 인터넷 대열에 합류시켰다면, 성 기수 박사는 그보다 옛날에 우리나라의 행정, 은행, 병원, 철도 등 각 분야의 시스템 전산화를 이끌었다. 전산학이라는 학문이 국내 학계에 제대로 정립조차 되기 전인 초창기에 하드웨어와 소프트웨어를 넘나들며 우리나라의 발전에 지대한 업적을 남긴 것이다. 워낙 옛날이기 때문에 구분이 별로 의미가 없었을지도 모르지만, 저분의 세부 관심사는 HW와 SW 중 어디에 가까웠을지가 궁금해진다.

2000년대 초반에 바둑 연구를 끝으로, 그 뒤부터는 저분은 언론에 보도되는 근황은 없이 조용히 노후를 보내고 계신 듯하다.

인터넷 검색을 하면 성 박사의 일대기를 곳곳에서 발견할 수 있다. 그런데 내 시선을 고정시키는 에피소드가 하나 있었다.
지금으로부터 40년도 더 전인 1970년, KIST 전산실에서 그의 주도하에 한글 전자 인쇄 장치를 개발해 냈다고 한다.
유니코드고 트루타입 글꼴이고 뭐고 하나도 없던 까마득한 옛날에 일종의 1세대 비스무리한 한글 기계화를 이룬 거라고 보면 되겠다.
그런데 여기서 벌써 한글 입력 방식에 대한 얘기가 나온다.

이 글을 읽을 때 유의해야 할 점은 다루는 시기가 굉장히 옛날이라는 점이고, 그럼에도 불구하고 논쟁의 대상이 흔히 생각하기 쉬운 기계식 타자기가 아니라 컴퓨터라는 점이다. 물론 시기가 시기이다 보니, 일반인이 간편하게 다룰 수 있는 오늘날의 개인용 소형 컴퓨터 얘기는 전혀 아니다. 저건 애초에 그런 범용(general-purpose) 컴퓨터도 아니다.

저 때보다 약간 전인 1969년 여름에 국가에서는 타자기용으로 네벌식 글자판을 표준으로 지정했다.
난 그 시절엔 두벌식이라는 게 전혀 없었고 그건 나중에 1980년대에 와서야 생긴 줄 알았다. 그런데 그건 아니고 그 이전부터 두벌식과 네벌식이 모두 있었던 듯하다. 사료를 모두 종합해서 고찰해 보면, 1969년에는 “타자기는 네벌식, 전자 기기는 두벌식”으로 표준이 제정됐고 나중에는 네벌식이 공식 폐기뒨 후 “기계식 타자기까지도 받침 글쇠를 넣어서 두벌식”으로 바뀐 것 같다.

또한 같은 두벌식이라 해도 그때의 두벌식은 오늘날의 '바지들고서' KSX5002 26키 배열하고는 차이가 있었을 수도 있으니까. 나의 역사 지식에 오류가 있다면 수정 지적을 환영하는 바이다.

아무튼, 성 기수 박사가 한글 전자 인쇄기를 개발하던 당시에 국가에서는 이미 네벌식과 두벌식을 밀고 있었다. 그리고 성 박사는 자신이 개발하는 기계에 들어가는 한글 입력 소프트웨어를 별다른 고민 없이 두벌식 기반으로 설계했다.
그분도 그렇게 타자기 따로, 컴퓨터 따로 식인 글자판 표준에는 문제가 있다고 판단했다. 그러나 “씁 어쩔 수 없지”였고, 그런 문제의식만으로 끝이었다.

기계식 타자기가 연극과 같다면 컴퓨터는 영화와 같은 매체이다. 기계식 타자기야 메커니즘이 복잡해서 어쩔 수 없지만, 컴퓨터에는 아무 제약이 없으니 글쇠배열은 가능한 한 간단할 수록 좋을 것이다. 자음의 초· 종성 구분은 컴퓨터 소프트웨어가 알아서 판단하게 하는 게 좋을 것이다. 사용자의 입장에서는 자동화가 되어서 좋고, 개발자의 입장에서는 오토마타 이론을 구현하면서 자신의 프로그래밍 실력을 과시할 수도 있어서 좋다..는 게, 컴퓨터쟁이가 한글 입력에 대해서 생각할 수 있는 딱 전형적인 의식 수준 그 이상도 그 이하도 아니지 않았을까?

그 시절, 공 병우 박사는 안 그래도 나라에서 자기의 세벌식 글자판을 외면한 것 때문에 심기가 불편했다. 그랬는데 마침 한글 전자 인쇄기에 네벌식 대신 두벌식 글자판이 들어간다고 하자 책임자인 성 박사를 자기 집에 초대해서 로비(?)까지 시도했다고 한다. 공 박사는 그 시절에 이미 그야말로 억만장자가 된 60대의 안과 의사였고, 성 박사는 30대 중후반으로 공 박사의 아들 연배인 파릇파릇한 공학자였다. 물론 전공은 다를지언정 두 분 다 대한민국 0.1% 이내에 드는 천재들인 건 주지의 사실이다.

공 박사는 고급 외제차를 몰고 성 박사를 데리러 홍릉 KIST를 직접 찾아갔다. 그리고 호화로운 자기 집에서 최고급 요리를 대접하면서 제안을 한 게.. “당신 같은 사람이 세벌식을 지지해 준다면 당신이 필요한 연구비는 내가 얼마든지 대 주겠소.”였다고. 여러분도 잘 아시잖는가. 공 박사는 기계덕후였으며 평생 젊은 프로그래머, 엔지니어들을 굉장히 좋아하셨다.

국가로부터 받는 예산만으로는 당장 연구실의 장비 내지 컴퓨터의 업그레이드조차 빠듯할 지경이었는데.. 그 제안에 성 박사가 귀가 솔깃해질 정도였다고 한다. 이거 뭐 “KIST에 공 병우 박사의 기증으로 슈퍼컴퓨터가 한 대 도입되었다” 같은 역사가 쓰여질 수도 있었다!

허나 설득은 잘 되지 않았던 것 같다. 공 박사의 입장에서 성 박사는 장래는 촉망되지만 한글이나 글자판에 대한 건전한(?) 소신이 없이 그냥 어용학자로 빠질 위험이 있는 인재로 보였을 것이다. 그리고 성 박사의 입장에서 공 박사는 그냥 자기 발명품만 꽉 껴안고 놓을 생각을 안 하는 고집쟁이 타자기 덕후로만 보였을 것이다. 늘어놓는 이야기가 서로 핀트가 안 맞았다.

성 박사는 공 박사로부터 융숭한 대접을 받고 세벌식 한영 타자기를 한 대 선물로까지 받았지만, 세벌식 같은 덴 애착이 별로 안 갔으며 그건 곧 그걸 갖고 싶어하는 다른 후배에게 줘 버렸다고 한다. 그리고 두 '박사'간의 만남은 그걸로 끝이었다. 저 사이트의 글도 “성 기수의 결정은 결과적으로 반공병우파의 손을 들어 준 셈이 되어 버렸다.”라고 씁쓸하게 끝난다.

그래. 하버드에서 3년 만에 박사 학위를 받은 공돌이라고 해도 그 옛날에 타자기와 컴퓨터의 글자판 통일 가능성을 생각할 수는 없었을 것이다. 글자판 일체형 직결식 글꼴이 항공· 기계 분야하고 관계가 있지는 않잖아.

물론 공 박사도 의사 겸 의학자일 뿐, 언어학이나 타이포그래피를 체계적으로 공부해서 그 분야에 학위가 있지는 않은 건 마찬가지다. 그러나 이 분야의 식견에 관한 한은 더 옛날부터 이 극로 선생으로부터 감화를 받아서 한글덕후로 개조가 끝나 있던 공 박사가 더 앞서 있었다. (그러고 보니 이 글에서 덕후 타이틀만 무려 3개가 나왔군.. -_-)

그럼에도 불구하고 저 사이트의 글에서는 꼭 공 박사가 성 박사를 무슨 불의한 일에 접대로 유혹하고 매수라도 하려 한 것처럼 묘사되어 있어서 좀 유감스럽다. 다른 사람들이 보면 오해하겠다.
이거 무슨... “통일교를 공인해 주면 내 사재로 IMF 빚 다 갚아 주겠다”도 아니고.. 뭐냐?

Posted by 사무엘

Tag: 공병우, 대한민국, 두벌식, 성기수, 세벌식, 역사, 전길남, 컴퓨터, 타자기
Response: No Trackback , 4 Comments
RSS :: http://moogi.new21.org/tc/rss/response/995

Comments List

세벌 2014/09/02 19:29 # M/D Reply Permalink

공병우 박사님....
그 분은 가셨어도...
세벌식은 아직까지 컴퓨터에도 남아있지요.
그런데 의외로 사용자가 들지 않네요...
1. 사무엘 2014/09/03 11:14 # M/D Permalink
  
  우리나라가 적화통일 되는 급의 이변이라도 있지 않은 한
  세벌식 자체가 완전히 없어져 버린다는 건 말이 안 되는 소리입니다. 있을 수 없는 일이 아닌가 합니다.
박사님 2023/07/15 19:02 # M/D Reply Permalink

박정희와 전두환이 당시에 얼토당토 않는 네벌식(두벌식)을 고집하면서 공병우 박사님을 탄압하지만 않았어도 세벌식은 널리 퍼졌을텐데 참 많이 안타깝습니다.
1. 사무엘 2023/07/15 19:53 # M/D Permalink
  
  하다못해 시기적으로도 세벌식이 더 먼저였거든요.
  1953년 휴전 협정 문서가 공 박사 세벌식 타자기를 써서 세벌 빨랫줄 글꼴로 찍혀서 만들어졌구요,
  1966년에 "강 재구 소령의 아들은 훗날 육사 진학을 원한다면 특례 입학 조치 바랍니다" 이 공문까지만 해도 역시 세벌식 타자기로 찍혀 있었습니다.
  그걸 굳이 찍어누르고 네벌/두벌을 밀어붙였으니 한글 기계화 인프라가 1970년대부터는 오히려 퇴보해 버렸습니다.
  너무 안타까운 일입니다. ㅠㅠㅠㅠ 옛날 군사 정권이 뭘 모르고 저지른 큰 실책이죠.

국어, 언어학 잡설

Posted at 2014/07/28 08:33
Filed under 언어 정보학/우리말

1. '여' 불규칙

ㄱ부터 ㅎ까지
'가다(go), 나다(bring forth), 사다(buy), 자다(sleep), 차다(kick), 타다(get on), 파다(dig)'
라는 용어들을 생각해 보면, 이들은 과거형은
'갔다, 났다, 샀다, 잤다, 찼다, 탔다, 팠다'
라는 아주 규칙적인 패턴으로 활용된다.

그러나 잘 알다시피 '하다'(do)만은..
'하였다' 아니면 '했다'라고 굉장히 이상하게 활용된다. 중등학교 국어 시간엔 이를 '여' 불규칙이라고 배운다.
그런데 어미 '여'가 쓸데없이 붙는 것도 이상한데, 그게 축약되어서 '했다'가 되는 건 또 뭐냐..? '하다' 말고 그 어떤 용언도 활용 시에 ㅏ와 ㅐ가 그런 식으로 연계하여 변하는 경우는 없다.

'가다'의 경우, 다른 'Xㅏ다' 용언과는 달리, 명령형에서 '가거라'라고 생뚱맞은 '거'가 불규칙으로 첨가되기는 한다. 그러나 이 '거'는 명령형에서만 첨가되지 '해서/하여서, 했다/하였다'의 '여'에 비하면 등장이 훨씬 제한적이다.

'갔다', '팠다'처럼 '핬다'라는 단어는 한국어의 역사상 존재한 적이 없었던 걸까? 원래 있긴 했는데 혹시 전설모음 역행동화가 일어나서 '했다'라고 바뀌기라도 한 건 아닐까? 난 잘 모르겠다.

본인은 '바라다'가 자꾸 '바랬다', '바랬는데', '바램'처럼 활용되는 것도 비슷한 맥락의 현상이 아닌가 하고 거의 10년도 넘게 더 전부터 생각해 왔다. '하다'는 '함'이 '햄'으로 바뀌는 건 아니니 둘이 완전히 같은 양상은 아닌지도 모른다.
그리고 이것도 자음 하나만 다른 '자라다'는 활용 과정에서 '라'가 '래'로 바뀌는 현상이 결코 전혀 없으니 참으로 이상하지 않을 수 없다. '자랐다', '자랐는데', '자람' 등.. =_= 신기하다.

2. 지난 학기에 들은 변형 생성 문법 수업의 편린

(1) 아무래도 교재가 영어 원서이고 영어 통사론을 다루는 비중이 적지 않다 보니.. 선생님이 영어 고어 문법 얘기도 종종 하셨다. 그래서 내 머리엔 KJV 영어가 떠오른 적이 적지 않았다.

옛날에는 be + 동사PP가 수동태뿐만 아니라 마치 지금의 have + 동사PP처럼 완료 시제를 나타내기도 했다고 한다. KJV에 "is come"이 왜 이리도 많이 등장하는지 이제 알 것 같다.

(2) have가 의문문으로 등장할 때 Do you have 대신 곧바로 Have가 나오는 거..
난 개인적으로 have ye any meat? (요 21:5)가 곧장 떠오르던데 오늘날에도 이런 패턴이 영국의 일부 방언으로 남아 있다고 한다.
마치 C언어로 치면, C이긴 한데 오늘날 안 쓰는 오리지널 K&R 스타일 C 같은 느낌이다. #include 과감히 생략하고 main 함수에 int나 return 다 생략하고 바로 printf("hello, world!");를 하는... 좋게 말하면 간결하고 나쁘게 말하면 불친절한 스타일 되겠다.

(3) 문법을 설명하는 데도 문장 구조 binary tree를 그려서 노드를 이리 저리 옮기는 게 많다. 마치 빨강 검정 나무의 동작을 다루는 것 같았다. 물론 둘은 개념과 성격은 서로 완전히 다르지만 말이다.
또한, 전산학 자료구조 시간에는 tree 노드를 표현할 때 sibling, child 등 다 중성 어휘를 쓰지만, 언어학에서는 sister, daughter 같은 여성형 어휘를 쓰더라.

프로그래밍 언어와 자연어를 설명하는 이론을 모두 마스터하고 싶다.

Posted by 사무엘

Tag: 언어, 영어, 한국어
Response: No Trackback , No Comment
RSS :: http://moogi.new21.org/tc/rss/response/989

내 손글씨

Posted at 2014/05/23 08:27
Filed under 언어 정보학/폰트

내 손글씨는...

영문은 기본적으로 Times Roman을 표방하며 특히 숫자는 이를 더욱 엄격히 따른다. 소문자 a와 g도 언제나 Times 스타일의 정자체로 쓴다.
하지만 세부적인 획은 기분에 따라 Courier 또는 Century Gothic 스타일로 쓰기도 한다.

소문자 i, t, l 같은 글자를 보면 차이가 가장 크게 드러나는데..

Times 스타일은 세로획의 위쪽에 자그마한 / 모양의 삐침이 있고 글자가 대체로 홀쭉하다.
Courier 스타일은 세로획의 위쪽에 비교적 길게 - 모양의 삐침이 있고, 글자들의 폭이 대체로 균일하고 뚱뚱하다.
Century Gothic 스타일은 삐침이 전혀 없어서 t조차도 가로획과 세로획만 있다.

이 세 계열 중 어느 스타일을 따를지는 기분에 따라 달라지는 듯. 딱 하나로 떨어지지는 않는다.

한편, 한글은 바탕체를 표방하며 네모꼴 스타일과 샘물/세벌/빨랫줄 스타일 두 개가 존재한다.
내 손글씨를 정형화해서 디지털 서체로 만들고 싶은 소박한 바람이 있다.

한글은 라틴 알파벳보다 획이 (1) 더 많고 복잡하다. (따라서 한 글자를 표현하는 데 알파벳보다 일반적으로 더 많은 픽셀수가 필요하다.)
그리고 그렇게 복잡하긴 한데 (2) 개개의 획은 기하학적으로 더 단순하다. (로마자 같은 꼬부랑한 느낌이 별로 없다)

이런 이유로 인해, 글꼴에 라틴 같은 수준의 오동통한 개성이 들어갈 여지가 좀 덜하다.
한글 글꼴에 맞춰 만들어진 영문 글꼴은 순수 영문 글꼴보다 그런 기교가 neutralize된 경향이 있는 게 이 때문이 아닌가 싶다.

Posted by 사무엘

Tag: 근황, 손글씨, 폰트
Response: No Trackback , a comment
RSS :: http://moogi.new21.org/tc/rss/response/966

응답하라 1994와 지하철 서체 이야기

Posted at 2014/01/06 08:13
Filed under 언어 정보학/폰트

작년 가을엔 <응답하라 199x>라는 레트로 장르의 TV 드라마가 인기가 많았다.
요즘은 사극 드라마라도 하나 방영되면 전국의 역덕후들이 벌떼처럼 일어나서 별 희한한 곳에서 고증 오류들을 찾아 올리는 게 관행이다. 이 드라마 역시 예외가 아니었다.

2013년 10월 18일 방영분에는 아래와 같은 유명한 장면이 나온다.

서울 지하철 1호선의 노선색이 빨간색이고 역명판이 둥글게 만들어져 있던 옛날 시절을 재현한 것까지는 좋다. 솔직히 말하면 본인조차도 그 실물을 본 적은 없다. 본인은 서울 태생이 아니며 서울 지하철을 이용하기 시작한 건 21세기부터이기 때문이다.

그럼에도 불구하고 저 장면에는 여러 크고 작은 고증 오류가 존재한다.
벽면의 인테리어가 실제 지하철 서울 역과 다르며 섬식 승강장 역을 상대식 승강장으로 만들어 놓은 건 애교라 친다만...
역명판의 글꼴을 2003년에 만들어진 걸로 쓰면 어떡하냐. 무려 코레일체!

20세기 설정에 너무 깔끔한 21세기 서체가 혼자 확 튀어 보인다.
게다가 저건 철도청/코레일의 전속 서체이지 서울 지하철에서 쓰던 서체도 아니다.
완전 어처구니없는 고증 오류가 아닐 수 없다.ㅋㅋㅋㅋㅋ

또한, 글꼴만치 부각되는 건 아니지만 '서울驛'이라는 한자 병기가 들어간 것도 오류다.
서울 지하철이 처음 개통했을 때는 역명판에 한자 병기가 없었기 때문이다. 그건 1999~2000년대가 돼서야 추가되었다. 딱 그 시기에 로마자 표기법 개정분 반영, 한자 병기와 더불어 국철(= 광역전철) + 지하철 노선색 통합까지 몽땅 진행되었으니 수도권 전철의 외형이 크게 바뀌는 시기였다.

그건 그렇고 아무튼...
그럼 1994년 기준으로 코레일체 대신 저기에 무슨 글꼴이 들어가야 맞는지 궁금하다면, 아래의 '진짜' 옛날 사진을 참고하시기 바란다. 엔하위키엔 관련 자료가 이미 다 올라와 있다. ㅎㅎ

시대를 풍미해 온 지금의 지하철 전속 서체와 같거나 최소한 비슷한 투의 납작한 헤드라인이 그때에도 쓰였다.
초롱테크에서 1990년대 중반에 정식으로 내놓은 그 디지털 서체는 그걸 좀 더 세련되게 다듬은 게 아닐까 싶다.

본인은 개인적으로 이 서체를 굉장히 좋아한다. 마치 런던 지하철의 전속 서체가 그야말로 런던 지하철 전체의 정체성을 대변하는 명물이 되어 있듯, 저 서체는 수도권 전철까지는 아니어도 서울 지하철을 대표하는 서체가 되기에 손색이 없다고 생각한다.

그런데 왜 그걸 함부로 바꾸고, 이미 만들어 놓은 멀쩡한 시설까지 돈 들여서 뜯어고치고 있는지 모를 일이다.
서울 도시철도 공사 관할역들의 경우, 지상에 있는 검은 배경의 세로형 역 폴사인의 서체가 어느 샌가 야금야금 서울 남산체로 바뀌고 있다.

오히려 지하철이 아니라 광역전철 소속이어서 우측도 아닌 좌측통행으로 건설된 신분당선이 클래식 지하철체를 살려 쓰고 있으니.. 혼란스럽다.

음, 그나저나 응답하라 1994의 오류가 또 생각 났다.
내가 언뜻 본 기억으로는 그 드라마 내부에서 등장하는 TV 뉴스 화면의 자막이...
굴림은 양반이고 아예 나눔고딕인 장면이 있었다!

서 태지가 은퇴하는 소식이 나오는 20세기 복고 드라마에, 2008년 한글날에 무료 배포된 서체가 등장한다는 게 말이 되냐.. ㅋㅋㅋㅋ

요즘은 유튜브만 검색하면 1990년대 옛날 영상 매체의 주요 장면을 아주 쉽게 구할 수 있다.
자막에다가는 엑스포체나 그래픽체만 넣었어도 지금으로부터 2, 30년 전의 영상 매체의 구리구리한(?) 분위기를 아주 손쉽게 낼 수 있었을 것이다. 무슨 서체를 쓰든 CG 처리는 똑같이 필요했을 텐데, 이게 무슨 돈이 더 드는 일도 아니고!

* 결론

1. 이렇듯 글꼴 유행도 시대에 따라 변한다.
2. 철도와 성경의 융합에 이어 철도와 글꼴의 융합도 얼마든지 가능하다.

Posted by 사무엘

Tag: 역사, 응답하라1994, 폰트, 한글
Response: No Trackback , 5 Comments
RSS :: http://moogi.new21.org/tc/rss/response/917

Comments List

정 용태 2014/01/08 00:13 # M/D Reply Permalink

글꼴은 누구나 쉽게 만들고 쓸수 없는 물건이기에 시대를 관통하는거 같습니다..
특정 시기에 한글 소프트웨어에 번들된 글꼴이 많이 쓰이는 시절도 있었고요.. 예를 들면 한글에 있는 특유의 필기체 같은.. 요즘은 그 특유의 필기체를 어디서도 찾아보기 힘드네요 ^^
정 용태 2014/01/08 00:25 # M/D Reply Permalink

그리고 살짝 궁금해져서 필기체에 대해 서핑해봤는데 이런 재미있는 링크도 있어서 붙여봅니다.
http://puwazaza.com/319
http://www.youtube.com/watch?v=qefD5YHPeEM
1. 사무엘 2014/01/08 10:43 # M/D Permalink
  
  새해 첫 댓글 당첨이십니다. ^^
  한글의 경우 잘 알다시피 복잡한 조합 룰 때문에 완성도 높은 글꼴을 만들기가 더욱 어렵습니다.
  그나마 이미 정해진 조합 룰 템플릿을 기반으로 싸제 글꼴을 찍어내는 건 옛날에 비트맵 시절에는 그나마 유행이 있었는데 지금은 다 없어졌지요.
  그리고 그 조합 룰 자체를 새로 짜는 기술은 글꼴 제조 회사들이 제각각 보유하고 있지 일반인에게 공개되어 있지 않습니다. (안타깝지만 그 이유는 물론 저는 매우 수긍합니다)
  
  아래아한글 필기체의 경우, 만들어진 사연이 있는 것도 아시죠? 지금은 아래아한글이 아니면 <날개셋> 편집기에서나 볼 수 있는 추억의 글꼴이 됐습니다. ㅎㅎ
  
  Comic Sans가 원래는 BOB에 들어갈 글꼴이었는데 그렇게 퍼져 나가고 또 그런 금지 처분을 먹었다니.. 정말 흥미로운 걸요? 처음 알았습니다.
  정 용태 님, 복 많이 받으세요.
파츠쿠 2014/01/08 17:40 # M/D Reply Permalink

그게 바로 김치들의 철도에 대한 의식수준이죠. 세금으로 철도 깔아줬더니 시끄럽다고 이설하고 옮기는 새끼들이 김치들이죠.
1. 사무엘 2014/01/09 06:37 # M/D Permalink
  
  저도 철도에 대한 지역 이기주의 및 왜곡된 인식이 참 안타깝답니다.
  하지만 그런 인식을 깨어 있는 철덕들이 차근차근 개선해 나가야겠죠. 굳이 다른 사람들을 비하할 필요는 없을 듯합니다. ^^

언어의 기원에 대한 생각

Posted at 2013/12/24 19:31
Filed under 언어 정보학/우리말

“처음에 말씀이 계시니라. ...” (요 1:1)
우주 만물을 창조하신 하나님은 왜 하필 자신을 '말씀'이라고 성경에서 계시하셨을까?

인간의 언어라는 건 자연과학의 영역인 우주, 지구, 생명체 세포 같은 것 만만찮게 참 신기한 물건이 아닐 수 없다.
문자는 수천 년 전에 인간이 발명했지만 문자의 기록 대상인 그 언어 자체는 어디에서 유래되었는지 생명 자체의 기원만큼이나 정말 “아무도 모른다.”

생명의 기원에 대해서 창조 아니면 진화밖에 답이 없듯이,
언어의 기원에 대해서도 신수설 아니면 인위적인 발명설밖에는 선택의 여지가 없다.
더구나 언어는 화석이 있는 것도 아니고 방사성 원소 연대 측정 기술이 있는 것도 아니니.. 진짜로 뭐 과학적인 방법론을 동원하여 연구할 여지 자체가 없다.

게다가 언어의 우열이나 기원을 함부로 가리는 건 정치적으로도 꽤 민감한 영역이기도 하다.
이 분야에 검증 불가능한 추측과 낭설들이 하도 많이 떠돌다 보니, 언어학에 관심이 있는 분이라면 익히 잘 알듯, 먼 옛날 1866년에 파리 언어학회가 아예 공개적으로 이 분야는 불가지론의 영역이라고 못을 박아 버렸다.
언어의 기원에 대한 연구 같은 건 금지하고, 이 분야의 논문은 무조건 거절하겠다고 선언한 것이다.

난 무생물에서 생물이 우연히 생겨날 수 없고 원숭이가 아무리 긴 시간이 흘러도 사람으로 진화할 수 없다고 믿는다.
이와 같은 맥락으로.. 동물의 울음과 사람의 말은 넘사벽 급으로 서로 다르다.

겨우 몸짓, 손짓, 맘마, 빠빠, 쭈쭈, 끙끙에서...
촘스키 계층으로도 다 설명을 못 하는 그런 재귀적이고 복잡한 언어 문법이 점진적으로 생성되었을 거라고 생각하지 않는다.
그리고 이상한 날랄랄따따따 방언이 질서를 갖춘 정상적인 인간의 언어라고 생각하지도 않는다. ㅎㅎ
이건 내가 개인적으로 그렇게 생각한다는 뜻이지, 언어의 기원과 관련해서 나와 견해가 다른 사람을 디스한다거나 논쟁하겠다는 의도는 아니다.

NOTES
1. 한국어는 언어 계통상 고립어로 간주되고 있다. 우랄 알타이 어족 떡밥은 약발이 다한 지 오래이고, 주변에 유사한 언어를 도무지 찾을 수 없는 굉장히 특이한 언어라는 뜻이다.
일본어와 더불어 고립어치고는 그래도 사용자가 많은 축에 드는 언어이고, 또 영어권 사람이 배우기 몹시 어려운 언어로 분류되어 있다.

2. 우리말에는 '말'의 높임말로 '말씀'이라는 아주 좋은 말이 있어서 성경 용어로도 즐겨 쓰인다.
다만, “교장 선생님 말씀이 계시겠습니다.”는 잘 알다시피 높임법이 어긋난 문장이다. 말씀이 '계실' 수 있는 문맥은 요한복음 1:1과 요한일서 1:1 정도밖에 없을 것이다.

Posted by 사무엘

Tag: 기독교, 성경, 언어
Response: No Trackback , No Comment
RSS :: http://moogi.new21.org/tc/rss/response/912

한자 문화권에 있던 국가들의 한자 사용 양상

Posted at 2013/10/20 08:32
Filed under 언어 정보학/한글 기계화

1. 중국 (+대만, 홍콩, 마카오): 100%

중국어는 딱히 굴절이나 활용이 심하지 않은 고립형이고 1글자 1의미(형태소) 1음절이 성립하다 보니... 한자 같은 문자는 글자 수가 너무 많고 복잡하다는 단점을 빼면 자기 나라 말을 적는 데 그리 나쁜 솔루션은 아니다. 중국이 한자 종주국인 것엔 이유가 있는 셈이다. 물론, 그 단점이 꽤 큰 단점이긴 하지만 말이다.
중국어는 성조를 빼면 언어적으로 동음이의어도 많다. 그래서 한자로 '팔다'와 '사다'가 모두 같은 음(매)이고, 밝을 명(明)만 있는 게 아니라 어두울 명(冥)도 있다. 그걸 글자에다 뜻을 밝혀 적어서 구분하려는 생각을 한 듯하다.

이런 이유로 인해 중국은 한자 자체를 폐지하기보다는 획을 과감히 줄인 간체자를 만들어서 정착시켰는데, 이는 여타 한자 사용 국가들과의 단절과 혼란을 야기했다는 비판도 받고 있다. 지금과 같이 문자를 기계식이 아닌 전자식으로 다룰 수 있는 성능 좋은 기계가 일찍 발달했으면 쟤들은 굳이 간체자를 만들 생각을 안 했을지도 모른다.

2. 일본: 90% 보조 문자만 도입

일본어는 구조적으로 중국어보다는 한국어에 훨씬 더 가까운 언어이기 때문에 애초부터 한자만을 표기 수단으로 쓰는 것엔 불편함이 있었다. 일본어는 성조가 없고 음운 구조도 간단한 대신, 한자 하나를 여러 음절로 읽을 수 있고 훈독과 음독으로 모두 읽을 수 있다. 그래서 자기네 단순한 음운 구조에 맞춘 히라가나· 가타카나라는 표음문자를 보조적으로 덧붙여서 쓰고 있다.

한자를 없애고 고유 문자만으로 자기네 언어를 다 표기하는 건 불가능하지는 않다. 하지만 길어지고 보기 안 좋아지는 관계로 한자를 완전히 대체하는 건 영 한계가 있다. 마치 한글 자모가 단독이 아닌 모아쓰기를 전제로 만들어져 있는 것만큼이나 일본의 고유 문자는 한자 같은 여타 문자를 보조하는 용도로 만들어졌다는 성격이 강하다.

중국어와 일본어 텍스트에 쓰이는 복잡한 한자들은 한 글자씩 짜 맞춰서 입력하기가 너무 느리고 불편하다. 그렇기 때문에 문장이나 어절 단위로 더 긴 문자열을 입력함으로써 context를 만들고 후보 수를 줄인 뒤에 한꺼번에 변환을 한다. 즉, 이들 언어는 NLP 기술이 동원된 복잡한 입력 프로그램이 필요하다.

3. 한국 (대한민국, 북한): legacy로서 극소수 1% 미만. 고유 문자로 사실상 대체

교착어인 한국어의 복잡 미묘한 용언 활용을 한자로 제대로 표기할 수는 없는 노릇이며, 한국어는 음운 구조도 일본어보다 더 풍부하고 복잡하다. 이런 배경 속에서 세종대왕은 인류 역사상 유례를 찾기 힘든 똘끼를 발휘하여 세계가 놀라고 극찬하는 완전한 형태(full-featured, stand-alone)의 고유 문자를 만들어 버렸다.

한글은 단독으로 써도 시각성과 변별성이 충분히 우수하며, 한국어에서는 한자와 음의 대응이 일본어보다 훨씬 단순한 편이다. 의미상 모순되는 동음이의어만 피해 가면 한자 대신 고유 문자 전용이 어렵지 않게 가능하며, 그것이 이미 실제로 일어났다! 게다가 한글은 NLP 기술 없이 매우 빠르고 편리하게 입력도 되고 기계화가 가능하다.

그래서 20세기 중반 이후로 한반도에서는 한자가 빠른 속도로 도태되어 사라졌으며, 한자는 아주 예외적인 상황에서나 희소하게 등장하는 물건이 되었다. 한국어가 중국어와 아예 완전히 다른 언어이고 한자 표기가 어울리지 않는 구조이기 때문에 이에 대처하는 솔루션도 아예 극단적으로 새롭고 과격하게 출발 가능했던 것 같다.

4. 베트남, 몽골: 0% 완전히 폐지하여 흔적조차 없애고 여타 문자로 대체

베트남은 로마자로 공식 문자를 바꾸고 한자를 폐지했다. 단, 베트남어는 중국어보다도 성조가 더 다양해서 이런 걸 알파벳에다 덧붙이는 표기가 꽤 복잡한 편이다. 그래서 베트남 문자는 로마자 기반임에도 불구하고 컴퓨터에서 마치 아랍어 같은 complex script로 분류되고 있다.

몽골은 먼 옛날에 한자를 잠시 쓰긴 했지만 이내 자기네 고유 문자 내지 러시아 키릴 문자로 문자를 갈아탔다. 그렇기 때문에 오늘날은 베트남보다도 더 한자의 흔적을 찾을 수 없는 나라이다.

내가 한자에 대해서 글을 쓰면서 늘 느끼는 점인데,
한자는 말을 받아 적는 여러 문자 중의 하나이며, 그냥 legacy 그 이상도 그 이하도 아니다. 그러니 각 나라마다 자기 언어 사정에 맞게 편한 대로 처분하면 그만이다. 간체자 개량을 하든, 보조 문자를 만들든, 아니면 다른 문자로 완전히 대체를 하든 말이다. 그리고 그건 아주 자연스러운 현상이다. 굳이 중국어 같은 언어를 쓰는 문화권이 아닌 이상, 저렇게까지 불편하고 무거운 문자를 굳이 고집할 필요가 전혀 없기 때문이다.

한중일 3국간의 한자 통합이 가능해서 사람들이 필담이 가능하다면, 그건 불가능한 것보다는 나을지 모르겠다. 하지만 그건 정치· 언어· 문화의 장벽을 감안했을 때 호락호락 가능하지 않다. 불가능한 걸 가능하게 만들겠다고 높으신 분들이 머리를 맞대고 고민해 봤자 돈과 시간 들인 것에 비해 영양가 있는 결과가 나오지는 않을 거라는 데 한 표 건다. 조금 심하게 말하면, 그건 같은 라틴 알파벳을 쓴다고 해서 유럽 국가들이 다 필담으로 의사소통이 가능할 거라고 생각하는 것만큼이나 무모한 발상이다.

한자는 원칙이 있는 것 같으면서도 결국은 없는 chaotic한 글자이다.
뭔가 제자 원리를 봤을 때 한자처럼 생기긴 했는데 인류 역사상 그 어떤 문헌에도 존재한 적이 없는 '유령 한자'가 있다는 건 문자 코드에 관심이 있는 분이라면 이미 아실 것이다. 중국이나 일본에서 문자 코드를 제정하면서 글자들을 수집할 때, 어느 작업 인부가 실수를 한 모양이다.

빽빽한 중국어 자연어 텍스트처럼 생겼는데 실제로는 언어적인 의미가 전혀 없고 실존한 적이 없는 한자처럼 생긴 글자들로만 구성된 텍스트 디자인을 만든 사람도 있다. 그래, 한자는 역시 그런 문자이다.

Posted by 사무엘

Tag: 대한민국, 일본, 중국, 한글, 한자
Response: No Trackback , 9 Comments
RSS :: http://moogi.new21.org/tc/rss/response/889

Comments List

김재주 2013/10/21 04:42 # M/D Reply Permalink

여담 1. 기억력 콘테스트에 참가하는 사람들이 공통적으로 활용하는 테크닉이 바로 단어를 시각화하여 이미지로 기억하는 것입니다. 그런데 이 때 추상명사는 어떻게든 다른 단어들의 조합으로 나누고, 모르는 언어의 경우 그 스펠링을 잘라서 미리 정해둔 기호로 기억하게 되죠. 국제 기억력 경진대회 우승은 전통적으로 중국의 독주라고 하는데, 한자의 힘이 아닌가 싶습니다. 인간이 생각할 수 있을만한 대부분은 이미 이미지화 되어 있고 한자의 제자 원리에도 익숙할테니까요.

2. 간체자라고 사실 없는걸 만들어낸 것은 아니고 이미 민간에서 사용되던 속자를 정리한 게 대부분입니다. 그리고 한자가 획이 복잡하다보니 빠르게 필기할 때는 간략하게 쓰게 되죠. 대만 사람들이나 우리 할아버지 대 학자들이 필기를 할 때는 마치 지금의 간자체처럼 썼던 글자들이 많다는 겁니다. 그 외에도 초서도 글자의 많은 부분을 간략화한 형태로 흘려쓰는데 이를 해서 형태로만 바꾼 글자도 많습니다. 대부분이 이런 식이니 디지털화가 빨리 이뤄졌더라도 간체자가 등장했을 개연성은 있다고 봅니다. 일단 사람이 배우기가 힘들잖아요.

3. 한자는 모양에 뜻이 담겨있다보니 읽기 능력이 곧 쓰기능력으로 이어지지 않습니다. 한자능력시험도 보면 읽기와 쓰기를 구분해서 등급을 매기고 있죠. 일본에서는 평소 손으로 필기를 하지 않고 컴퓨터를 이용하다보니 정작 손으로 한자를 써야 할 때 제대로 쓰지 못하는 디지털 문맹이 발생하고 있다는군요. 중국도 아마 비슷한게 있지 않을까 생각됩니다. 컴퓨터로 한자를 쓸 때는 읽기능력만 있으면 되니까요.

4. 한자가 모양 뜻 소리 세가지 요소를 다 가진 글자다 보니까 사실 조금만 정리하면 필담으로 한중일 삼개국이 소통할 수 있을 여건은 있긴 하죠. 로마자 비유는 적절하지 않은 듯싶고 라틴어 근원 단어들을 통해 필담하는 것과 비교해야 할 듯합니다. 그런데 이건 스페인어와 이탈리아어, 프랑스어 같은 로망스어에선 어느정도 가능하다고 합니다. 그러나 결국 복잡한 내용을 주고받으려면 우리 조상님들이 그랬듯 고대 중국어 문어체, 즉 한문을 배울 수밖에 없지 않나 싶네요.
1. 사무엘 2013/10/21 23:16 # M/D Permalink
  
  네, 유익한 보충 설명에 감사드립니다.
  1. 아마 그런 거라면 확실히 어릴 때부터 한자 같은 문자를 끼고 살았던 사람들이 유리한 면모가 있을지도 모르겠습니다. 초등학교 한자 교육 주장하는 사람들이 그런 데이터를 아주 좋아할지 모르겠으나, 겨우 그런 부수효과만을 노리기엔 한자 교육은 다른 기회비용이 너무 크겠죠.
  
  2. 말씀하신 것처럼, 간체자는 완전히 없는 글자보다는 기존 속자들을 정리한 것의 비중이 더 크긴 합니다.
  하지만 문자라는 건 굉장히 보수적이고 쉽사리 변하지 않는 관행이기도 해요. 공산주의 독재 정권 정도의 권력이 아니었다면 간체자를 감히 공표해서 그렇게 밀어붙이기 쉽지 않았을 것입니다.
  
  3. 디지털 문맹은 충분히 예견 가능하구요. 읽기 능력과 쓰기 능력은 별개이죠. 돈만 해도요, 실물을 보면 누구나 지폐라는 걸 한눈에 알 수 있지만, 백지 한 장만 주고 지폐 도안을 그려 보라고 하면 기억하는 사람이 얼마나 되겠어요?
  
  4. 네, 그래서 “조금 심하게 말하면”이라는 단서를 붙인 것입니다. 다만, 단어만 늘어놓는 필담은 body language보다 약간 더 나은 수준의 의사소통밖에 못 할 것입니다. 정말로 언어다운 복잡한 문장을 주고받는 건 글자만 안다고 해서 할 수가 없을 겁니다.
Lyn 2013/10/22 11:37 # M/D Reply Permalink

태국은 어떤가요?

거기도 왕이 직접 글자를 만들었다던데
Lyn 2013/10/22 11:40 # M/D Reply Permalink

유령한자야 뭐.... 일부러 어떤 미친놈이 (...) 쓰지 않는이상 볼일이 없는데 중복한자가 쉣이네요
1. 사무엘 2013/10/23 08:22 # M/D Permalink
  
  1. U+0E00과 U+0E7F 사이에 태국 고유 문자가 있으며, 그건 컴퓨터에서 처리하기 어려운 '대표적인' complex script로 손꼽힌답니다. 한 글자에 이것저것 덕지덕지 붙는 게 많죠.
  
  2. ㅎㅎㅎ 유니코드에 중복 등록된 한자들.. 좀 골치아픈 문제이긴 합니다. BMP 영역에 이미 있는데 서로게이트에 또 등록된 놈이 있다고 그러죠?
2. Lyn 2013/10/23 13:32 # M/D Permalink
  
  한국이 의도적으로 넣은 글자라니 뭐 이거 ㅡㅡ;
3. 사무엘 2013/10/23 14:21 # M/D Permalink
  
  두음법칙 같은 여러 독음 때문에 호환용으로 동일 한자가 일부러 중복 등록한 것도 있긴 합니다만, 그런 거 말고요.
  중국이나 일본에서... 이미 등록이 된 한자인 줄 까맣게 모르고 진짜 실수로 동일 한자를 중복 등록한 것도 있답니다.
  
  또한, 畓(논), 乭(돌)처럼 뭐, 한국에서 지어내서 혼자 쓰는 한자도 있지만 이런 건 더욱 문제될 게 없겠죠.
4. Lyn 2013/10/29 00:18 # M/D Permalink
  
  뭐 한국 전용 한자야 어쩔 수 없죠 ㅎㅎ 있어야 되는거고
  
  바둑기사 이세돌이 중국에서 이세석이 되거나 (...) 일본에서 이세도루 가 되는거 보면 참 기분이 애매 합니다 ;;
임나라 2014/06/03 11:47 # M/D Reply Permalink

저는 한자라는 글자보다는 어휘라는 측면에서 생각을 해봅니다
한중일 그리고 월남에서도 한자기반의 단어가 많이 있습니다만 한자를 보면 이해되지만 다르게 쓰는 한자도 많다고 생각됩니다
정보 통신
변호사 율사
중심. 센터
세관. 해관
수출입. 출입구 등등
쓰다보니 한일 대 중월의 단어대응이 되어버리네요
똑같은 한자(발음은 다름), 단어를 익힘으로써 어휘생활이 풍부해지고 아시아 각국의 이해도가 증진이 될것같습니다만... (영어권에서의 비스킷,크래커.. 야드,그라운드..보트,요트..등등)
먼저 단어의 다양화, 한자문화권의 타국에서는 이경우에 이런 한자어를 쓴다, 그 이후 관심이 있는 분은 외국어로 배워보는건 어떨까 합니다.

한글 글꼴 처리 기술의 변천사

Posted at 2013/08/31 19:47
Filed under 언어 정보학/폰트

※ 0세대

0이라는 숫자는 뒤에 나올 1~3세대와 비교했을 때 '상대적인' 관점에서 붙여졌다. 1~3에 비해 0은 기계/아날로그적인 성격이 짙다.
한글을 모아쓰기+네모꼴 형태로 표현할 여건이 도저히 안 되는 환경을 말한다. 한 낱자를 상황에 따라 여러 벌로 분간해서 처리할 수가 없고, 최소 수천 자에 달하는 한글을 글자 단위로 부호화할 수도 없다.

옛날에 전보가 한글을 풀어쓰기 형태로 찍었다고 그러고, 김 정수 교수가 고안한 한글 두벌식 기울여 풀어쓰기도 0세대 기술이다. 굳이 풀어쓰기가 아니라도, 쓰이는 한글 몇 글자만 그림처럼 다루는 것도 딱히 기술이란 게 쓰인 게 아니므로 넓게는 0세대 기술로 간주한다.

그나마 0세대 기술 중에서 한글의 원리를 가장 잘 반영한 바람직한 기술은 공 병우 한글 세벌식 타자기, 그리고 그 이념을 물려받은 직결식 글꼴이다.

※ 1세대

제한된 벌수의 자모를 조합하여 한글 글자를 정사각형에다 모아쓰기 형태로 찍을 수 있다. 16*16 크기의 화면용 조합형 한글 글꼴이 바로 1세대의 상징이다.

옛날에 자체 한글을 지원하던 국내 도스용 프로그램들은 전부 이 수준의 기술을 사용하였으며, 도스용 아래아한글 1.x는 더 나아가서 간단한 수준의 옛한글과 자체 조합 로직까지 구현했다. 1세대 기술은 작고 간결하면서도 한글의 조합 원리와 무척 잘 부합한다는 큰 장점이 있기 때문에, <날개셋> 편집기 역시 최소주의를 추구하는 차원에서 딱 이 수준의 기술만을 의도적으로 고수하고 있다.

철도역 승강장의 전광판이 0세대인 롤지나 플랩에서 LED로 바뀌면서 1세대 기술로 한글을 표현한 것들이 많다.

※ 2세대

1세대보다 많이 발전했다. 8*16, 16*16의 한계를 벗어나 글자 크기를 자유롭게 조절할 수 있고 심지어 윤곽선 글꼴을 지원한다. 영문의 경우 W와 I의 폭이 다른 가변폭 글꼴을 지원한다. Windows의 경우 트루타입 글꼴이 도입되면서 글꼴의 기술 수준이 1.x세대에서 2세대 수준으로 껑충 뛰었으며, 아래아한글도 2.x 버전으로 넘어가면서 이 수준에 도달했다.

디스플레이 소자의 기술이 발달하면서 요즘은 전광판이 청색이나 흰색을 포함한 원색도 잘 표현하고 해상도도 더욱 높아졌다. 그래서 종전의 16*16만으로는 글자의 크기가 너무 작기 때문에 2세대로의 전환은 필수이다.
그러나 2세대 기술은 구현체마다 차이는 있지만, 1세대에 비해 한글 자체만의 조합 가능성이나 옛한글 표현 능력은 오히려 퇴보한 경우가 많다. 1코드 포인트당 반드시 한 글자가 대응한다는 한계에 여전히 매여 있기 때문이다.

※ 3세대

글꼴 처리 기술의 만렙으로, PC에는 21세기 무렵부터 도입되었다. 한글까지 가변폭 글꼴의 처리가 완벽하게 지원되며, 가변폭으로도 모자라서 커닝까지 처리된다. OpenType 기술을 이용하여 아랍· 태국어 문자까지도 꼼수 없이 잘 처리할 수 있을 정도인데 하물며 옛한글쯤이야 모아쓰기 형태로 표시를 못 할 이유가 전혀 없다.

유니코드라는 건 이런 글꼴 처리 기술과 결부되지 않을 수가 없는 규격이다. 그렇기 때문에 문자의 서식을 전혀 고려하지 않는 텍스트 에디터를 만든다 해도, 이제는 유니코드를 완벽하게 지원하려면 워드 프로세서를 만들 때나 필요할 것 같은 이런 기술을 어느 정도 사용하지 않을 수 없게 되었다.

3세대에서는 글꼴의 화면 렌더링도 단순한 grayscale 수준을 넘어서서 LCD 화면의 픽셀 구조에 특화된 subpixl 방식을 지원한다.

Posted by 사무엘

Tag: 컴퓨터, 폰트, 한글
Response: No Trackback , 2 Comments
RSS :: http://moogi.new21.org/tc/rss/response/872

« Previous : 1 : ... 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : 10 : ... 13 : Next »

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Notices

Authors

사무엘

Recent Trackbacks

Calendar

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Bookmarks

Site Stats

Total hits:: 3938290
Today:: 1076
Yesterday:: 1630

Subscribe to RSS articles Subscribe to RSS responses Subscribe to ATOM articles Subscribe to ATOM responses

김 용묵의 절대공간 - 블로그

Search Results for '언어 정보학'

124 POSTS

한글 연구 진영에 대한 생각

Comments List

우리말 관련 생각들

여러가지 글꼴 생각

Comments List

우리나라의 IT 원로 열전 & 공 박사와 성 박사의 만남

Comments List

국어, 언어학 잡설

내 손글씨

Comments List

응답하라 1994와 지하철 서체 이야기

Comments List

언어의 기원에 대한 생각

한자 문화권에 있던 국가들의 한자 사용 양상

Comments List

한글 글꼴 처리 기술의 변천사

Comments List

Tag Cloud

김 용묵의 절대공간 - 블로그 - 최근 공지

Notices

Archives

Categories

Authors

Recent Posts

김 용묵의 절대공간 - 블로그 - 최근 글

Recent Comments

김 용묵의 절대공간 - 블로그 - 최근 댓글

Recent Trackbacks

Calendar

Bookmarks

Site Stats