« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 12 : Next »

X를 읽는 법

알파벳 X는 거시기, 삐리리~ 말고도..

  1. 대문자 단독으로는 글자 그대로 eks라고 읽는다. X-ray X-file, XP 미지수일 때는 소문자 단독도 있다.
  2. 종성에서 ks라고 발음되며 이게 가장 보편적이다. box, taxi, fax, tax 등.
  3. 초성에서는 그냥 z로 발음되는 편이다. 이런 발음을 의도한 고유명사도 많다. xylophone, Xaero, xenon, Xerox
  4. 단, 아시아권 언어의 로마자 표기에서는 s나 sh로 발음되기도 한다. xi-, xu- 이렇게 시작하는 편.
  5. cross, Christ라고 읽기도 한다. X-mas, Jesus is X, No X-ing 하긴, X의 획이 서로 교차하는 형태이고, 그게 45도 기울인 십자가를 연상시키기도 해서 이런 독음도 생긴 것이다. 수학에서 ×는 cross product라고 불린다.
  6. 로마 숫자를 의미할 때는 'ten'으로 발음된다. Mac OS X
  7. 그리스 문자를 표방할 때는 그냥 k라고 발음되기도 한다. LaTeX (뭐, 우리식 발음이라고 이것도 '라텍쓰'를 꿋꿋이 고집하는 분도 있다. 하긴, 옛날에 단재 신 채호 선생도 워낙 민족주의 의식이 강해서 세수할 때 허리를 안 숙이고, 이웃 네이버를 네이그후보어라고 발음하곤 했다.;; )

Y가 반자음도 되고 장모음, 단모음이 다 되는 것 이상으로 X는 발음이 굉장히 유동적인 글자임을 알 수 있다. 사실, 여러 언어들에서 x의 발음은 제각각으로 차이가 많이 나는 편이다.

지금 도스/윈도 명령 프롬프트에 있는 xcopy라는 외부 명령에서도 x는 cross를 의미한다. 아마 서브디렉터리들을 드라이브간(between, inter-, cross-)에 그대로 통째로 복사하는 기능을 부각시키기 위해 붙여진 이름이 아니었나 싶다. 기존 내부 명령인 copy에는 없던 기능이기 때문이다.

Posted by 사무엘

2015/03/08 08:42 2015/03/08 08:42
,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/1070

가끔은 컴퓨터라는 물건이 발명된 지가 아직 100년도 채 안 됐다는 게 도저히 믿어지지 않을 때가 있다. 세상을 이렇게 완전히 180도 뒤바꿔 놓은 기계가 역사가 그렇게도 짧다니! 그 내력이 최소한 전화기나 자동차의 역사 정도는 될 법도 해 보이지만 실제로는 그렇지 않다. 하긴, 텔레비전이 컴퓨터보다 약간 더 일찍 발명된 정도다.

오늘날의 컴퓨터와 비슷한 컨셉이라도 탑재된 물건이 최초로 등장한 시기는 아무리 일찍 잡아도 2차 세계 대전 이후이다. 전자식+2진법+튜링 완전+프로그램 내장형 같은 기본 중의 기본 단서만 추가해 줘도 시기는 더 늦어진다. 그리고 그것마저도 덩치와 성능은 오늘날 우리가 쓰는 노트북과 스마트폰하고는 차마 비할 바가 못 됨은 주지의 사실이다.

컴퓨터가 2차 세계 대전 이후의 산물이라는 건, 다시 말해 단군의 후손들이 역사상 컴퓨터라는 걸 접한 시기는 오로지 '대한민국' 시대가 유일하다는 뜻이다. 일제 강점기나 조선 시대엔 그런 거 없었다. 그러니, 세계의 컴퓨터 역사뿐만 아니라 그 컴퓨터를 처음으로 우리나라에 도입하고 전산망을 개설한 선구자들의 전설의 레전드를 공부해 보는 것도 전산/컴공 전공자이든 비전공자이든 흥미로운 경험이 될 것이다.

우리나라에는 이 분야의 거장으로 성 기수 박사(1934-), 전 길남 박사(1943-)가 있다. 난 성 박사는 고등학교 때 어느 인터넷 사이트를 통해 아주 아주 대단한 분이라고 우연히 알게 됐다. 전 박사는 알지도 못하다가 대학에 진학해서야 내가 다니는 학교의 학과에 소속돼 있는 만렙 명예교수 중의 한 분 정도로나 접하게 됐다.

두 분 다 업적이 워낙 전문적이고 비가시적인 곳에 있는지라 대중적으로 유명하지는 않다. (2011년 10월에 1주일 간격으로 나란히 세상을 떠났음에도 불구하고 스티브 잡스와 데니스 리치의 대외 인지도의 차이를 생각해 볼 것!)
그러나 굳이 따지자면 아무래도 전자보다는 후자가 약간 더 유명하다. 우리나라 인터넷의 아버지라고 최근에 웹툰도 올라왔고 이게 각종 SNS에 퍼날라지면서 반짝 뜨곤 했다. 독자 여러분에게도 일독을 권한다.

(1982년 5월 15일, 구미 전자 기술 연구소와 서울 대학교 사이에 국내 최초 원거리 컴퓨터 네트워크 교신에 성공. 이건 모뎀이냐 랜이냐 뭐냐? 무슨 물리 메커니즘으로? 으음...;;)

저분은 은퇴한 뒤에도 활발히 활동하고 계시고, 게다가 저 웹툰을 보고는 작가에게 고증 오류 피드백까지 친절하게 해 주셨다고 한다. 여담이지만, 저분의 배우자가 여성 운동가인 조한 혜정 교수라니 깜짝 놀랐다.

최근의 강연 내지 인터뷰에서 전 박사는 인터넷은 너무나 대중적으로 퍼진 만큼 앞으로는 좀 더 안전해져야 한다고 거듭 강조한 적이 있다. 안티바이러스 프로그램의 개발자로 유명한 카스퍼스키는 강력한 인터넷 규제와 신원 확인에 찬성하는 의견을 피력하는 사람인데 그것과도 비슷한 맥락인가 싶었다. 초창기에 인터넷의 각종 규격을 설계했던 엔지니어들은 이 비싼 통신 인프라가 어중이떠중이가 다 쓰는 보편적인 물건이 될 거라고는 감히 생각을 못 했었을 것이다. 그러니 보안보다는 성능과 효율을 훨씬 더 중요하게 생각할 수밖에 없었겠지.

난 전산학의 여러 분야 중에서도 네트워크, 보안 쪽은 제일 까막눈 문외한이다 보니..;; 저런 분을 보면 그냥 입 쩍 벌리고 대단하다는 말밖에 안 나온다.

그럼, 다음으로 성 기수 박사 얘기를 좀 하겠다.
이분도 완전 날고 기는 수재였으며 하버드 대학교에서 석· 박사를 3년 만에 뚝딱 마친 것은 오늘날까지도 유학생들 사이에 전설로 회자된다고 그런다. 원래 전공은 기계· 항공 공학 쪽이었으며 전자· 전산이 아니었다. NASA 같은 데에나 들어가서 우주선과 로켓 엔지니어가 됐을 분이 “아무래도 우리나라엔 컴퓨터가 필요하다”는 신념 하에 한국으로 돌아와 KIST 전산실 실장을 맡았다.

전 길남 박사가 라우터 등 인터넷 기술을 자체 개발하여 우리나라를 인터넷 대열에 합류시켰다면, 성 기수 박사는 그보다 옛날에 우리나라의 행정, 은행, 병원, 철도 등 각 분야의 시스템 전산화를 이끌었다. 전산학이라는 학문이 국내 학계에 제대로 정립조차 되기 전인 초창기에 하드웨어와 소프트웨어를 넘나들며 우리나라의 발전에 지대한 업적을 남긴 것이다. 워낙 옛날이기 때문에 구분이 별로 의미가 없었을지도 모르지만, 저분의 세부 관심사는 HW와 SW 중 어디에 가까웠을지가 궁금해진다.

2000년대 초반에 바둑 연구를 끝으로, 그 뒤부터는 저분은 언론에 보도되는 근황은 없이 조용히 노후를 보내고 계신 듯하다.

인터넷 검색을 하면 성 박사의 일대기를 곳곳에서 발견할 수 있다. 그런데 내 시선을 고정시키는 에피소드가 하나 있었다.
지금으로부터 40년도 더 전인 1970년, KIST 전산실에서 그의 주도하에 한글 전자 인쇄 장치를 개발해 냈다고 한다.
유니코드고 트루타입 글꼴이고 뭐고 하나도 없던 까마득한 옛날에 일종의 1세대 비스무리한 한글 기계화를 이룬 거라고 보면 되겠다.
그런데 여기서 벌써 한글 입력 방식에 대한 얘기가 나온다.

이 글을 읽을 때 유의해야 할 점은 다루는 시기가 굉장히 옛날이라는 점이고, 그럼에도 불구하고 논쟁의 대상이 흔히 생각하기 쉬운 기계식 타자기가 아니라 컴퓨터라는 점이다. 물론 시기가 시기이다 보니, 일반인이 간편하게 다룰 수 있는 오늘날의 개인용 소형 컴퓨터 얘기는 전혀 아니다. 저건 애초에 그런 범용(general-purpose) 컴퓨터도 아니다.

저 때보다 약간 전인 1969년 여름에 국가에서는 타자기용으로 네벌식 글자판을 표준으로 지정했다.
난 그 시절엔 두벌식이라는 게 전혀 없었고 그건 나중에 1980년대에 와서야 생긴 줄 알았다. 그런데 그건 아니고 그 이전부터 두벌식과 네벌식이 모두 있었던 듯하다. 사료를 모두 종합해서 고찰해 보면, 1969년에는 “타자기는 네벌식, 전자 기기는 두벌식”으로 표준이 제정됐고 나중에는 네벌식이 공식 폐기뒨 후 “기계식 타자기까지도 받침 글쇠를 넣어서 두벌식”으로 바뀐 것 같다.

또한 같은 두벌식이라 해도 그때의 두벌식은 오늘날의 '바지들고서' KSX5002 26키 배열하고는 차이가 있었을 수도 있으니까. 나의 역사 지식에 오류가 있다면 수정 지적을 환영하는 바이다.

아무튼, 성 기수 박사가 한글 전자 인쇄기를 개발하던 당시에 국가에서는 이미 네벌식과 두벌식을 밀고 있었다. 그리고 성 박사는 자신이 개발하는 기계에 들어가는 한글 입력 소프트웨어를 별다른 고민 없이 두벌식 기반으로 설계했다.
그분도 그렇게 타자기 따로, 컴퓨터 따로 식인 글자판 표준에는 문제가 있다고 판단했다. 그러나 “씁 어쩔 수 없지”였고, 그런 문제의식만으로 끝이었다.

기계식 타자기가 연극과 같다면 컴퓨터는 영화와 같은 매체이다. 기계식 타자기야 메커니즘이 복잡해서 어쩔 수 없지만, 컴퓨터에는 아무 제약이 없으니 글쇠배열은 가능한 한 간단할 수록 좋을 것이다. 자음의 초· 종성 구분은 컴퓨터 소프트웨어가 알아서 판단하게 하는 게 좋을 것이다. 사용자의 입장에서는 자동화가 되어서 좋고, 개발자의 입장에서는 오토마타 이론을 구현하면서 자신의 프로그래밍 실력을 과시할 수도 있어서 좋다..는 게, 컴퓨터쟁이가 한글 입력에 대해서 생각할 수 있는 딱 전형적인 의식 수준 그 이상도 그 이하도 아니지 않았을까?

그 시절, 공 병우 박사는 안 그래도 나라에서 자기의 세벌식 글자판을 외면한 것 때문에 심기가 불편했다. 그랬는데 마침 한글 전자 인쇄기에 네벌식 대신 두벌식 글자판이 들어간다고 하자 책임자인 성 박사를 자기 집에 초대해서 로비(?)까지 시도했다고 한다. 공 박사는 그 시절에 이미 그야말로 억만장자가 된 60대의 안과 의사였고, 성 박사는 30대 중후반으로 공 박사의 아들 연배인 파릇파릇한 공학자였다. 물론 전공은 다를지언정 두 분 다 대한민국 0.1% 이내에 드는 천재들인 건 주지의 사실이다.

공 박사는 고급 외제차를 몰고 성 박사를 데리러 홍릉 KIST를 직접 찾아갔다. 그리고 호화로운 자기 집에서 최고급 요리를 대접하면서 제안을 한 게.. “당신 같은 사람이 세벌식을 지지해 준다면 당신이 필요한 연구비는 내가 얼마든지 대 주겠소.”였다고. 여러분도 잘 아시잖는가. 공 박사는 기계덕후였으며 평생 젊은 프로그래머, 엔지니어들을 굉장히 좋아하셨다.

국가로부터 받는 예산만으로는 당장 연구실의 장비 내지 컴퓨터의 업그레이드조차 빠듯할 지경이었는데.. 그 제안에 성 박사가 귀가 솔깃해질 정도였다고 한다. 이거 뭐 “KIST에 공 병우 박사의 기증으로 슈퍼컴퓨터가 한 대 도입되었다” 같은 역사가 쓰여질 수도 있었다!

허나 설득은 잘 되지 않았던 것 같다. 공 박사의 입장에서 성 박사는 장래는 촉망되지만 한글이나 글자판에 대한 건전한(?) 소신이 없이 그냥 어용학자로 빠질 위험이 있는 인재로 보였을 것이다. 그리고 성 박사의 입장에서 공 박사는 그냥 자기 발명품만 꽉 껴안고 놓을 생각을 안 하는 고집쟁이 타자기 덕후로만 보였을 것이다. 늘어놓는 이야기가 서로 핀트가 안 맞았다.

성 박사는 공 박사로부터 융숭한 대접을 받고 세벌식 한영 타자기를 한 대 선물로까지 받았지만, 세벌식 같은 덴 애착이 별로 안 갔으며 그건 곧 그걸 갖고 싶어하는 다른 후배에게 줘 버렸다고 한다. 그리고 두 '박사'간의 만남은 그걸로 끝이었다. 저 사이트의 글도 “성 기수의 결정은 결과적으로 반공병우파의 손을 들어 준 셈이 되어 버렸다.”라고 씁쓸하게 끝난다.

그래. 하버드에서 3년 만에 박사 학위를 받은 공돌이라고 해도 그 옛날에 타자기와 컴퓨터의 글자판 통일 가능성을 생각할 수는 없었을 것이다. 글자판 일체형 직결식 글꼴이 항공· 기계 분야하고 관계가 있지는 않잖아.

물론 공 박사도 의사 겸 의학자일 뿐, 언어학이나 타이포그래피를 체계적으로 공부해서 그 분야에 학위가 있지는 않은 건 마찬가지다. 그러나 이 분야의 식견에 관한 한은 더 옛날부터 이 극로 선생으로부터 감화를 받아서 한글덕후로 개조가 끝나 있던 공 박사가 더 앞서 있었다. (그러고 보니 이 글에서 덕후 타이틀만 무려 3개가 나왔군.. -_-)

그럼에도 불구하고 저 사이트의 글에서는 꼭 공 박사가 성 박사를 무슨 불의한 일에 접대로 유혹하고 매수라도 하려 한 것처럼 묘사되어 있어서 좀 유감스럽다. 다른 사람들이 보면 오해하겠다.
이거 무슨... “통일교를 공인해 주면 내 사재로 IMF 빚 다 갚아 주겠다”도 아니고.. 뭐냐?

Posted by 사무엘

2014/08/13 08:35 2014/08/13 08:35
, , , , , , , ,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/995

국어, 언어학 잡설

1. '여' 불규칙

ㄱ부터 ㅎ까지
'가다(go), 나다(bring forth), 사다(buy), 자다(sleep), 차다(kick), 타다(get on), 파다(dig)'
라는 용어들을 생각해 보면, 이들은 과거형은
'갔다, 났다, 샀다, 잤다, 찼다, 탔다, 팠다'
라는 아주 규칙적인 패턴으로 활용된다.

그러나 잘 알다시피 '하다'(do)만은..
'하였다' 아니면 '했다'라고 굉장히 이상하게 활용된다. 중등학교 국어 시간엔 이를 '여' 불규칙이라고 배운다.
그런데 어미 '여'가 쓸데없이 붙는 것도 이상한데, 그게 축약되어서 '했다'가 되는 건 또 뭐냐..? '하다' 말고 그 어떤 용언도 활용 시에 ㅏ와 ㅐ가 그런 식으로 연계하여 변하는 경우는 없다.

'가다'의 경우, 다른 'Xㅏ다' 용언과는 달리, 명령형에서 '가거라'라고 생뚱맞은 '거'가 불규칙으로 첨가되기는 한다. 그러나 이 '거'는 명령형에서만 첨가되지 '해서/하여서, 했다/하였다'의 '여'에 비하면 등장이 훨씬 제한적이다.

'갔다', '팠다'처럼 '핬다'라는 단어는 한국어의 역사상 존재한 적이 없었던 걸까? 원래 있긴 했는데 혹시 전설모음 역행동화가 일어나서 '했다'라고 바뀌기라도 한 건 아닐까? 난 잘 모르겠다.

본인은 '바라다'가 자꾸 '바랬다', '바랬는데', '바램'처럼 활용되는 것도 비슷한 맥락의 현상이 아닌가 하고 거의 10년도 넘게 더 전부터 생각해 왔다. '하다'는 '함'이 '햄'으로 바뀌는 건 아니니 둘이 완전히 같은 양상은 아닌지도 모른다.
그리고 이것도 자음 하나만 다른 '자라다'는 활용 과정에서 '라'가 '래'로 바뀌는 현상이 결코 전혀 없으니 참으로 이상하지 않을 수 없다. '자랐다', '자랐는데', '자람' 등.. =_= 신기하다.

2. 지난 학기에 들은 변형 생성 문법 수업의 편린

(1) 아무래도 교재가 영어 원서이고 영어 통사론을 다루는 비중이 적지 않다 보니.. 선생님이 영어 고어 문법 얘기도 종종 하셨다. 그래서 내 머리엔 KJV 영어가 떠오른 적이 적지 않았다.

옛날에는 be + 동사PP가 수동태뿐만 아니라 마치 지금의 have + 동사PP처럼 완료 시제를 나타내기도 했다고 한다. KJV에 "is come"이 왜 이리도 많이 등장하는지 이제 알 것 같다.

(2) have가 의문문으로 등장할 때 Do you have 대신 곧바로 Have가 나오는 거..
난 개인적으로 have ye any meat? (요 21:5)가 곧장 떠오르던데 오늘날에도 이런 패턴이 영국의 일부 방언으로 남아 있다고 한다.
마치 C언어로 치면, C이긴 한데 오늘날 안 쓰는 오리지널 K&R 스타일 C 같은 느낌이다. #include 과감히 생략하고 main 함수에 int나 return 다 생략하고 바로 printf("hello, world!");를 하는... 좋게 말하면 간결하고 나쁘게 말하면 불친절한 스타일 되겠다.

(3) 문법을 설명하는 데도 문장 구조 binary tree를 그려서 노드를 이리 저리 옮기는 게 많다. 마치 빨강 검정 나무의 동작을 다루는 것 같았다. 물론 둘은 개념과 성격은 서로 완전히 다르지만 말이다.
또한, 전산학 자료구조 시간에는 tree 노드를 표현할 때 sibling, child 등 다 중성 어휘를 쓰지만, 언어학에서는 sister, daughter 같은 여성형 어휘를 쓰더라.

프로그래밍 언어와 자연어를 설명하는 이론을 모두 마스터하고 싶다.

Posted by 사무엘

2014/07/28 08:33 2014/07/28 08:33
, ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/989

내 손글씨

내 손글씨는...

사용자 삽입 이미지

영문은 기본적으로 Times Roman을 표방하며 특히 숫자는 이를 더욱 엄격히 따른다. 소문자 a와 g도 언제나 Times 스타일의 정자체로 쓴다.
하지만 세부적인 획은 기분에 따라 Courier 또는 Century Gothic 스타일로 쓰기도 한다.

소문자 i, t, l 같은 글자를 보면 차이가 가장 크게 드러나는데..

  • Times 스타일은 세로획의 위쪽에 자그마한 / 모양의 삐침이 있고 글자가 대체로 홀쭉하다.
  • Courier 스타일은 세로획의 위쪽에 비교적 길게 - 모양의 삐침이 있고, 글자들의 폭이 대체로 균일하고 뚱뚱하다.
  • Century Gothic 스타일은 삐침이 전혀 없어서 t조차도 가로획과 세로획만 있다.

이 세 계열 중 어느 스타일을 따를지는 기분에 따라 달라지는 듯. 딱 하나로 떨어지지는 않는다.

한편, 한글은 바탕체를 표방하며 네모꼴 스타일과 샘물/세벌/빨랫줄 스타일 두 개가 존재한다.
내 손글씨를 정형화해서 디지털 서체로 만들고 싶은 소박한 바람이 있다.

한글은 라틴 알파벳보다 획이 (1) 더 많고 복잡하다. (따라서 한 글자를 표현하는 데 알파벳보다 일반적으로 더 많은 픽셀수가 필요하다.)
그리고 그렇게 복잡하긴 한데 (2) 개개의 획은 기하학적으로 더 단순하다. (로마자 같은 꼬부랑한 느낌이 별로 없다)

이런 이유로 인해, 글꼴에 라틴 같은 수준의 오동통한 개성이 들어갈 여지가 좀 덜하다.
한글 글꼴에 맞춰 만들어진 영문 글꼴은 순수 영문 글꼴보다 그런 기교가 neutralize된 경향이 있는 게 이 때문이 아닌가 싶다.

Posted by 사무엘

2014/05/23 08:27 2014/05/23 08:27
, ,
Response
No Trackback , a comment
RSS :
http://moogi.new21.org/tc/rss/response/966

작년 가을엔 <응답하라 199x>라는 레트로 장르의 TV 드라마가 인기가 많았다.
요즘은 사극 드라마라도 하나 방영되면 전국의 역덕후들이 벌떼처럼 일어나서 별 희한한 곳에서 고증 오류들을 찾아 올리는 게 관행이다. 이 드라마 역시 예외가 아니었다.

2013년 10월 18일 방영분에는 아래와 같은 유명한 장면이 나온다.

사용자 삽입 이미지

서울 지하철 1호선의 노선색이 빨간색이고 역명판이 둥글게 만들어져 있던 옛날 시절을 재현한 것까지는 좋다. 솔직히 말하면 본인조차도 그 실물을 본 적은 없다. 본인은 서울 태생이 아니며 서울 지하철을 이용하기 시작한 건 21세기부터이기 때문이다.

그럼에도 불구하고 저 장면에는 여러 크고 작은 고증 오류가 존재한다.
벽면의 인테리어가 실제 지하철 서울 역과 다르며 섬식 승강장 역을 상대식 승강장으로 만들어 놓은 건 애교라 친다만...
역명판의 글꼴을 2003년에 만들어진 걸로 쓰면 어떡하냐. 무려 코레일체!

20세기 설정에 너무 깔끔한 21세기 서체가 혼자 확 튀어 보인다.
게다가 저건 철도청/코레일의 전속 서체이지 서울 지하철에서 쓰던 서체도 아니다.
완전 어처구니없는 고증 오류가 아닐 수 없다.ㅋㅋㅋㅋㅋ

또한, 글꼴만치 부각되는 건 아니지만 '서울驛'이라는 한자 병기가 들어간 것도 오류다.
서울 지하철이 처음 개통했을 때는 역명판에 한자 병기가 없었기 때문이다. 그건 1999~2000년대가 돼서야 추가되었다. 딱 그 시기에 로마자 표기법 개정분 반영, 한자 병기와 더불어 국철(= 광역전철) + 지하철 노선색 통합까지 몽땅 진행되었으니 수도권 전철의 외형이 크게 바뀌는 시기였다.

그건 그렇고 아무튼...
그럼 1994년 기준으로 코레일체 대신 저기에 무슨 글꼴이 들어가야 맞는지 궁금하다면, 아래의 '진짜' 옛날 사진을 참고하시기 바란다. 엔하위키엔 관련 자료가 이미 다 올라와 있다. ㅎㅎ

사용자 삽입 이미지

시대를 풍미해 온 지금의 지하철 전속 서체와 같거나 최소한 비슷한 투의 납작한 헤드라인이 그때에도 쓰였다.
초롱테크에서 1990년대 중반에 정식으로 내놓은 그 디지털 서체는 그걸 좀 더 세련되게 다듬은 게 아닐까 싶다.

사용자 삽입 이미지

본인은 개인적으로 이 서체를 굉장히 좋아한다. 마치 런던 지하철의 전속 서체가 그야말로 런던 지하철 전체의 정체성을 대변하는 명물이 되어 있듯, 저 서체는 수도권 전철까지는 아니어도 서울 지하철을 대표하는 서체가 되기에 손색이 없다고 생각한다.

사용자 삽입 이미지

그런데 왜 그걸 함부로 바꾸고, 이미 만들어 놓은 멀쩡한 시설까지 돈 들여서 뜯어고치고 있는지 모를 일이다.
서울 도시철도 공사 관할역들의 경우, 지상에 있는 검은 배경의 세로형 역 폴사인의 서체가 어느 샌가 야금야금 서울 남산체로 바뀌고 있다.

오히려 지하철이 아니라 광역전철 소속이어서 우측도 아닌 좌측통행으로 건설된 신분당선이 클래식 지하철체를 살려 쓰고 있으니.. 혼란스럽다.

음, 그나저나 응답하라 1994의 오류가 또 생각 났다.
내가 언뜻 본 기억으로는 그 드라마 내부에서 등장하는 TV 뉴스 화면의 자막이...
굴림은 양반이고 아예 나눔고딕인 장면이 있었다!

서 태지가 은퇴하는 소식이 나오는 20세기 복고 드라마에, 2008년 한글날에 무료 배포된 서체가 등장한다는 게 말이 되냐.. ㅋㅋㅋㅋ

요즘은 유튜브만 검색하면 1990년대 옛날 영상 매체의 주요 장면을 아주 쉽게 구할 수 있다.
자막에다가는 엑스포체나 그래픽체만 넣었어도 지금으로부터 2, 30년 전의 영상 매체의 구리구리한(?) 분위기를 아주 손쉽게 낼 수 있었을 것이다. 무슨 서체를 쓰든 CG 처리는 똑같이 필요했을 텐데, 이게 무슨 돈이 더 드는 일도 아니고!

사용자 삽입 이미지

* 결론

1. 이렇듯 글꼴 유행도 시대에 따라 변한다.
2. 철도와 성경의 융합에 이어 철도와 글꼴의 융합도 얼마든지 가능하다.

Posted by 사무엘

2014/01/06 08:13 2014/01/06 08:13
, , ,
Response
No Trackback , 5 Comments
RSS :
http://moogi.new21.org/tc/rss/response/917

언어의 기원에 대한 생각

“처음에 말씀이 계시니라. ...” (요 1:1)
우주 만물을 창조하신 하나님은 왜 하필 자신을 '말씀'이라고 성경에서 계시하셨을까?

인간의 언어라는 건 자연과학의 영역인 우주, 지구, 생명체 세포 같은 것 만만찮게 참 신기한 물건이 아닐 수 없다.
문자는 수천 년 전에 인간이 발명했지만 문자의 기록 대상인 그 언어 자체는 어디에서 유래되었는지 생명 자체의 기원만큼이나 정말 “아무도 모른다.”

생명의 기원에 대해서 창조 아니면 진화밖에 답이 없듯이,
언어의 기원에 대해서도 신수설 아니면 인위적인 발명설밖에는 선택의 여지가 없다.
더구나 언어는 화석이 있는 것도 아니고 방사성 원소 연대 측정 기술이 있는 것도 아니니.. 진짜로 뭐 과학적인 방법론을 동원하여 연구할 여지 자체가 없다.

게다가 언어의 우열이나 기원을 함부로 가리는 건 정치적으로도 꽤 민감한 영역이기도 하다.
이 분야에 검증 불가능한 추측과 낭설들이 하도 많이 떠돌다 보니, 언어학에 관심이 있는 분이라면 익히 잘 알듯, 먼 옛날 1866년에 파리 언어학회가 아예 공개적으로 이 분야는 불가지론의 영역이라고 못을 박아 버렸다.
언어의 기원에 대한 연구 같은 건 금지하고, 이 분야의 논문은 무조건 거절하겠다고 선언한 것이다.

난 무생물에서 생물이 우연히 생겨날 수 없고 원숭이가 아무리 긴 시간이 흘러도 사람으로 진화할 수 없다고 믿는다.
이와 같은 맥락으로.. 동물의 울음과 사람의 말은 넘사벽 급으로 서로 다르다.

겨우 몸짓, 손짓, 맘마, 빠빠, 쭈쭈, 끙끙에서...
촘스키 계층으로도 다 설명을 못 하는 그런 재귀적이고 복잡한 언어 문법이 점진적으로 생성되었을 거라고 생각하지 않는다.
그리고 이상한 날랄랄따따따 방언이 질서를 갖춘 정상적인 인간의 언어라고 생각하지도 않는다. ㅎㅎ
이건 내가 개인적으로 그렇게 생각한다는 뜻이지, 언어의 기원과 관련해서 나와 견해가 다른 사람을 디스한다거나 논쟁하겠다는 의도는 아니다.

NOTES
1. 한국어는 언어 계통상 고립어로 간주되고 있다. 우랄 알타이 어족 떡밥은 약발이 다한 지 오래이고, 주변에 유사한 언어를 도무지 찾을 수 없는 굉장히 특이한 언어라는 뜻이다.
일본어와 더불어 고립어치고는 그래도 사용자가 많은 축에 드는 언어이고, 또 영어권 사람이 배우기 몹시 어려운 언어로 분류되어 있다.

2. 우리말에는 '말'의 높임말로 '말씀'이라는 아주 좋은 말이 있어서 성경 용어로도 즐겨 쓰인다.
다만, “교장 선생님 말씀이 계시겠습니다.”는 잘 알다시피 높임법이 어긋난 문장이다. 말씀이 '계실' 수 있는 문맥은 요한복음 1:1과 요한일서 1:1 정도밖에 없을 것이다.

Posted by 사무엘

2013/12/24 19:31 2013/12/24 19:31
, ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/912

1. 중국 (+대만, 홍콩, 마카오): 100%

중국어는 딱히 굴절이나 활용이 심하지 않은 고립형이고 1글자 1의미(형태소) 1음절이 성립하다 보니... 한자 같은 문자는 글자 수가 너무 많고 복잡하다는 단점을 빼면 자기 나라 말을 적는 데 그리 나쁜 솔루션은 아니다. 중국이 한자 종주국인 것엔 이유가 있는 셈이다. 물론, 그 단점이 꽤 큰 단점이긴 하지만 말이다.
중국어는 성조를 빼면 언어적으로 동음이의어도 많다. 그래서 한자로 '팔다'와 '사다'가 모두 같은 음(매)이고, 밝을 명(明)만 있는 게 아니라 어두울 명(冥)도 있다. 그걸 글자에다 뜻을 밝혀 적어서 구분하려는 생각을 한 듯하다.

이런 이유로 인해 중국은 한자 자체를 폐지하기보다는 획을 과감히 줄인 간체자를 만들어서 정착시켰는데, 이는 여타 한자 사용 국가들과의 단절과 혼란을 야기했다는 비판도 받고 있다. 지금과 같이 문자를 기계식이 아닌 전자식으로 다룰 수 있는 성능 좋은 기계가 일찍 발달했으면 쟤들은 굳이 간체자를 만들 생각을 안 했을지도 모른다.

2. 일본: 90% 보조 문자만 도입

일본어는 구조적으로 중국어보다는 한국어에 훨씬 더 가까운 언어이기 때문에 애초부터 한자만을 표기 수단으로 쓰는 것엔 불편함이 있었다. 일본어는 성조가 없고 음운 구조도 간단한 대신, 한자 하나를 여러 음절로 읽을 수 있고 훈독과 음독으로 모두 읽을 수 있다. 그래서 자기네 단순한 음운 구조에 맞춘 히라가나· 가타카나라는 표음문자를 보조적으로 덧붙여서 쓰고 있다.

한자를 없애고 고유 문자만으로 자기네 언어를 다 표기하는 건 불가능하지는 않다. 하지만 길어지고 보기 안 좋아지는 관계로 한자를 완전히 대체하는 건 영 한계가 있다. 마치 한글 자모가 단독이 아닌 모아쓰기를 전제로 만들어져 있는 것만큼이나 일본의 고유 문자는 한자 같은 여타 문자를 보조하는 용도로 만들어졌다는 성격이 강하다.

중국어와 일본어 텍스트에 쓰이는 복잡한 한자들은 한 글자씩 짜 맞춰서 입력하기가 너무 느리고 불편하다. 그렇기 때문에 문장이나 어절 단위로 더 긴 문자열을 입력함으로써 context를 만들고 후보 수를 줄인 뒤에 한꺼번에 변환을 한다. 즉, 이들 언어는 NLP 기술이 동원된 복잡한 입력 프로그램이 필요하다.

3. 한국 (대한민국, 북한): legacy로서 극소수 1% 미만. 고유 문자로 사실상 대체

교착어인 한국어의 복잡 미묘한 용언 활용을 한자로 제대로 표기할 수는 없는 노릇이며, 한국어는 음운 구조도 일본어보다 더 풍부하고 복잡하다. 이런 배경 속에서 세종대왕은 인류 역사상 유례를 찾기 힘든 똘끼를 발휘하여 세계가 놀라고 극찬하는 완전한 형태(full-featured, stand-alone)의 고유 문자를 만들어 버렸다.

한글은 단독으로 써도 시각성과 변별성이 충분히 우수하며, 한국어에서는 한자와 음의 대응이 일본어보다 훨씬 단순한 편이다. 의미상 모순되는 동음이의어만 피해 가면 한자 대신 고유 문자 전용이 어렵지 않게 가능하며, 그것이 이미 실제로 일어났다! 게다가 한글은 NLP 기술 없이 매우 빠르고 편리하게 입력도 되고 기계화가 가능하다.

그래서 20세기 중반 이후로 한반도에서는 한자가 빠른 속도로 도태되어 사라졌으며, 한자는 아주 예외적인 상황에서나 희소하게 등장하는 물건이 되었다. 한국어가 중국어와 아예 완전히 다른 언어이고 한자 표기가 어울리지 않는 구조이기 때문에 이에 대처하는 솔루션도 아예 극단적으로 새롭고 과격하게 출발 가능했던 것 같다.

4. 베트남, 몽골: 0% 완전히 폐지하여 흔적조차 없애고 여타 문자로 대체

베트남은 로마자로 공식 문자를 바꾸고 한자를 폐지했다. 단, 베트남어는 중국어보다도 성조가 더 다양해서 이런 걸 알파벳에다 덧붙이는 표기가 꽤 복잡한 편이다. 그래서 베트남 문자는 로마자 기반임에도 불구하고 컴퓨터에서 마치 아랍어 같은 complex script로 분류되고 있다.

몽골은 먼 옛날에 한자를 잠시 쓰긴 했지만 이내 자기네 고유 문자 내지 러시아 키릴 문자로 문자를 갈아탔다. 그렇기 때문에 오늘날은 베트남보다도 더 한자의 흔적을 찾을 수 없는 나라이다.

내가 한자에 대해서 글을 쓰면서 늘 느끼는 점인데,
한자는 말을 받아 적는 여러 문자 중의 하나이며, 그냥 legacy 그 이상도 그 이하도 아니다. 그러니 각 나라마다 자기 언어 사정에 맞게 편한 대로 처분하면 그만이다. 간체자 개량을 하든, 보조 문자를 만들든, 아니면 다른 문자로 완전히 대체를 하든 말이다. 그리고 그건 아주 자연스러운 현상이다. 굳이 중국어 같은 언어를 쓰는 문화권이 아닌 이상, 저렇게까지 불편하고 무거운 문자를 굳이 고집할 필요가 전혀 없기 때문이다.

한중일 3국간의 한자 통합이 가능해서 사람들이 필담이 가능하다면, 그건 불가능한 것보다는 나을지 모르겠다. 하지만 그건 정치· 언어· 문화의 장벽을 감안했을 때 호락호락 가능하지 않다. 불가능한 걸 가능하게 만들겠다고 높으신 분들이 머리를 맞대고 고민해 봤자 돈과 시간 들인 것에 비해 영양가 있는 결과가 나오지는 않을 거라는 데 한 표 건다. 조금 심하게 말하면, 그건 같은 라틴 알파벳을 쓴다고 해서 유럽 국가들이 다 필담으로 의사소통이 가능할 거라고 생각하는 것만큼이나 무모한 발상이다.

한자는 원칙이 있는 것 같으면서도 결국은 없는 chaotic한 글자이다.
뭔가 제자 원리를 봤을 때 한자처럼 생기긴 했는데 인류 역사상 그 어떤 문헌에도 존재한 적이 없는 '유령 한자'가 있다는 건 문자 코드에 관심이 있는 분이라면 이미 아실 것이다. 중국이나 일본에서 문자 코드를 제정하면서 글자들을 수집할 때, 어느 작업 인부가 실수를 한 모양이다.

빽빽한 중국어 자연어 텍스트처럼 생겼는데 실제로는 언어적인 의미가 전혀 없고 실존한 적이 없는 한자처럼 생긴 글자들로만 구성된 텍스트 디자인을 만든 사람도 있다. 그래, 한자는 역시 그런 문자이다.

Posted by 사무엘

2013/10/20 08:32 2013/10/20 08:32
, , , ,
Response
No Trackback , 9 Comments
RSS :
http://moogi.new21.org/tc/rss/response/889

한글 글꼴 처리 기술의 변천사

※ 0세대

0이라는 숫자는 뒤에 나올 1~3세대와 비교했을 때 '상대적인' 관점에서 붙여졌다. 1~3에 비해 0은 기계/아날로그적인 성격이 짙다.
한글을 모아쓰기+네모꼴 형태로 표현할 여건이 도저히 안 되는 환경을 말한다. 한 낱자를 상황에 따라 여러 벌로 분간해서 처리할 수가 없고, 최소 수천 자에 달하는 한글을 글자 단위로 부호화할 수도 없다.

옛날에 전보가 한글을 풀어쓰기 형태로 찍었다고 그러고, 김 정수 교수가 고안한 한글 두벌식 기울여 풀어쓰기도 0세대 기술이다. 굳이 풀어쓰기가 아니라도, 쓰이는 한글 몇 글자만 그림처럼 다루는 것도 딱히 기술이란 게 쓰인 게 아니므로 넓게는 0세대 기술로 간주한다.

그나마 0세대 기술 중에서 한글의 원리를 가장 잘 반영한 바람직한 기술은 공 병우 한글 세벌식 타자기, 그리고 그 이념을 물려받은 직결식 글꼴이다.

※ 1세대

제한된 벌수의 자모를 조합하여 한글 글자를 정사각형에다 모아쓰기 형태로 찍을 수 있다. 16*16 크기의 화면용 조합형 한글 글꼴이 바로 1세대의 상징이다.

옛날에 자체 한글을 지원하던 국내 도스용 프로그램들은 전부 이 수준의 기술을 사용하였으며, 도스용 아래아한글 1.x는 더 나아가서 간단한 수준의 옛한글과 자체 조합 로직까지 구현했다. 1세대 기술은 작고 간결하면서도 한글의 조합 원리와 무척 잘 부합한다는 큰 장점이 있기 때문에, <날개셋> 편집기 역시 최소주의를 추구하는 차원에서 딱 이 수준의 기술만을 의도적으로 고수하고 있다.

철도역 승강장의 전광판이 0세대인 롤지나 플랩에서 LED로 바뀌면서 1세대 기술로 한글을 표현한 것들이 많다.

※ 2세대

1세대보다 많이 발전했다. 8*16, 16*16의 한계를 벗어나 글자 크기를 자유롭게 조절할 수 있고 심지어 윤곽선 글꼴을 지원한다. 영문의 경우 W와 I의 폭이 다른 가변폭 글꼴을 지원한다. Windows의 경우 트루타입 글꼴이 도입되면서 글꼴의 기술 수준이 1.x세대에서 2세대 수준으로 껑충 뛰었으며, 아래아한글도 2.x 버전으로 넘어가면서 이 수준에 도달했다.

디스플레이 소자의 기술이 발달하면서 요즘은 전광판이 청색이나 흰색을 포함한 원색도 잘 표현하고 해상도도 더욱 높아졌다. 그래서 종전의 16*16만으로는 글자의 크기가 너무 작기 때문에 2세대로의 전환은 필수이다.
그러나 2세대 기술은 구현체마다 차이는 있지만, 1세대에 비해 한글 자체만의 조합 가능성이나 옛한글 표현 능력은 오히려 퇴보한 경우가 많다. 1코드 포인트당 반드시 한 글자가 대응한다는 한계에 여전히 매여 있기 때문이다.

※ 3세대

글꼴 처리 기술의 만렙으로, PC에는 21세기 무렵부터 도입되었다. 한글까지 가변폭 글꼴의 처리가 완벽하게 지원되며, 가변폭으로도 모자라서 커닝까지 처리된다. OpenType 기술을 이용하여 아랍· 태국어 문자까지도 꼼수 없이 잘 처리할 수 있을 정도인데 하물며 옛한글쯤이야 모아쓰기 형태로 표시를 못 할 이유가 전혀 없다.

유니코드라는 건 이런 글꼴 처리 기술과 결부되지 않을 수가 없는 규격이다. 그렇기 때문에 문자의 서식을 전혀 고려하지 않는 텍스트 에디터를 만든다 해도, 이제는 유니코드를 완벽하게 지원하려면 워드 프로세서를 만들 때나 필요할 것 같은 이런 기술을 어느 정도 사용하지 않을 수 없게 되었다.

3세대에서는 글꼴의 화면 렌더링도 단순한 grayscale 수준을 넘어서서 LCD 화면의 픽셀 구조에 특화된 subpixl 방식을 지원한다.

Posted by 사무엘

2013/08/31 19:47 2013/08/31 19:47
, ,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/872

북한의 한글 서체

북한에서 만든 한글 서체의 중요한 특징 중 하나:
ㅌ을 E 모양이 아니라 ㅡ+ㄷ 모양으로 쓰는 걸 선호한다! 즉, 위의 가로줄을 아래의 몸통과 분리해서 따로 적는다는 뜻이다.

사용자 삽입 이미지

물론, 북한 서체 중에도 E자 모양인 물건이 없는 건 아니다.
그러나 일단 북한의 굴림-바탕-돋움-궁서에 해당하는 4대 기본 글꼴인 천리마-청봉-광명-붓글이 모두 ㅌ이 ㅡ+ㄷ모양이니, 북한에서는 이걸 ㅌ의 공식적인 기본형으로 간주하는 듯하다.

남한에서 쓰는 글꼴 중에는 ㅌ이 그렇게 돼 있는 물건은 진짜 궁서체밖에 없지 싶다.
북한이야 원래 문화가 196, 70년대-_-의 복고풍을 추구하고 서체도 순명조 내지 붓글씨 계열을 쓰는 걸 좋아하는 동네이긴 하지만, 명조 계열 서체까지 ㅌ을 그렇게 적는 관행은 남한에서는 좀체 찾아볼 수 없다.

북한과 한글 서체라는 두 분야에 모두 평균 이상으로 관심이 많은 나조차 이걸 눈치채는 데 시간이 굉장히 오래 걸린 이유는, 역시 ㅌ이 자주 쓰이는 자음이 아니기 때문이어서인 것 같다.

두음법칙만큼이나 한글의 자형의 미세한 차이도 남북의 문화 차이를 나타낼 수 있는 잣대가 된 듯하다.
원래 ㅌ의 모양은 ㅡ+ㄷ이 맞다는 설명도 옛날에 본 것 같으나, 그 근거를 모르겠다. 당장 훈민정음해례 같은 엄청 옛날 문헌을 봐도 ㅌ은 E 모양으로 그려져 있는데?

Posted by 사무엘

2013/07/23 08:36 2013/07/23 08:36
, ,
Response
No Trackback , 4 Comments
RSS :
http://moogi.new21.org/tc/rss/response/858

1988년에 한글 맞춤법이 바뀌면서(본격적으로 시행된 건 1989년 3월 1일부터) 생긴 대표적인 변화 중 하나는 종결 어미 '-읍니다'가 '-습니다'로 바뀐 것이다.
이 변화 때문에 사람들이 '-음'까지 '-슴'으로 잘못 표기하는 경우가 적지 않다(8시에 갔슴). 그리고 재야에서 현행 한글 맞춤법에 비판적인 견해를 갖고 있는 사람은 이것이 형태주의에서 표음주의로 후퇴한 개정이라고 주장하기도 한다.

그러나 이는 사실이 아니다. 결론부터 말하면 '-습니다'는 한국어의 형태소를 더 잘 반영한 바람직한 변화이다.
이때의 '-습-'은 상대 높임을 나타내는 교착 선어말 어미로, '용언의 어간+시제 선어말 어미'까지 나왔고 앞 글자에 받침이 있을 때 등장하는 선어말 어미이다.
시제 선어말 어미가 마침 -ㅆ이기 때문에 '습'과 음운이 겹치는 것 같지만, 이들은 원래 서로 다른 형태소이다.

ㅆ이 아닌 다른 받침을 생각해 보면 명확해진다.
가령, '괜찮습니다'는 맞지만 '괜찮슴'이라고는 안 하고 '괜찮음'이 맞다.
그리고 '괜찮사옵니다'/'괜찮소'라고 하지, '괜찮아옵니다'/'괜찮오'라고는 안 한다.

앞 글자에 받침이 없으면 이 선어말 어미는 '습' 대신 그냥 '-ㅂ'으로만 훨씬 더 단순하게 실현된다. 갑니다, 감, 가옵니다, 가오 등.
이 정도면 '습' 또는 'ㅅ'의 존재감에 대해 충분히 실감할 수 있을 것이다.

맞춤법 개정 전에는 ㅆ 다음에만 '읍니다'이고, '괜찮습니다' 같은 다른 자음 받침 다음에는 '습니다'를 썼었다. 어차피 둘은 동일한 형태소이니, 괜히 그럴 필요가 없이 ㅆ 다음에도 똑같이 '습니다'로 적어 주는 게 더 합리적임을 알 수 있다.
1988년의 맞춤법 개정안에 비판적인 논조여서 내부적으로 성과 이름을 여전히 띄어 쓰고 있는 한글 학회에서도, '-습니다'에 대해서는 아무 문제 제기를 한 적이 없다.

한국어의 변화무쌍함과, 그에 비례하여 한글 맞춤법의 복잡함과 어려움을 실감할 수 있을 것이다.
'습니다'냐 '읍니다'냐를 따지는 건 국어학 내지 언어학에서 형태론이라는 분야에 속한다.
국어학 전공자 내지 국어 교사 지망생들은 용언의 어미를 공부할 때 '가/시/었/겠/습/니다'라는 단어를 일일이 떼어내서 각 형태소들의 의미를 공부한다. 어간과 어말 어미 사이에 저 화려한 선어말 어미들의 나열을 보시라.

어떤 언어를 공부할 때 모르는 단어는 사전을 찾으면서 익혀야 할 텐데,
복잡한 용언 활용이 일어난 한국어 문장은 단어를 떼어내서 사전에 존재하는 표제어 형태를 유추해 내는 것부터가 굉장히 높은 수준의 언어 직관을 필요로 할 것 같다. 특히 한국어를 외국어로서 공부하는 외국인의 입장에서는 말이다.
오랜만에 모처럼 우리말 분야에 글 하나 투척했다. ㅎㅎ

Posted by 사무엘

2013/06/16 08:32 2013/06/16 08:32
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/843

« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 12 : Next »

블로그 이미지

철도를 명절 때에나 떠오르는 4대 교통수단 중 하나로만 아는 것은, 예수님을 사대성인· 성인군자 중 하나로만 아는 것과 같다.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2021/10   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

Site Stats

Total hits:
1674381
Today:
43
Yesterday:
622