« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 10 : Next »

몇몇 언어 현상 관찰 -- 下

* 上에서 이어짐

5. 동사와 형용사가 오락가락 하는 단어

영어의 correct/incorrect 및 right/wrong은 형용사이다. 그 반면, 국어의 '맞다/틀리다'는 영어에서 같은 의미에 대응하는 단어들과는 달리, 품사가 동사이다.

국어에서 동사와 형용사는 똑같이 활용이 일어나는 용언으로 분류되나, 서로 차이점도 존재한다. 대표적으로 동사는 현재 시제 선어말 어미인 '-ㄴ-/-는-'이 붙을 수 있지만 형용사는 그렇지 않다. '맞다'는 동사이기 때문에 “맞은 답을 고르시오”라고 안 하고, “맞는 답을 고르시오”라고 쓰인다. 형용사인 '낮다'(low)는 '낮은 언덕'이라고 활용된다는 점을 같이 생각해 보시라.

그런데 '맞다'와는 달리 '알맞다'는 형용사이다. '맞다'일 때는 “맞는 답을 고르시오”인데, '알맞다'를 쓰면 “알맞은 답을 고르시오”라고 써야 한다는 뜻이다.
또한 '맞다' 역시, 동사임에도 불구하고 가끔 형용사처럼 즐겨 쓰이기도 한다. “A가 하니라 B처럼 하는 게 맞다”라고 표현하지, “B처럼 하는 게 맞는다”라고 쓰면 굉장히 어색한 건 나만의 생각인지?

반의어인 '틀리다'도 마찬가지여서 '틀리다', '틀린다', '틀렸다' 등의 쓰임이 오늘날은 굉장히 뒤죽박죽이 돼 있다. 그런 와중에 잘 알다시피 '다르다'의 의미까지 들어왔으니 카오스 그 자체. 최신 말뭉치를 통해 용례를 뽑아 보면 아주 가관이지 싶다.

동사와 형용사가 오락가락 하는 단어로 또 '웃기다'가 있다. 원래는 누구를 웃게 한다는 뜻의 사동사인데, '웃긴'이라고 하면 '우스운'이라는 형용사로 사실상 보편적으로 통용 중이기 때문이다. 이런 예가 국어에 좀 더 있지 않을까 생각된다.

6. 영단어 발음의 한글 표기와 관련된 혼란

첫째, 음절 말미의 자음을 별도의 음절로 빼내느냐 마느냐 하는 문제가 있다. 내가 아는 한 규칙성 따윈 없으며, 진짜 case by case이다. 이 요소를 이용해 똑같은 영단어의 다의성을 구분하는 경우까지 있다.

타이프, 타입(type): 전자는 인쇄 분야 용어, 후자는 그냥 보통명사
네트, 넷(net): 전자는 스포츠 분야 용어, 후자는 컴퓨터 쪽 용어
태그(tag), 백(bag), 랙(lag), 개그(gag)
빅(big), 버그(bug)


둘째, 단모음을 읽는 방식이다. 과거에는 일본이나 영국, 심지어 독일의 영향을 받아서 A는 쿨하게 ㅏ로, O는 ㅗ로 표기하는 색이었지만, 지금은 미국식 발음에 더 가깝게 A는 ㅐ로, O는 ㅏ로 바꾸는 추세이다. 특히 단모음 O의 혼란이 심하다.

도트, 닷(dot): 전자는 그래픽 용어(도트 노가다, 도트 프린터), 후자는 인터넷 용어(닷컴, 닷넷 등)
톱, 탑(top) / 톰, 탐(Tom)
알레르기, 앨러지 / 게놈, 지넘 같은 예도..


셋째, 모음을 장모음으로 읽느냐, 단모음으로 읽느냐이다. 한 단어에 모음 두 개가 있을 때 첫 모음을 장모음으로 읽을지 단모음으로 읽을지 문제는, 로마자 알파벳을 쓰는 영어권에서 영원히 없어지지 않을 혼란으로 남지 싶다.

프로필, 프로파일(profile): 전자는 누구의 신상 정보인 반면, 후자는 정밀 검사를 뜻한다.
디렉트, 다이렉트(direct): 전자가 영어권에서 더 널리 쓰이는 발음이지만, DirectX는 유독 후자의 발음으로 불린다.
ASUS: 아수스, 에이서스
Radeon: 레이디언, 라데온
LATEX: 라텍스-_-, 레이텍. 전자 발음을 꿋꿋이 고집하는 분들도 국내에 여럿 계신다.


인도 식 영어에는 data도 라라 크로프트(Lara)를 읽듯이 자기네끼리 '다타'라고 읽는 경우도 있다고 한다. 믿거나 말거나.

7. 숫자의 한자음에 존재하는 두음법칙

국어의 한자어 숫자 0(영)부터 9(구) 중, 유일하게 자음이 ㄹ이어서 두음법칙이 적용되는 숫자가 있으니, 바로 6(륙)이다. 얘는 원래 육이 아니라 륙이 맞는 독음이지만, 이게 어두에서의 대표음이다 보니 '륙'은 존재감이 굉장히 줄어들어 있다.

이번 <날개셋> 한글 입력기 6.7은 '숫자를 한글로' 텍스트 필터의 알고리즘을 수정하여, 천 단위와 소숫점 단위에서 처음 등장하는 6은 '육'으로, 그리고 그 단위 안에서 그 뒤부터 등장하는 6은 '륙'으로 변환하게 했다.

숫자 하니까 떠오르는 여담이다만, 영어 number는 일반적으로 연속적인 양 내지 개수를 나타내는 '수'를 뜻하지만, 한편으로는 이산적인 개체를 식별하는 '번호'도 된다(telephone number).

성경에서 이런 이중적인 개념 때문에 중의적인 심상이 만들어지는 대표적인 예가 바로 계 13:18의 그 이름도 유명한 짐승의 수 666임이 틀림없다.
666은 짐승의 number라고 하는데 수일까 아니면 일련번호의 성격이 더 강할까?

8. 접두사와 접미사

같은 접사나 단어라도, 단어나 문장의 앞에 등장할 때와 뒤에 등장할 때의 뉘앙스는 서로 달라진다. 예를 들어 女를 생각해 보자.

여형사(female)
형사녀(-ess 여성형 접미사)


요즘 '쩍벌남', '된장녀'처럼 남-녀를 꼭 접미사처럼 쓰는 게 유행이다 보니 위의 두 단어는 뭔가 쓰임이 달라져 있다. 접두사 '여'는 전통적인 female이라는 관형어 역할을 하는 반면, 접미사 '녀'는 웬지 단어 뒤에 붙은 여성형 접미사 역할을 하는 듯이 느껴지지 않는지?

난 영어에서 비슷하다면 비슷한 현상을 발견하는 게 뭐냐 하면 대명사에서 주격과 목적격의 관계 같다.
영어는 SVO형 언어라는 특성상, 도치 형태가 아니라면 주어는 언제나 문장의 처음에 나오고, 목적어는 언제나 문장의 끝에 등장한다. 그러다 보니 주격이 문장의 말미에 등장하는 게 되려 어색하게 느껴질 때가 있다.

바로 이런 심리 때문에 “나예요”가 It's I 대신, 구어를 중심으로 자꾸 It's me로 바뀌는 게 아닐까?
“He's taller than I.” 같은 문장도 자꾸 than me라고 말하고 싶어진다. I는 문장을 시작하는 단어이고 me는 문장을 끝내는 단어라는 편견이 내게만 있는 건 아니라 생각된다.

그러고 보니, 옛날에 봤던 월트 디즈니 만화영화에서 둘의 차이를 보여주는 좋은 예가 발견된다. <미녀와 야수>와 <알라딘>은 1991년과 1992년, 아주 비슷한 시기에 발표된 장편 애니메이션이다.

전자는 결말부에서 저주의 마법이 풀린 야수가 벨에게 “자기야, 나야!” 정도의 뉘앙스로 말할 때 “Bell, it's me!”라고 me를 썼다.
그 반면 후자에서는, 갓 잠에서 깨어나 심기가 불편한 신비의 동굴(Cave of Wonders)이 “Who disturbs my slumber?”이라는 아주 유명한 질문을 할 때, 알라딘이 쫄아서 “어.. 접니다. 알라딘이에요.”라는 의미로 “It is I, Aladdin.”이라고 me가 아닌 I를 써서 대답한다. I가 me보다 격식을 차린 말투라는 뜻 되겠다.

Posted by 사무엘

2012/11/08 08:30 2012/11/08 08:30
,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/753

몇몇 언어 현상 관찰 -- 上

철도, 컴퓨터, 교통 덕질에 밀려서 너무 오랫동안 먼지가 쌓여 있던 언어 카테고리에 오랜만에 글 나가신다.

1. 이다

영어에서 be 동사는 존재를 나타내는 아주 독특하고 중요한 단어이다.
한국어에는 be에 부분적으로 대응하는 개념으로 '이다'라는 단어가 있는데, 이 역시 문법적 역할을 분류하기가 꽤 까다로운 단어이다. '다'로 끝나니 용언 같아 보이긴 하나 그러기에는 존재감이 너무 없고.

요즘은 '이다'를 '서술격 조사'로 분류하는 게 대세여서 학교 문법을 포함해 어지간한 사전에도 그렇게 수록되어 있다. 그러나 조사가 아닌 단순한 종결어미라고 보는 학자도 있다.

be는 한국어로 치면 '이다'와 '있다' 사이를 함축적으로 감싸는 단어라 볼 수 있다. (이것도 영어로는 have를 쓸 걸 한국어로는 그냥 '있다'로 번역하는 경우가 있어서 더욱 미묘한 구석이 있지만..) 게다가 I am이라고 하면 하나님의 타이틀과도 관계가 있어서 성경 번역에 민감성을 한층 더하게 된다. 예를 들어 이런 것 말이다.

Before Abraham was, I am. (요 8:58; 아브라함이 있기 전부터 나는 있느니라)
I AM THAT I AM. (출 3:14; 나는 곧 나니라; 나는 스스로 있는 자이니라. 등~)
I AM hath sent me unto you. (엥, I AM 자체가 명사로!)


그리고 셰익스피어의 <햄릿>에도 아래와 같은 너무나 유명한 문장이 있다. 한국어는 영어 표현의 함축성을 그대로 표현할 수가 없어서 한 단계 의역되었음을 알 수 있다.

To be, or not to be: that is a question. (사느냐 죽느냐, 그것이 문제로다)


물론 영어권 사람들에게 와 닿는 의미는 한국어 번역과 동일하다. 그들에게 본디 문장에 대해 paraphrase를 시켜 봐도 to live, or to die가 들어간다.

이뿐만이 아니라 영어의 be 동사는 한국어의 '이다'와 크게 다른 점이 하나 발견되는데, 그것은 바로 시제이다.

공 병우 박사는 세벌식 한글 타자기의 [발명가이다].
내가 [어릴 때는/어렸을 때]는 인터넷도 없었고 스마트폰 같은 것도 없었다.
세종대왕은 조선의 [성군이다].


이런 문장을 영작하게 되면 모두 현재 시제가 아니라 반드시 과거 시제인 was가 붙는다. 공 박사건 세종대왕이건 2012년 현재는 죽고 없는 사람이라는 관점에서 과거 시제를 쓰는가 보다.

그러나 한국어는 지금도 그분들에 대한 역사적 행적이 변함없는 사실이라는 점을 중점에 두고 '이었다'보다는 '이다'를 선호한다.
“세종대왕은 조선의 [성군이었다]”라고 쓰면 꼭 “명왕성은 태양계의 아홉째 행성이었다”처럼 역사가 번복되었거나, 아니면 세종대왕이 말기에는 폭군으로 흑화했다는 여운을 강하게 남기게 된다.

혹시 내 언어 직관과 다른 생각을 갖고 계신 분 있으면 의견 기다리겠다.

2. '-이/가'와 '-은/는'의 차이는 무엇일까?

간단한 것 같아도 둘은 개념적으로 서로 꽤 다른 단어이다.

전자는 격(格)을 갖는 조사로, 주격 조사와 보격 조사의 역할을 겸한다. 다시 말해 선행사가 주어임을 나타내거나 보어임을 나타낸다는 뜻이다.
그에 반해 후자는 격이 없는 보조사 또는 특수 조사라고 불리며, 문맥 독립이 아니라 문맥 의존적인 문법을 구성한다. 보조사는 대체로 주격으로 쓰이는 경우가 많으나, 문맥에 따라 목적격도 되고, 사실은 보격도 안 되라는 법이 없다. '-은/는' 말고도 보조사로는 '-만', '-도' 같은 것 게 더 있다.

보조사는 우리가 생각하는 것보다 문법적으로 굉장히 wild하고 어려운 개념이다.
격조사는 국어 통사론의 맨 첫 단원에서 문장의 필수 요소로 곧장 다뤄지는 반면, 보조사는 통사론이 다 끝나고 화용론으로 넘어가기 직전에 다뤄진다. 그 정도로 서로 차원이 다르다.

마치 스타크래프트에서 스포닝 풀을 짓고 나면 저글링의 발업(격조사)은 해처리 수준에서 곧장 가능한 반면, 아드레날린업(보조사)은 무려 하이브까지 올린 뒤에야 가능한 것과 비슷한 맥락이랄까. 난 그런 생각이 들었다. 스타크래프트 세 종족을 통틀어서 한 유닛의 업그레이드 사이에 이 정도로 기술 격차가 존재하는 건 저것밖에 없다.

3. '없다'와 '아니다'

'없다'와 '아니다'는 비슷하면서도 다른 용법과 의미를 지닌 개념이다. 이게 구분이 아예 없으면 '없는 것보다는 낫다'와 '도대체 나은 구석이 전혀 없다'를 언어적으로 분간할 수가 없게 되기 때문에 문제가 생긴다.

영어에서 no는 감탄사로도 쓰임과 동시에 두 의미를 문맥에 따라 적당히 지니며, none이나 nothing 같은 파생어에도 그 형태가 살아 있다. 그 반면, not은 '아니다'의 의미만이 더 부각되는 것 같다.

No trespassing 무단 침입 금지
No way 길 없음 / 안 돼(not at all과 비슷)

... There is [none righteous, no, not one]. (롬 3:10)
의로운 자는 [없다, 정말 하나도 없다.]

And Enoch walked with God: and he [was not]; for God took him. (창 5:24)
에녹은 하나님과 걷다가 [사라졌다/없어졌다.] ...

For my thoughts [are not your thoughts, neither are your ways my ways], saith the Lord. (사 55:8)
내 생각은 너희의 [생각이 아니며/생각과 같지 않으며/생각과 다르며] ...


이런 부정문은 한국어와 영어가 서로 일대일 대응하지 않고 형태가 크게 달라지는 대표적인 문법이라 볼 수 있겠다.
한국어는 void처럼 공허함을 뜻하는 無에 해당하는 단어가 토박이말에 없는 반면, '없다'라는 용언이 따로 존재하는 건 때에 따라서는 굉장히 편리하다. 물론, 영어의 no처럼 '없음'이라는 의미를 넣어 주는 관형사가 없기 때문에, 한국어에서는 없다는 의미는 주어가 아닌 서술어에서 반드시 전달되지 않으면 안 되기도 하고 말이다.

잘 알다시피 킹 제임스 이외의 변개된 성경에서는 신약 성경에서 13개 구절이 삭제되어 있다. 한국어 성경은 행 8:37이나 막 9:44, 46 같은 유명한 구절을 펴면 '없음'이라는 간결한 표현이 있지만, 영어 성경은 그런 게 없다.  굳이 '없음'을 표현하려면 그 문맥에서 none, gone을 쓸 수도 없는 노릇이고 missing, omitted이라고 '누락됨'이라는 단어로 돌려서 표현을 해야 할 것이다.

한국어가 부정문도 서술어 형태를 좋아하는 것은, '알다'의 반대말로 '모르다'가 동사로 존재하는 것을 봐도 알 수 있다. 내가 알기로 '-에 무지한, 무식한'이라는 형용사 말고, '모르다'가 동사로 딱 존재하는 언어는 의외로 흔치 않다.

'전혀'라는 부사와 잘 어울린다는 특성상, '모르다'는 '아니다'와 '없다'와 더불어 부정의 의미가 담긴 대표적인 단어이다. M의 OST인 <나는 널 몰라>가 생각나는군.. 한국어를 가르칠 때 “모른다”와 “모르겠다”의 차이를 설명하는 것도 꽤 쉽지 않을 것 같다. 참고로 영어로는 똑같이 둘 다 그냥 I don't know로 번역 가능하다.

4. 우편향

언어가 그 자체적으로 왼쪽보다 오른쪽을 더 좋아하는 현상은 우연인지 필연인지 난 모르겠다.
한국어의 경우 오른쪽은 두 말할 나위도 없이 '옳은 쪽'에서  유래된 말인 반면, 왼쪽은 '외다'라는 '뭔가 정상 궤도에서 이탈하고 뒤틀림' 같은 단어에서 유래되었다. 오른쪽과는 달리, 무슨 뜻이더라도 좋은 어원은 절대 아니다.

이말년이 이런 성향을 잘 간파하여 '외길'이라는 브랜드를 좋아하는 것이 틀림없다. ㅋㅋㅋㅋ. 물론 최 현배 박사의 호 '외솔'은 속세를 초월한 빳빳한 지조, 강직함, 대쪽같음을 나타내려고 '외'라는 형태소를 긍정적으로 해석한 것이겠지만 말이다.

왼쪽과 오른쪽의 관계는 신기하게도 영어도 마찬가지여서, 오른쪽이 아예 right와 동음이의어도 아닌 다의어 관계이다! 글쎄, 반대로 left는 그렇게 안 좋은 심상이 담긴 걸까? 혹시 잉여? -_-
내가 제대로 아는 언어가 저 두 개밖에 없어서 다른 언어는 어떤지 궁금하다.

성경을 보면 물론 우리더러 좌로나 우로나 편파적으로 치우치지 말라는 권고(신 5:32, 잠 4:27 등)도 있다. 그러나 하나님 자신은 우편향이기도 하다는 것이 성경을 통해 분명히 발견된다.
여러 근거들이 있지만 한 가지 예만 들면, 하나님의 권능과 구원을 찬양하는 문맥에서 등장하는 하나님의 손은 열이면 열 모두 무조건 오른손이다. 시편에 '주의 오른손'은 수도 없이 등장하지만 왼손은 단 한 번도 안 나온다.

그렇다고 해서 왼손잡이가 무슨 동성애에 필적하는 나쁘고 가증스럽고 죄악된 기질이라는 말은 결코 아니다. 하지만 그런 특수한 경우를 빼면, 일반적으로는 사람이 오른손으로 숟가락을 들고 오른손으로 글씨를 쓰며 왼쪽과 오른쪽에 대해 그런 편견을 갖고 사는 게 아무 근거 없는 인습은 아니라는 말을 하고자 한다.

또한 사회 이념에서 좌익과 우익이라는 구분이 역사적으로는 무슨 프랑스 의회에서 좀 진보 성향이 왼쪽, 보수 성향이 오른쪽에 앉은 것에서 유래되었다고 하지만, 이 역시 아무 근거 없이 정립된 개념은 아니라고 본인은 생각한다. 비록, '뉴 라이트'인가 뭔가 하는 진영에서 '오른쪽'의 의미를 모독하고 있는 걸 생각하면 좀 한숨이 나오긴 하다만...

* 다음 下에서 다른 소재로 이야기는 계속된다. 기대하시라.

Posted by 사무엘

2012/11/05 08:29 2012/11/05 08:29
, ,
Response
No Trackback , 4 Comments
RSS :
http://moogi.new21.org/tc/rss/response/752

두벌식과 세벌식 한글 입력 방식을 제각각 가장 극단적인 FM 형태로 디자인해 보면, 다음과 같은 재미있는 차이를 발견할 수 있다.

세벌식은 초성 결합 지향적이고,
두벌식은 종성 결합 지향적이다!

공 병우 세벌식에서 가장 극단적인 FM을 추구한 입력 방식은 바로, 이중모음 정석이 강요되고 겹받침 조합이 없이 모든 겹받침을 반드시 Shift+한 타로만 치게 되어 있는 세벌식 최종이다.

즉, 이 입력 방식에서는 초성 쌍자음을 해당 자음의 연타로 입력하고, 중성 겹모음은 겹모음용 전용 ㅗ와 ㅜ를 통해서만 제한적으로 입력한다. (ㅢ도 반드시 8로만 한 타에 입력해야 하고, ㅡ+ㅣ로는 입력할 수 없음) 끝으로 종성에는 낱자 결합 규칙이 아예 존재하지 않는다.

이런 제약이 존재하는 덕분에 이 입력 방식은 기계식 타자기와 100% 싱크가 가능하다.
세벌식 기계식 타자기는 글쇠가 종이에 찍히는 초점이 두 군데 있으며, 글쇠도 부동(不動)키와 동(動)키로 나뉜다. 초성과 일반 모음들은 동키이고, 겹모음용 ㅗㅜ와 종성은 부동키이다. (한 글쇠에서 아랫글쇠는 동키, 윗글쇠는 부동키가 되는 경우를 대비해 복잡한 지침이 있긴 한데, 이에 대한 자세한 설명은 이 자리에서 생략)

부동키는 글쇠를 찍은 뒤에도 종이가 이동하지 않기 때문에, 당연히 기계식 타자기에서 낱자 결합용으로 쓰일 수 없다. 초성이야 동키이기 때문에 연타로 아쉬운 대로 쌍자음을 표현할 수 있는 반면, 종성은 그렇게 할 수 없는 것이다. 게다가 이미 중성과 종성을 모두 왼손이 담당하고 있다는 특성상(글쇠가 오른쪽에서 왼쪽으로 흐르는 배열인 것도 기계 친화적인 이유가 있음), Shift+한 타로 겹받침을 누르는 것은 왼손의 연타 부담을 경감하는 데도 도움이 된다.

이런 심오한 이유 때문에 공 병우 세벌식은 초성 쌍자음만을 연타로 입력하고 나머지 중성과 종성은 연타를 최소화하는 쪽으로 발전했다.

그에 반해 가장 FM에 충실한 두벌식은 <날개셋> 한글 입력기 6.7에서 추가된 종성 지향 두벌식처럼 자음은 모든 문맥에서 종성과 같은 형태로 결합하는 입력 방식이다.

아래아한글 같은 일부 프로그램의 한글 입력 방식에서는, 두벌식도 마치 세벌식처럼 초성과 종성의 낱자 결합 규칙이 따로 적용되어서 쌍자음을 해당 자음의 연타로 입력할 수 있는 구현체가 있다. 그러나 FM대로라면 초성이든 종성이든 쌍자음은 반드시 Shift+한 타로 입력해야 한다. 애초에 '국가'와 '구까'를 모두 구분하여 연달아 입력하려면 쌍자음은 그렇게 입력해야만 한다.

따라서 두벌식은, 겹받침을 Shift+한 타로 입력하는 세벌식과는 정반대로 초성 쌍자음을 Shift+한 타로 입력하며, 초성에 낱자 결합 규칙이 존재하지 않는다. 흥미로운 사실이 아닐 수 없다.

다만, 세벌식은 그런 극단적인 이념을 추구함으로써 컴퓨터와 기계식 타자기 사이의 글자판 통일을 이루었으며, 기계적으로 유리한 점과 빠르고 편한 타자 사이의 상당히 괜찮은 합의점까지 잘 찾아 낸 반면, 두벌식은 그런 일관성과 통일성이 없다.

두벌식 타자기는 어차피 받침은 Shift부터 반드시 먼저 누르고 쳐야 하기 때문에 치는 방식이 컴퓨터와 다를 뿐만 아니라, 결국은 ㄲ과 ㅆ, 그리고 자주 쓰이는 겹받침이나 겹모음은 예쁜 자형으로 찍기 위해 별도의 글쇠로 따로 있어야 할 수밖에 없다.

단적인 예로, 똑같이 한 타로 입력하는 겹자음이라도 ㄲ과 ㅆ은 초성과 종성에서 모두 쓰이지만, 나머지 ㄸ, ㅃ, ㅉ은 초성에서만 쓰인다. 이것을 기계식 타자기로 어떻게 구분하겠는가? 게다가 Shift+ㄱ은 어차피 ㄲ이 아니라 초성 ㄱ과 받침 ㄱ을 구분하는 데 써야 하는데? 결국은 겹자음의 처리가 두 그룹이 서로 달라질 수밖에 없다. 두벌식으로는 기계간의 글자판 통일을 이루는 게 불가능하다는 게 이 말이다.

두벌식에 대한 이해도가 깊어지니 그 반대편에 있는 세벌식에 대해서도 예전보다 더 잘 알게 되는 것 같다. 내가 다시 말하는데 그 알량한 글쇠 수 좀 줄이려고 PC에서 한글을 두벌식으로 쓰는 건 너무 아깝다. 얻는 것보다 잃는 게 너무 많다.

두벌식이 완전 백해무익한 쓰레기라는 말이 아니라, 가능한 한 세벌식이 엄연히 main이 되고 두벌식은 sub가 되어야 한다는 뜻이다. 세벌식으로는 간단한 기본 오토마타를 토대로 하여 더 발전하는 응용이 가능한 반면, 두벌식은 지금 있는 꼼수를 체계화하는 데에만 온갖 노력을 들여야 한다. 내 학위 논문이 주장하고자 한 바가 바로 이것이다.

여담이지만 컴퓨터 소프트웨어의 아이콘에서 '한글'을 나타낼 때 쓰는 한글 글자는 대개 '가' 아니면 '한'이다. <날개셋> 한글 입력기는 이를 모두 활용하며, 현 글자판이 세벌식으로 판단되면 '한'이 나오고, 두벌식이면 '가'가 나온다. 꽤 옛날 버전부터 이어져 온 관행인데 이게 나름 합리적인 디자인인 것 같다.

Posted by 사무엘

2012/10/24 08:18 2012/10/24 08:18
, ,
Response
No Trackback , 11 Comments
RSS :
http://moogi.new21.org/tc/rss/response/747

※ <날개셋> 한글 입력기의 개발자가 알기 쉽게 요약한 우리나라 한글 기계화의 간략한 역사이다.

실용성을 떠나서 어떻게든 모아쓰기 형태의 한글을 찍을 수 있는 타자 기계를 완전히 최초로 만든 사람은 재미 교포 이 원익(1914)이다. 이건 세로쓰기 형태였다.
그 후 1949년에 잘 알다시피 공 병우가 최초의 세벌식 쌍초점 타자기를 발명하고,
1958년에는 김 동훈이 다섯벌식(자음 2, 모음 2, 받침 1) 타자기를 발명했다.

사용자 삽입 이미지사용자 삽입 이미지

동일한 정사각형 공간에 한글을 모아쓰기 형태로 보기 좋게 찍으려면 잘 알다시피 한글 자모의 벌수가 많아져야 한다. 그러나 벌수가 많아질수록 기계 구조가 복잡해지고 치기가 어려워지는 등 타자 능률에는 여러 모로 애로사항이 꽃핀다.

공 병우는 미려한 자형을 과감히 포기하고, 자형은 그냥 알아볼 수만 있는 정도의 빨랫줄 샘물체 형태로 찍히지만 타자 능률 하나는 정말 기가 막히게 좋은 한쪽 극단을 선택하여, 세벌식이라는 글쇠배열 이념을 고안했다. 이때가 이분이 환자의 안과 진료까지 때려치우고 기계 덕질을 하던 시절이다.

세벌식은 외형만 약간 희생하면, 굳이 풀어쓰기까지 안 가고도 한글 역시 영문 뺨칠 정도로 기계로 편하게 칠 수 있는 문자라는 걸 최초로 입증해 보였다. 구조가 간단한 덕분에 한영 겸용 타자기까지 만들 수 있었다.

사용자 삽입 이미지

처음에는 왼손에서 오른손으로 흐르는 배열을 생각했는데, 왼쪽에서 오른쪽으로 종이가 진행되는데 글쇠가 엉키는 현상을 방지하기 위해 지금과 같이 오른손에서 왼손으로 흐르는 배열을 선택하게 되었다고 공 박사 자서전을 찾아보면 나온다. 기계식 타자기를 배제한다면 어느 방향이 더 좋을지에 대한 견해는 여전히 떡밥인 듯하다. R2L은 오른손잡이의 손에 유리한 반면, L2R은 시각적으로 무척 직관적이라는 장점이 있으니 말이다.

이렇게 세벌식 타자기는 성능이 좋은 덕분에, 닥치고 능률이 짱인 군대에서 아주 환영받았다. 뭐, 군대에서도 백 선엽 장군처럼 한글 기계화에 대한 관념이 없이, 여전히 세월아 네월아 한자를 섞어서 손으로 쓴 문서를 좋아하는 지휘관도 없지는 않았지만 말이다.
다만, 세벌식 타자기는 글자 모양이 심하게 보기 안 좋고 이질감이 심했던지라, 민간에서는 김 동훈 다섯벌식도 여전히 공존하여 쓰였다.

기계식 타자기는 몇 벌식으로 만드느냐에 따라서 기계 구조가 완전히 달라져야 했다. 구조가 상이한 한글 타자기가 공존한다는 것은 사회 비용을 증가시키고 손실이 이만저만이 아니었기에 국가가 나서서 통일안을 만들었다.

그래서 다섯벌식과 세벌식을 절충한답시고 1969년 6월에 과학기술처가 내놓은 게 네벌식이다. 개그 만화 일화 씰 사장님의 표현을 빌리자면...

“그래서 너희들은 새로운 글자판을 제정했다. 그것이 이것과 이것과 이것의 네벌식이다.
팔릴까보냐! 세벌식의 능률도, 다섯벌식의 자형도 어느 것 하나 제대로 못 살린 글자판이 되어 버렸지 않나! 더 이상해! 게다가 왜 공청회 없이 졸속으로 후다닥 만든 거냐! 누가 고안한 거냐, 제정 위원들은 글자판 전문가이긴 하냐? 대체 누구냐!”

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
뭐 이랬다.
과거 영국에서는 비숍 성경과 제네바 성경을 통합하는 킹 제임스 성경 표준안이 아주 훌륭하게 정착하였지만, 한국의 타자기 글자판 표준화는 해피엔딩이 되지 못했다.

허나 그때는 때가 박통 시절인지라 표준화는 불도저 식으로 추진되었다. 비표준이 된 세벌식과 다섯벌식은 모두 상당히 무식한 정치적 탄압을 받으면서 시장에서 씨가 마르고 말았다.
세벌식 지지자들이 이를 가는 대목이다. 오늘날 세벌식이 대부분의 사람들에게 듣보잡 글자판으로 전락해 버린 가장 큰 계기가 이것이기 때문이다. 이것으로 시즌 1은 종료.

시즌 2는 컴퓨터와 함께 시작되었다.
1970년대 후반엔 몇몇 선구자들을 중심으로 Apple II PC가 국내에 도입되었으며, 이에 타자기가 아닌 컴퓨터용 한글 입력 방식의 필요성이 논의되었다. 공 병우 박사 역시 당당한 Apple II 사용자였으며 그 후로도 매킨토시만을 애용하였다(오옷.. 1세대 앱등이).

컴퓨터는 전자식으로 동작하니 기계식 타자기를 만들 때와는 달리 여러 벌의 한글 자모를 갖추지 않아도 된다. 영문 글자판과 잘 어울리게 한글 자모를 하나씩만 곱게 집어넣으면 된다.

그 당시의 국내의 컴퓨터 전문가들은 한글을 어떻게 입력하면 좋을지, 한글이 조합 중일 때 시각적인 화면 피드백은 어떻게 만들면 좋을지 같은 것을 면밀히 연구하였고 중국이나 일본에서는 자국 문자 입력을 어떻게 하는지도 적극 벤치마킹했다.

지금은 당연한 개념으로 여겨지고 있지만 오늘날의 컴퓨터용 두벌식 한글 입력 오토마타의 이론적 근간을 처음으로 마련한 분은 KAIST 전산학과의 최 광무 교수이다. 그분의 1978년도 석사 학위 논문 <한글 모아쓰기에 관한 연구>의 요지가 이것이다. “자음과 모음 한 벌씩, 그리고 쌍자음은 Shift로 한 타 만에 바로 입력하게 하면 음절 경계 모호성이 없이 모아 쓴 한글의 연속 입력이 가능하다”는 것.

그렇잖아도 과학기술처는 KAIST에 용역을 주어 컴퓨터용 한글 글자판을 고안하게 했고, 그래서 1982년엔 최 교수의 사상을 기반으로 하여 오늘날의 KS X 5002 두벌식 글쇠배열이 표준으로 자리잡았다. 그냥 자음 모음만 아무 생각 없이 한 벌씩 배치하면, 요즘 천지인 같은 일부 모바일 한글 입력 방식이 그러하듯이 음절 경계 모호성이 존재하게 된다.

이 두벌식 배열은 타자기용 네벌식 배열보다야 구조가 훨씬 더 간단하고 배우기 쉬웠다. 왼손은 자음이나 오른손은 모음이니 언뜻 보기에 얼마나 직관적인가? 숫자와 기호가 영문 글자판과 완전히 일치하며, 딱 알파벳 26개 자리에만 한글 자모가 들어있다.

하지만 초중종성 세 벌로 이뤄진 문자를 두 벌의 글자판만으로 치려다 보니 필연적으로 타자 도중에 원하지 않는 글자가 생기는 도깨비불 현상을 피할 수 없었고, 또 타자기와 컴퓨터의 치는 방식이 서로 다르다는 큰 문제도 있었다. 예전에는 타자기에서 세벌식과 다섯벌식 때문에 사용자가 헷갈렸다면 이제는 타자기의 네벌식과 컴퓨터의 두벌식 때문에 혼동이 생긴 것이다.

이 때문에 5공 시절이던 1983년에는 타자기용 네벌식 글자판이 공식적으로 폐기되었고 역사 속으로 사라졌다. 네벌식을 웬수처럼 여기고 있던 세벌식 진영의 사람들도 이 순간만은 기뻐했다. 이제는 표준 글자판이 좀 개선되려나?

그러나 현실은 나아진 게 없었다. 컴퓨터용 글자판은 변함없이 두벌식이고, 타자기는 새로운 후속 표준이 정식으로 제정되는 게 없이 그냥 컴퓨터처럼 어중간한 두벌식으로 바뀌어 버렸다. 타자기에는 컴퓨터 같은 한글 입력 오토마타 장치가 없으니 그 대신 새로 무엇이 추가되었냐 하면 '받침' 키 신공이다. 여기서 또 씰 사장님의 절규 추가.

“그래서 너희들이 새로 만든 것이 이것과 이것과 이것의 두벌식 타자기이다.
무섭다구! 받침을 입력할 때마다 Shift를 눌러야 하는 기형 타자기를 도대체 누가 쓴단 말이냐! 이 기계로 타자를 해야 하는 타자수의 얼굴이 기분 나빠!”

사용자 삽입 이미지
아마 그 당시 높으신 분들은, 어차피 글자판은 이 지경이 돼 버렸고 이제 대세는 타자기에서 컴퓨터로 넘어가고 있으니 타자기는 이 참에 완전히 손을 놔 버린 모양이다. 그래서 실제로 한글 타자기는 컴퓨터와 비교했을 때 단순히 기계적인 기능의 차이 때문이 아니라, 글자판과 입력 방식 차원에서의 원론적이고 구조적인 차이로 인해 컴퓨터의 적수가 될 수 없어서 급속도로 몰락하고 말았다. 이것으로 시즌 2 종료.

오늘날 컴퓨터에서는 표준이 된 두벌식, 그리고 한글 구성 원리와 일치하는 세벌식만이 남아 있고 그보다 더 복잡한 벌수의 입력 방식은 완전히 역사 속으로 사라져 있다. 세벌식은 도깨비불 현상이 없고 타자 능률이 매우 좋다는 점, 그리고 기계간의 글자판 통일이 가능하다는 점이 두벌식이 흉내도 낼 수 없는 압도적인 장점이기 때문에, 한글이 남아 있는 한 절대로 없어지지는 않을 것이다. 비록 글쇠 수가 좀 많고 기호가 영문 자판과 다른 게 단점이긴 하지만 말이다.

하지만 처음부터 타자기와 컴퓨터가 모두 속 시원하게 똑같이 세벌식으로 갔으면 글자판 통일은 진작에 이뤄졌을 것이며, 타자기도 온갖 n벌식 입력 방식에 이리 저리 휘둘리다가 망하는 일이 없었을 것이다. 타자기도 자기가 할 수 있는 본분은 다 수행하면서 실제보다 더욱 늦게 현역에서 물러났을 것이다.

참으로 아쉬운 대목이 아닐 수 없다. 세상에 기계식 타자기로 저 정도로 칠 수 있는 문자가 라틴 알파벳 계열을 빼고 전세계에 얼마나 될까? 그런데도 고작 네모 글꼴 하나 건지려고 벌수 놀이를 한 것치고는 감수해야 한 사회적 손실과 치러야 한 대가가 너무 컸다. 기술이 발달하면 세벌식 타자기의 빨랫줄 모양 글꼴도 그 방향을 유지하면서 얼마든지 더 미려하게 개선할 수 있었을 텐데 말이다.

세벌식이 확고하게 타자기와 PC의 주 입력 방식으로 자리잡았다면, 두벌식은 세벌식을 적용하기에는 글쇠 수가 충분치 않고, 어차피 기계식 타자기와의 연결 고리가 없으며 장시간 빠르게 입력을 할 필요도 없는 기기를 위한 제한적이고 예외적인 변칙 입력 방식으로 추후에 논의되게 되었을 것이다.

요 얼마 전엔 드디어 모바일용 한글 입력 방식으로 천지인과 이지한글(나랏글), SKY 세 종류가 복수 표준으로 지정되었다. 기계식 타자기의 글쇠배열과는 상황이 달라도 너무 다르다. 어차피 한글 입력은 소프트웨어적으로 처리되기 때문에 무슨 입력 방식을 심든 물리적인 비용이 드는 게 없으며, 어차피 어느 입력 방식이든 두벌식 안에서 그 나물에 그 밥이기 때문에 성능 격차도 예전 같지 않다. 그러니 그냥 압도적으로 많이 쓰이는 기존 입력 방식 몇 개만을 그대로 인정해 주는 것만으로도 충분했다.

요즘은 한글날도 20여 년 만에 다시 공휴일로 되돌리려는 움직임이 있는데, 세벌식의 표준화에 “too late”는 있을 수 없다고 본다. 장기적으로는 390과 최종을 통합하는 글쇠배열이 있어야 할 것이고, 표준화는 언제든지 논의되어야 한다. 다시 강조하지만 한글은 두벌식으로만 쓰기엔 너무 아까운 문자이고, 세벌식의 압도적이고 상징적인 장점은 절대로 없어지거나 희석되지 않을 것이기 때문이다..

여담이다만, 아마 공 병우 박사님이 2010년대까지 살아 계셨다면, 맨날 아이폰으로 트위터 하면서 한글날 공휴일 지정과 세벌식 표준화를 주장하는 트윗을 남기고 젊은이들과 얘기를 나누셨을 것 같다. 비록 타자기/PC에서만치 세벌식을 강경하게 주장하지는 않을지라도 모바일용 한글 입력 방식을 연구하는 건 당연지사이고..;;

사용자 삽입 이미지
공 병우 박사(1907~1995). 안과 의사에다 불세출의 한글 공학자까지 인증..;; 하나만 제대로 하기도 무진장 힘들 텐데, 머리가 너무 좋고 시대를 너무 앞서갔던 분이다..;;

Posted by 사무엘

2012/07/15 08:29 2012/07/15 08:29
, , , , , ,
Response
No Trackback , 12 Comments
RSS :
http://moogi.new21.org/tc/rss/response/707

가로쓰기와 세로쓰기

우리나라의 문자 언어 문화는 지난 20세기 후반에 큰 변화를 겪었다. 이는 두 양상으로 요약된다. 첫째로 한자를 섞어 쓰는 빈도가 크게 감소하였으며, 둘째, 세로쓰기가 전멸하다시피 하고 가로쓰기가 대세가 되었다. 사실, 예전에 한글 학회의 슬로건이 “한글만으로 가로로 쓰자”일 정도였다. 한글 전용만 주장한 게 아니라 가로쓰기까지 주장했다는 뜻.

오늘날 우리나라에서 세로쓰기는, 태생상 세로로 길쭉할 수밖에 없는 간판이나 책의 등짝 같은 극소수 제한된 환경에서나 볼 수 있는 듯하다. 더 나중에는 그런 곳에서마저도 세로쓰기를 하느니 차라리 영문 문화권처럼 가로쓰기를 90도로 돌린 표기로 대체될지는 모르겠다.

붓글씨+세로쓰기 스타일이던 성경책은 이미 1990년대 중· 후반부터 한국 교회에서 거의 찾아볼 수 없게 된 지 오래이다. 신문은 1990년대 초반에 한겨레가 처음으로 한글 전용+가로쓰기를 시작한 후, 1999년에 그 보수적인 조선일보마저 가로쓰기로 돌아섰다.

출판물뿐만이 아니라 영상 매체에서도 분명한 추세를 발견할 수 있다.
예전에는 TV 프로에서 방송이 시작되기 전 ‘제공’이라는 명목으로 뜨는 광고주 리스트라든가, 일부 중요 인명이나 문구는 때에 따라 가로쓰기와 세로쓰기가 혼용되는 경향이 있었다. 그러나 요즘은 다 가로쓰기이다.

영화관에서는 과거에 길쭉한 스크린의 우측 상단에 으레 세로쓰기로 뜨던 한글 자막도, 이미 옛날에 가로쓰기로 다 바뀌었다. 세로쓰기는 확실히 낡은 구닥다리 스타일로 간주되게 되었다. 이런 변화가 무엇을 의미할까?

세로쓰기가 천덕꾸러미가 되고 도태된 가장 큰 이유는, 컴퓨터가 세로쓰기를 전혀 하지 않는 문화권에서 처음으로 발명되었고 따라서 세로쓰기도 컴퓨터에서 직관적으로 처리하기 곤란한 고리타분한 방식으로 전락했기 때문이 아닌가 한다.

물론, 본인은 명백히 가로쓰기에 익숙한 가로쓰기 지지자이다. 세로로 써진 빽빽한 글은 한국어가 한국어처럼 덩어리 단위로 눈에 확 들어오질 않는다. -_-;; 일단은 가로든 세로든 자기에게 익숙한 방향의 텍스트가 눈에 더 빨리 들어오겠지만, 아무 편견이 없는 사람이라면 두 눈이 가로로 달려 있는 이상, 가로쓰기가 더 유리하게 읽힐 수밖에 없을 것이다.

다만, 그래도 세로쓰기를 일부러 의도적으로 배척할 필요는 없고 제목이나 장식용으로 제한적으로는 적절하게 활용하는 게 한글의 특성도 살릴 수 있고, 공간 활용 면에서 더 효율적이지 않냐 하는 정도의 견해를 갖고 있다. 옛날 사람들은 저렇게 읽기 불편한 세로쓰기 책들로 도대체 어떻게 독서와 공부를 했을까?

마치 요즘 자동차들이 전부 자동변속기로만 나와서 운전자들이 수동변속기 운전의 묘미를 경험할 기회가 없는 것처럼, 가로와 세로쓰기가 모두 가능한데 오로지 가로쓰기만 함으로써 우리가 다른 방면에서 얻는 기회비용이 무엇일지에 대해서 열린 가능성을 생각해 볼 의향은 있다는 뜻이다. 그렇잖아도 요즘은 컴퓨터도 온통 와이드 화면이 대세인데, 이런 곳에서는 세로쓰기가 공간 활용이 더 효율적이기도 할지 모른다. (가독성 같은 다른 요소는 제끼고 오로지 공간 효율만)

오늘날 국내엔 세로쓰기를 적극적으로 옹호하는 사람이 극소수 있긴 하다. 하지만 이런 사람들은 대체로 강경한 한자 혼용론자이고 세로쓰기를 거의 종교적인 숭배에 가까운 수준으로 미는 경향이 있는데, 본인은 그런 주장에까지 공감하지는 못한다. 가령, 한글 전용과 가로쓰기 때문에 남한의 지식· 학문의 수준과 깊이가 하락하고, 사상까지 온통 좌경화되었다는 식의 드립. -_-;;

원래 한자의 종주국이 세로쓰기의 종주국이기도 한지라 한국과 일본의 세로쓰기 관행은 중국의 영향을 받은 것이었다. 그러나 중국 공산당이 20세기 중반에 간체자를 만들고 가로쓰기를 전면 시행하면서 어문 규범이 크게 바뀌었고, 한국 역시 스타일이 상당 부분 서구화했다. 현재는 일본만이 세로쓰기를 아주 활발하게 활용하고 있기 때문에, 이것이 소프트웨어의 국제화에서까지 진지한 고려 대상이 되어 있다.

윈도우 운영체제의 경우 한글 글꼴의 이름 앞에 ‘ @ ’가 붙은 세로쓰기 바리에이션 글꼴을 제공하고 있으며, 현재 편집 중인 텍스트의 방향이 가로인지 세로인지 운영체제 IME에게 알려 주는 프로토콜도 제공한다.  MS 워드에서 MS IME나 <날개셋> 한글 입력기로 한글-한자 변환을 해 보면, 세로쓰기 중일 때는 한자 후보 리스트도 세로쓰기로 나오는 걸 알 수 있다. 그리고 <날개셋> 타자연습은 아예 세로쓰기로 타자 연습도 가능하다. ㄲㄲ

일본은 자기 이름을 로마자로 표기할 때 이름-성 순으로 표기하는 건 일찌감치 서구화했으면서, 세로쓰기는 서양 스타일을 따르지 않고 자기 식으로 고수하고 있으니 흥미로운 차이인 것 같다. 미국이 관습상 110V 전압과 비표준 단위계를 못 벗어나고 있는 것만큼이나 일본 역시 세로쓰기를 언제까지나 고집하게 될지 두고 볼 일이다.

서양의 라틴 알파벳 문화권에서는 진짜 크로스워드 게임 같은 데서나 세로쓰기를 볼 수 있는 듯하다. 애초에 단어의 일부가 양 줄에 걸쳐서는 안 되는 정서법이니, 세로쓰기와는 더욱 어울리기 힘들다고 볼 수 있겠다.

문득 드는 생각은, 한글에도 세로쓰기 용도로 잘 튜닝된 글꼴이 개발되어야 하겠다는 것이다. 가로쓰기용 가변폭 글꼴이 ‘이’보다 ‘빼’가 더 길쭉한 것처럼, 반대로 세로쓰기용 가변폭 글꼴은 ‘이’보다 ‘봅’이 더 길쭉해야 할 것이다. 그리고 가, 개 같은 글자가 세로로 배열되었을 때 구조적으로 중심이 잘 잡혀 있어야 할 것이다. 그런데 당장 가로쓰기용으로도 가변폭 글꼴이 연구된 게 잘 없는데, 벌써 세로쓰기까지 생각하는 건 사치인 것 같다. ㅋ

Posted by 사무엘

2012/03/07 08:25 2012/03/07 08:25
,
Response
No Trackback , 8 Comments
RSS :
http://moogi.new21.org/tc/rss/response/651

한글 입력기에 이어 다음은 글꼴 쪽 소식이다.

사용자 삽입 이미지
이게 과연 가능할까 나 자신도 장담할 수 없었는데 결국은 해냈다.
스크린샷의 프로그램은, 아래아한글 2.0 전문용에 들어있는 영문 신명조 HFT 파일을 읽어서 거기에 있는 글자를 찍은 모습이다.
TTF로 존재하지 않는 아래아한글만의 독창적인 글꼴--공한체나 휴먼옛체, 강낭콩 등--을 인증샷으로 보여야 더 재미가 있을 텐데, 아래아한글 2.0 시절에는 독창적인 글꼴이 아직 흔치 않았었다.

궁극의 오덕질의 승리.
뭐, 아예 압축 파일 포맷을 혼자 Reverse engineering만으로 알아낸 사람도 있는데, 이 정도 가지고 내가 딱히 RE의 귀재이거나 한 건 아니다.

아래아한글 2.0은 윤곽선 글꼴이 도입된 첫 버전이었고(무려 1992년 발매!), 지금의 아래아한글이 사용하는 '통합 글꼴' 포맷이 완전히 제정되기 전이었다. 글꼴 파일 내부에 아직 이름이나 제조사 같은 정보도 없고, 파일 포맷도 별도의 추상적인 계층이나 미래 확장 대비 공간이 전혀 없이 아주 아주 단순했다. 헥스 에디터로 딱 들여다보면, 이건 글자별 글립 데이터 오프셋 정보, 이건 글자별 폭(영문 가변폭 글꼴 기준) 이런 식으로 구간이 나뉘어 있겠다는 게 눈에 들어왔다. 구간을 나누는 데 성공한 것만으로도 최하 30% 이상은 성공이었다.

글립 데이터를 들여다보고 있으니, 처음 부분은 고정된 헤더인 듯하다. 그 지점 이후부터 가변 길이의 인스트럭션들이 나오는데(직선을 그어라, 곡선을 만들어라, 다음 폴리곤으로 넘어가라, 등의 그래픽 명령) 이건 알기가 쉽지 않았다.
그래서 가장 간단한 글자인 중고딕 . I L - _ (다 사각형 하나만 달랑 나오는-_-)가 어떻게 돼 있는지 분석하는 걸 시작으로, + = / : 을 이어 추적했다.

가장 마지막으로 원리를 알아 낸 건 물론 곡선 부분이다. 다행히 이 HFT는 트루타입(TTF)보다는 구조가 훨씬 더 단순했다. TTF 정도의 복잡도만 돼도 나 혼자서는 포맷을 못 알아냈을 것이다.
내가 이미 TTF 같은 더 복잡한 글꼴 파일 포맷의 구조에 대해 어느 정도 알고 있고, 그러니 뭐가 나올지 어느 정도 예상을 하고 있으며, HFT는 그보다 단순할 거라고 예상도 했기 때문에 해킹에 성공할 수 있었다.

다음 관심사는, 물론 아래아한글 2.1부터 지금까지 쓰이고 있는 통합 글꼴이다.
아래아한글 2.x 확장팩 글꼴들을 ttf로 바꿔서 윈도우 다른 프로그램에서도 쓰는 게 소원이다. -_-;;
언뜻 들여다본 바로는, 2.0하고는 인스트럭션들의 포맷이 살짝 다른 듯하다.

같은 한양 시스템 글꼴을 2.0 것과 통합 글꼴 것을 대조해 보면 분석이 훨씬 더 쉽겠지만, 안타깝게도 현재 아래아한글의 한양 시스템 hft 글꼴은 빡세게 암호화되어 있어서 분석을 할 수 없다. 파일 크기와 처리 성능으로 미뤄 보건대 내가 보기엔 압축은 아니고, 그냥 단순 암호화이다. HFT 중에서도 암호화가 안 된 글꼴만이 추후 분석 대상임.

아마 나는 아래아한글의 소스를 본 적이 전혀 없는 사람 중에서는,
글자 입출력과 관련하여 아래아한글이 사용하는 각종 데이터 파일의 구조를 우리나라에서 제일 잘 아는 사람일 것이다.
당장 <날개셋> 한글 입력기에 역대 아래아한글이 사용한 모든 custom 글쇠배열 파일을 읽어들이는 기능이 있으며,
바탕, 가는샘물, 필기는 도스용 아래아한글의 화면용 글꼴 파일을 추출한 것이다.

1월 10일 추가:
오늘 새벽. 통합 글꼴 HFT도 뚫는 데 성공. 단, 이건 내 혼자 힘만으로 한 건 아니다.
인증샷 대상 글꼴은 '신명 신명조'이다.

사용자 삽입 이미지

Posted by 사무엘

2012/01/08 19:23 2012/01/08 19:23
,
Response
No Trackback , 15 Comments
RSS :
http://moogi.new21.org/tc/rss/response/624

국어사전, 이곳 학교 이야기

본인의 고등학교 시절에 해당하는 20세기 말에는 국어와 관련된 사건이 주변에 유난히 많이 일어났다. 이런 일련의 사건들이, 감수성 예민하던(?) 본인의 진로 결정에 어떤 형태로든 영향을 끼쳤던 것 같다.

1999년에는 웬 뜬금없는 한자 병용 정책이 내려져서 한글 전용 지지 진영과 반대편 진영이 극심한 키배를 벌였고 서로 으르렁거리며 격렬하게 싸웠다. (그때 나도 혈기 넘치는 키보드 워리어 중 하나였다 ㄲㄲㄲㄲ) 지금 도로 표지판과 지하철 역명판에 한자가 병기된 건 이 시절의 산물이다.
사실, 소위 '한자파'들은 1998년에 전국 한자 교육 추진 총연합회라는 단체를 만들어 그때부터 이미 의기투합해 있었다. 그러고 보니 1998년에는 복 거일 씨의 영어 공용화 드립 때문에 시끄러웠다. 이 때가 뭐가 씌인 해이기라도 했는지?

그래도 1999년 3월 1일에는 그 보수적인 조선일보가, 거스를 수 없는 대세를 따라 전면적으로 가로쓰기를 시행하고, 예전에 비해 한자를 크게 줄이기도 했다.
2000년에는 한글 로마자 표기법이 지금과 같은 형태로 바뀌었다.

운동 단체들만 시끌벅적했던 게 아니다.
1998년부터는 21세기 세종 계획이라는 게 정부 차원에서 10년간 추진되어, 한국어의 말뭉치 데이터를 구축하고 가공하고 이것으로부터 뭔가 의미 있는 실험 결과를 도출하는 연구가 활기를 띠기 시작했다.
그리고 이 시기에 출판사가 아닌 학술 연구소와 정부에서 각각 대형 국어 사전을 내놓았다. 전자는 바로 연세 한국어 사전(1998)이요, 후자는 그 이름도 유명한 국립 국어원의 표준 국어 대사전(1999)이다.

공교롭게도 이들의 첫 종이 사전은 둘 모두 두산동아에서 출판했다. 현재는 다들 개정판을 인터넷으로만 제공하고 종이 사전을 내지는 않는 듯.

연세대는 국어학에 관한 한 서울대와는 다른 독자적인 학풍을 형성하고 있다. 옛날에는 최 현배 파, 이 희승 파로 갈려서 교과서 용어조차 다를 정도로 서로 이질적이었지만 지금은 물론 그 정도는 아니고..;;
그래도 연세대가 좀 말뭉치 기반 언어 연구라든가 사전학, 비교 언어학처럼 언어학 중에서도 응용 분야를 더 좋아한다.

이런 맥락에서 연세대에서는 국문과 교수들과 관련 인사를 주축으로, 이미 1980년대 중반에 국어사전을 자체적으로 만들겠다는 선언을 했다. 옛날 조선어 학회 시절에 천신만고 끝에 발간된 <큰사전>의 정신과 사명감을 계승하겠다고 말이다. (당장 정신적 지주인 故 최 현배 박사가 연세대 교수!)

10년에 가까운 시간과 수백 명에 달하는 인원이 동원된 끝에, 1998년 한글날에 처음으로 연세 한국어 사전 초판이 발간되었다. 그리고 2000년 한글날에는 웹 기반 사전 서비스가 시작되었으며, 컨텐츠는 지금까지도 꾸준히 증보와 개정을 거듭하고 있다.;;

본인이 재학 중인 연세 대학교의 '언어 정보학' 협동 과정은 1990년대 말에 바로 이런 분위기에 편승하여 개설된 상당히 독보적인 학과이다. 사전 편찬실을 보유하고 있는 데다, 마침 국가에서도 세종 계획이다 뭐다 하면서 국어 정보학 분야에 종사할 인력을 원하고 있었으니까 말이다. 특히, 국어학과 컴퓨터 기술을 잘 융합할 수 있는 사람을!

나도 옛날에는 사전을 만든 국어학자들이 민족주의 정신이 투철한 독립 운동가 정도로만 알고 있었는데, 여기서 공부를 좀 해 보니, 저분들이 정말 똑똑한 수재였으며 이런 험난한 길을 안 갔으면 훨씬 더 돈 많이 벌고 성공했을 사람들이라는 생각에 마음이 숙연해졌다.
내 홈페이지에 있는 석인 정 태진 선생의 일화를 읽어 보기 바란다.

그래서 이 학과에는 말뭉치 언어학 내지 사전 편찬과 관련된 수업이 필수로 등재되어 있다. 사전 편찬학 수업을 들으면서 사전 편찬과 성경 번역도 뭔가 비슷한 구석이 있다는 걸 느꼈다. 사전을 잘 만든다는 게 얼마나 어려운지를 어렴풋이 느꼈으며, 사전 원고를 검증하는 도구(컴퓨터 프로그램)가 조금만 더 똑똑하면 지금보다 상당수의 번거로운 노가다 수작업을 줄이고 사전의 오류도 줄일 수 있겠다는 걸 알 수 있었다.

예를 들자면, 사전 뜻풀이에 정작 이 사전에 없는 어려운 어휘가 쓰인다거나, A라는 뜻풀이에 B 단어가 등장하고 B의 뜻풀이에 A 단어가 등장하는 순환 뜻풀이 같은 것. 일명 순환 참조가 되시겠다.

요즘은 사전 편찬자가 자기 언어 직감에 의지하여 뜻풀이와 예문을 작성하기보다는, 다량의 말뭉치를 분석하여 거기서 도출된 통계대로 용례와 뜻풀이를 추출하는 방법이 일반화되고 있다. 편찬자의 주관이 안 들어가고 객관적이라는 장점 하나는 확보할 수 있을 테니까 말이다.
연세 한국어 사전은 철저하게 이 방법을 활용하여 만들어진 게 특징이며 여타 사전들과 다른 점이라고 한다. 그런데 현행 표준어 규범까지 무시할 정도로 독자 노선을 간 줄은 몰랐다.

지금이야 드디어 '짜장면'이 복수 표준어가 되었다지만, 10년도 더 전에 나온 연세 한국어 사전은 '자장면'의 풀이가 “짜장면의 잘못”이라고 되어 있었다! 덜덜덜;;; 미래를 내다본 것일까? 개인적으로 굉장히 놀랐다.
당연히 국민 중에 '자장면'을 쓰는 사람은 전혀에 가깝게 없었을 것이고, 그 추세가 밑천인 말뭉치에도 고스란히 반영되어 있어서 그런 풀이가 나왔지 싶다.

이런 식으로 연세 사전은 라이벌(?)인 표준 국어 대사전과는 정반대의 뜻풀이를 한 게 여럿 있었다.
'흉내 내다' 대신 '흉내내다'를 한 단어로 풀이하고, '-측(one's side)'을 의존명사로 보아 붙이는 용법을 지지하였다. 아래아한글의 맞춤법 검사기만 돌려 봐도 빨간 줄이 쳐질 단어이지만, 솔직히 '흉내 내다'는 무의식적으로 붙여서 써지는 경우가 더 많긴 하다.

옛날에 문법 용어를 두고 동사 vs 움직씨 같은 기싸움을 한 것을, 사전으로 무대를 옮겨서 하고 있는가 하는 생각이 들 정도였다.;;
그래도 국어 정보학 쪽으로 식견이 있는 일부 사람들은 이런 파격적인 시도를 한 연세 사전의 가능성을 높게 평가하기도 했다.

한편, 이에 반해 표준 국어 대사전은 정부 기관이 막대한 자금을 쏟아부어 편찬했으니, 성경으로 치면 한국의 유일한 공역이라 할 수 있으며 여타 사전들과는 그 위상이 다르다.

하지만 이 사전은 이것대로 표제어 수 늘리느라 중국· 일본에서도 안 쓰는 이상한 한자어들을 잔뜩 덧붙였다고 비판 받고, 잘못된 풀이와 틀린 용법까지 무분별하게 다 실어서 책 두께를 부풀렸다고 욕 많이 얻어먹긴 마찬가지였다. 여기 국문과 대학원 재학생들 중에서도 표준 국어 대사전 좋아하는 분 별로 못 봤다. -_- 그래도 국립 국어원에서 만든 만큼 이건 표준어/맞춤법 규범을 어기지는 않는다.

21세기 세종 계획이 만료된 뒤, 이곳 언어 정보학 협동 과정은 한국어 교육 쪽과의 접목을 통해 경쟁력 확보를 시도하고 있다. 현실적으로 그쪽이 수요가 많고(한류 열풍 약빨이 오래 가야 할 텐데!), 사전 편찬은 언어 교육과도 밀접한 관계가 있으며 말뭉치 같은 걸 접목할 수 있는 응용 분야이기 때문이다. 하지만 예전보다 '언어'에 비해 '정보'의 비중이 덜해진 건 사실이며 그건 나로서는 약간 아쉬운 점이다.

이런 와중에 본인은 진짜 두 분야를 완벽하게 섞은 연구를 하려고 이곳에 진학해 있다. 교수나 랩이 주도적으로 뭔가를 push해 넣는 게 아니라, 오히려 개인플레이 위주이고 혼자 알아서 덕질을 찾아서 할 수 있는 곳을 의도적으로 선택했다. 난 그런 곳이 낫다.
나는 더 빠른 하드웨어를 만들거나, 수학적으로 더 엄밀한 프로그래밍 언어를 개발하는 것보다는, 이를 이용해서 한국어와 한글 다루는 걸 더 멋있고 편리하게 만드는 응용 쪽이 아무래도 훨씬 더 잘 어울린다.

Posted by 사무엘

2011/10/18 19:31 2011/10/18 19:31
, ,
Response
No Trackback , 5 Comments
RSS :
http://moogi.new21.org/tc/rss/response/586

Times 서체 이야기

Times라는 단어가 쓰이는 곳이 어딜까?
수학에서는 '곱하기'를 나타낸다. 5 times 3 equals 15처럼. 디즈니의 만화영화 라이온 킹에는 I'm ten times the king Mufasa was! 라는 스카의 대사도 있다.

그리고 Times는 영미권에서 왠지 신문의 이름을 나타내는 경향이 있다. 뉴욕 타임즈가 대표적이고, 영국에도 The Times라는 신문사가 있다.
하긴, 신문 이름에 쓰이는 단어로 Herald도 있긴 하다. 성경에서는 딱 한 번, 다니엘서에서 느부갓네살 왕의 황금 형상에다 다들 절하라고(안 그러면 뒈진다고) 대국민 담화를 선포하는 자가 herald라고 나온다(단 3:4).

옛날에 윈도우 95 CD에는 Good times bad times라는 노래의 뮤직비디오도 있었는데 이건 그냥 잡설이고..

다시 Times라는 단어로 돌아오면, 이 단어는 오늘날 영미권에서 쓰이는 가장 유명한 본문용 서체의 이름이기도 하다. 워낙 너무 유명해서 이미 아시는 분들도 많을 것이다.
이 서체의 이름 역시 영국의 The Times 신문사 이름에서 유래된 것이다. 그렇다, 이건 신문사에서 만든 서체이다. 서체의 공식 명칭은 Times Roman인데 이건 우리로 치면 '조선일보명조', '한겨레결체' 이런 것과 완전히 동일한 작명법이다.

more..


Times가 만들어진 때는 1931년. 컴퓨터가 발명되기 전에 만들어지긴 했지만 Bodoni나 Baskerville만치 오래 된 서체는 아니다.
생김새가 기존 세리프 계열 서체들과 비교했을 때 사뭇 이질적이다. 이것 때문에 등장 당시에는 비판도 받았다고 한다.

가령, 2자의 모양을 보자. 세리프 계열이라면 좌측 상단 끝부분의 획에 동그란 세리프가 달리는 게 통념일 텐데 Times는 그렇지 않다. 사실은 6이나 9도 마찬가지. Times는 전반적으로 / 모양의 붓으로 글자를 그렸을 때 생기는 모양을 형상화했다.

그런데 전반적으로 모양이 무척 미려하고 아름답긴 하다. 무난하면서도 참신하고 잘 만든 서체이다. 컴퓨터 시대가 되면서 Times는 그야말로 신문을 넘어서 전세계 본문 서체를 평정했다. 거의 모든 책과 문서들이 이 서체로 만들어지게 되었다. 한국은 신문 명조와 일반 본문 명조 사이의 경계가 아직도 뚜렷한 편인데 이는 좋은 대조가 아닐 수 없다. 과거에는 신문용 서체가 세로쓰기에 맞춰져서 더 납작하고 뚱뚱한 편이기라도 했지만, 요즘은 세로쓰기도 다 없어졌는데 말이다.

Times는 한글 명조와 같이 쓰기에는 약간 어울리지 않고 혼자 튀는 경향이 있다. 뭐, 대다수의 영문 서체들이 그렇지만, 이들이 한글 서체와 잘 어울리려면 좀더 홀쭉하고 가늘어야 한다. 하지만 그런 전반적인 디자인을 차치하고라도 Times의 세리프는 뭐랄까, 좀 보수적이다. 그냥 명조보다는 문화바탕과 더 어울리는 것 같고, 윤명조 같은 파격적인 명조와는 어울리기 힘들다. Times보다는 Century Schoolbook 같은 부류의 세리프가 명조와 더 잘 맞을 것 같다.

그래서 Times의 획을 한중일 문자에 맞게, 아니 심지어 불변폭 서체 형태로 바꾼 변종이 있다. 과거 윈도우 3.1 시절의 바탕체에 포함된 영문· 숫자 글꼴이 그 예이며, 오늘날 MingLiu라는 한자 서체도 영문· 숫자 글꼴을 보면 딱 그렇다. 참고로, 불변폭은 아니지만 과거에 신명 세명조라는 서체가 내가 생각한 문화바탕+Times 컨셉과 굉장히 비슷한 모양을 세명조답게 아주 가늘게 변형한 형태였다.

Times는 그 중후하고 보수적인 분위기 덕분에, 문화바탕을 넘어 붓글씨 서체인 궁서와도 의외로 잘 어울린다. 사실, 오늘날 한글 서체에 같이 들어있는 영문· 숫자의 궁서체는 Courier 같은 딱딱한 타자기체-_-를 더 굵게 하고 눈꼽만치 기교를 넣은 뒤, 적당히 가변폭 서체로 바꾼 것에 더 가깝다.
어째 세리프 계열의 한글 서체에다가 산세리프 계열의 영문 서체를 집어넣었나 싶다만-_-, 어차피 영문은 붓글씨 테크닉이 정착해 있지도 않으니 붓으로는 아무 기교 없이 그렇게 글자를 그린다 해도 이상할 건 없겠다.

그 반면, 오늘날 역명판이 코레일체 대신 궁서체로 기재되어 있는 경춘선 김유정 역은, 궁서와 더불어 영문이 Times 서체로 기재되어 서로 잘 어울리고 있으며, Chick tracts 같은 미국의 전도지도 성경 구절은 Times로 적고 있다. 우리가 산돌성경체 같은 개역성경 붓글씨체를 보수적인 성경 본문체로 생각하듯이, 걔네들은 그게 보수적인 성경 본문체인 것이다.

여담이다만, 오늘날 타이포그래피의 대세는 산세리프와 세리프의 경계를 깨고(뭐, 굳이 하나만 고르자면 역시 세리프에 더 가깝지만) 화면 표시용 튜닝이 잘 된 그런 서체가 차지하고 있는 것 같다. 맑은 고딕, Segoe, 서울 남산 같은 서체들이 그런 유행을 따르고 있다.

옛날에는 그런 하이브리드 서체로 그래픽체가 아주 유명했고 참신했는데 지금은 그것도 너무 outdate돼 있다. 2, 30년 전의 TV 화면에서 그래픽체 자막을 보니 얼마나 격세지감이 느껴지던지!
오늘날은 Times 신문사도 Times가 아닌 다른 본문 서체를 사용한다는데, 이 Times에도 먼 미래에는 오늘날 우리가 중세 서체를 생각하는 것처럼 그런 고전 서체가 되어 있을지도 모르겠다.

Posted by 사무엘

2011/09/05 19:07 2011/09/05 19:07
,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/565

영어 발음 넋두리 외

오늘날 영어는 세계와 소통하기 위한 필수 매개체요, 좋든 싫든 도저히 거스를 수 없는 대세이다. 예전에도 이렇게 말한 적이 있지 싶은데, 난 그나마 한국어 "보다"야 영어가 세계어가 된 건 다행이라고 생각한다. 언문일치가 개떡인 점, 한국어와 구조가 너무 다른 점 때문에 우리 입장에서 어려울 뿐이지, 그나마 그 정도 굴절이나 그 정도 불규칙은 다른 언어에 비해서는 나은 편이다.

그 반면에 나의 모국어인 한국어는 높임법이나 다른 복잡한 요인을 차치하고라도, 언어에서 기본 중의 기본인 대명사부터가 정말 답이 안 나오는 안습한 언어이다.;;

1인칭: '날다'의 활용형(나는)과 충돌이 있어서 '날으는'이라는 기형적인 활용형이 어쩔 수 없이 쓰인다. 나/내, 너/네도 은근히 헷갈리지 싶은데, '내'/'네'는 이제 발음 구분이 안 된다. -_-;; (영어도 I와 eye가 동음이의어이긴 하지만, 문제될 상황은 거의 없다)

2인칭: you를 딱부러지게 옮기지를 못해서 님, 너님, 회원님, 고객님, 선생님 등등등등...;; 아 골치아파. (뭐, 영어는 2인칭에 단· 복수 구분이 없는 게 아주 기괴하긴 함.)

3인칭: 관형사 '그'가 3인칭 인격체 대명사처럼 굳어져 버렸다. 조사 없이 단독으로 쓰인 건 너무 어색하다. '그녀' 문제는 우리말 운동 진영에서 전형적인 떡밥이기도 하고... (반대로 영어는 he/she 성별 구분 때문에 굉장히 불편하긴 함. 그래서 단수까지도 they로 싸잡아 표현하기도 하고.)

요컨대 한국어는 1인칭과 2인칭 대명사는 불필요하게 쓸데없는 호칭만 너무 다양하고 자잘하게 발달해 버려서, 아주 neutral한 표현 하나를 콕 집어 쓰기가 어려우며,
3인칭은 관형사 '그' 말고는 어휘 자체가 없다고 해도 과언이 아니다.

이래서 가끔은, 하나님을 가리킬 때조차도 대놓고 you라고 깔끔하게 싸잡아 부르는 언어가 부러울 때가 있다. 불경스럽다고? 하나님은 그런 불경스러운 언어를 쓰셔서 절대무오 최종 권위 성경을 만드셨다! -_-;; 통념과는 달리, 킹 제임스 성경은 하나님이나 예수님을 가리키는 대명사(You, He)에 첫 글자 대문자 처리조차도 되어 있지 않다.

물론, 글 써 놓고 보니까, 뭐 영어도 만능은 아니어서 언어적인 flaw가 있긴 하다.
그래도 한국어는 대명사의 표현이 부족한 건 부인할 수 없는 사실이다.
옛날 사람들은 그런 대명사 없이 글을 어떻게 쓰고 의사소통을 어떻게 불편 없이 했는지 '무척' 궁금하다. 내가 선조들의 삶의 방식은 공부 안 하고서, 그저 한국어가 영어 번역투로 잘 대응하질 않아서 찌질하게 징징대고 있는 건지는 잘 모르겠다.

본인처럼 영어가 모국어가 아니고 외국 장기간 체류 경험도 없는 사람은 글을 읽으면서 새로운 단어를 종종 접하곤 한다. 이 단어가 실제로 어떻게 발음되는지는 전혀 들어 본 적이 없다. 뜻만 알면 되니까 발음 기호는 보지도 않고, 이 단어는 어렴풋이 이렇게 발음되겠지 하고 넘어갔는데.. 알고 보니 낚시였던 경우가 본인은 은근히 많았다.

오랜만에 학교로 돌아와 대학원에서 공부를 다시 시작하니, 공과 대학 수업은 다들 영어 강의로 물갈이되어 있었다. 몇몇 단어는 교수님의 발음이 이상한가 싶었는데, 사전을 찾아 보니 교수님이 맞고 내 짐작이 다 틀려 있었다. -_-;; 그도 그럴 것이 공대 교수들은 거의 다 영어권 국가에서 박사 받고 온 분들이니까.

다음은 내가 생각하던 틀린 발음과, 실제 맞는 발음을 나열한 것이다. 수 년째 잘못 알고 있던 발음도 있었다. 그도 그럴 것이, 그 단어를 실제로 입 밖에 내면서 외국인과 얘기를 주고받아 본 적이 없었으니 말이다.

suffice: 서피스, 서파이스 (surface 내지 office 때문에)
merely: 멀리, 미얼리 (were 영향)
duplicate: 더플리케이트, 듀플리케이트
Reagan: 리이건, 레이건
geek: 지크, 기크 (당연히 gee 영향)
obtain: 압튼, 옵테인 (certain 영향)
adjacent: 앧저슨트, 얻제이슨트

즉, 본인은 대체로 단모음 위주로 발음을 예상한 반면, 실제 발음은 장모음인 경우가 많았다.
G 다음에 I, E, Y가 오면 거의 다 ㄱ 대신 ㅈ으로 소리가 바뀌기 때문에 생물학 용어인 '게놈'도 영어식 발음은 '지넘'이지 않던가? 그런데 사전을 찾아 보면, ge... 단어 중에도 ㄱ 발음이 적지 않다. 결국 발음을 알아맞히는 건 복불복인가 보다. -_-;;

장모음 ea는 대부분이 그냥 '이'인데, 가끔 '에'(sweat)인 경우가 있고, great나 저 대통령 이름에서처럼 '에이'가 되기도 하며, create에서는 아예 '이에이'라는 긴 발음이 된다. 그래서 프로토스 기본 유닛인 Zealot도 영어 발음은 '젤럿'임에도 불구하고 한국에서는 완전히 '질럿'으로 알려져 있다. ㅋㅋ

어찌 보면, 이런 판타지 같은 정서법을 끼고 사는 영어권 사람들이 참 골치아프겠다는 생각이 들기도 한다.
adjacent는 프로그램 개발 관련 기술 문서를 읽느라 중학교 시절부터 알고 있던 단어인데, 본인은 10년이 넘게 '앧저슨트'라고 마음속으로 읽어 왔다. -_-;;

그래서 다국적 컴퓨터 회사인 Asus는 '에이서스'와 '아수스' 사이에서 발음이 난립하고 있다.
data는 '데이터'라고 읽지만, 툼 레이더의 여걸 Lara Croft는 '라라 크로프트'이다. '레이러' 따위가 아니다. -_-;;
영어권에는 단어를 발음하는 큰 줄기가 단모음식 아니면 장모음식으로 갈라져 있다고 봐야 할 것 같다.

우리나라는 워낙 미국물을 좋아해서 영어 발음도 철저하게 아메리칸식으로 공부해 왔지만,
영국에서는 진짜로 모음+R은 해당 모음을 장음화만 하고 혀는 안 굴린다. 단모음 A를 ㅐ로 전설모음화하지 않으며, ㅏ로 있는 그대로 발음하는 걸 좋아한다. 오오..;;
무엇보다도 영국에서는 모음+T+모음 사이에서 T가 R로 안 바뀐다. water는 그대로 워터이지, 워러로 바뀌지 않는다는 뜻이다.

물론 F나 TH 같은 발음은 동일하며, 억양도 동일하기 때문에 영국 영어와 미국 영어가 무슨 표준 베이징 중국어와 광동어의 차이만치 심하기라도 한 건 절대 아니다.
사실은 킹 제임스 성경을 읽으면서도, 이걸 실제로 소리내어 읽는 소리는 어떻게 날까 적지 않게 궁금했다. 이놈의 thou, thee, -eth 어미를 원어민이 실제로 읽는 걸 들은 적이 없었기 때문이며, KJV가 그렇게도 운율감이 좋고 읽기 편하다고 하는데 내가 그걸 실감할 수가 없어서 답답했던 것이다. 지금은 그 시절에 비해서는 의문이 좀 해소되어, 덜 궁금하다.

공대는 그렇다 치고 문과대 쪽으로 가면,--난 인문계와 이공계를 두루 섭렵하는 협동 과정 소속 ㅋㅋ-- 교수님들이 본인에 대해, 공대 출신이다 보니 문과 출신만치 체계적인 글쓰기 스킬은 부족한 감이 있다고 생각하시는 듯하다. 그런데 난 공대 출신 치고는 사실 문과 기질이 강하며, 정보 올림피아드 입상 실적만 아니었으면 지금과는 완전 딴판의 진로를 갔을 사람이었다...... 라고 생각하였으나
그래도 진짜 문과 교수님들이 보기에는 본인 같은 사람도 그냥 영락없는 공돌이인가 보다. ㄲㄲㄲㄲ

그리고 사실은 공대도 대학원에 가면 비록 성격이 문과와는 좀 다를지언정, 글쓰기가 많으며 심지어 랩미팅에 대비한 프레젠테이션도 많다. 실험을 해야 하고, 돈이 많이 든다는 특성상 펀딩을 받으려면 눈에 보이는 연구 실적이 많아야 하고, 고로 대학원생은 석사 들어가자마자 논문을 정말 미친 듯이 써 댄다. 그것도 모국어도 아니고, 이공계의 학술 공용어인 영어로 쓴다. 논문에 이름 실린 경력이 연예인으로 치면 filmography 같은 거다.

그 바닥은 랩생활을 하기 때문에, 공동 연구의 공동 저자로 낄 기회도 많다. 그러면서 이공계 논문 잘 쓰고 발표 잘 하는 법 같은 테크닉을 랩생활 하면서, 혹은 대학원 수업을 통해 공부한다.

- 단독 저자이더라도 논문의 1인칭 주어는 We이다.
- 결론은 Conclusion이 아니라 반드시 Conclusions라고 복수형으로 쓴다.
- 세속 글쓰기와는 달리 성 구분 없는 3인칭 단수를 (s)he 처럼 쓰지 말라. 차라리 they로 대체하거나, 그런 상황을 피할 수 있게 다른 어휘를 고르거나 아예 문장을 다른 형태로 다시 써라.

이런 식의 팁이 엄청 많다. 이런 격식 있는 글쓰기 스킬이 하루 아침에 숙달될 리가 없으니, 지도교수한테 무진장 깨지면서, 또 아마도 랩 선배한테 코치를 가장한 갈굼도 당하면서 익숙해지는 거겠지...?

그나저나, 영어는 숫자 형태로 된 날짜나 시각을 말할 때 단위를 붙이지 않고 숫자만 연달아 읽는다.
그러면 “좀 있다 40분에 나가자. (지금이 6시 20분이면)” / “졸업식은 15일이다. (이 달 15일)” 이런 말을 영어로 표현하는 방법은 없나? 주변의 영문과 출신 선배에게 물어 보니, 자기도 그 생각은 미처 안 했는데 아마 방법이 없는 듯하다고 대답했다.
그냥 무조건 “20분 뒤에 나가자” / “이번 주 금요일이다” 같은 식으로 형태를 바꿔야 하는지 궁금하다. at the n-th minute, on the n-th day 이런 표현은 안 쓰는 듯?

Posted by 사무엘

2011/09/03 08:35 2011/09/03 08:35
, ,
Response
No Trackback , 12 Comments
RSS :
http://moogi.new21.org/tc/rss/response/564

탈네모 글꼴에 대한 생각

한글 타이포그래피에서 탈네모 글꼴은 만년 떡밥인 것 같다. 지금 까지 그래와꼬 아패로도 그렇겠지

한글 가변폭 글꼴: 한글 글꼴 중에서 명조, 고딕 내지 한자 같은 부류와는 달리, 글자의 폭이 획일적이지 않고 글자마다 차이가 있는 글꼴을 일컫는다. 본문용으로는 잘 쓰이지 않고 특이한 제목이나 장식용으로 쓰인다. 아래에서 설명될 세벌식 글꼴과는 살짝 다른 개념으로, 세벌 글꼴은 굉장히 높은 확률로 한글 가변폭 글꼴이지만 모든 가변폭 글꼴이 세벌 글꼴은 아니다.

세벌식 글꼴: 공 병우 세벌식으로 만들어진 기계식 타자기로 글자를 쳤을 때 찍혀 나오는 자형과 같거나 최소한 상당히 유사한 구조를 하고 있는 글꼴. 일명 샘물체 내지 안상수체, 공한체 계열이다. 초중종을 이루는 벌수가 매우 적으며 글꼴 크기가 대체로 아주 작고 가볍다. 세벌식 글꼴은 거의 필연적으로 가변폭 글꼴이 되며, '가'과 '강'에서 '가'의 모양이 같아서 세로로도 기복이 크다는 특성상 '탈네모 글꼴'이라고도 분류된다.

그런데 문제는, 획일적인 정사각형을 탈피한 한글 글꼴에 대한 개인 호불호 편차가 굉장히 크다는 것이다. 국어학자, 타이포그래피 디자이너, 한글 기계화 연구인 중에서도 그런 발상 자체를 완전 개혐오하는 분이 좀 있다. 수 년 전, 한겨레 신문사가 이질감을 최소화하려고 무늬만 세벌 글꼴 흉내를 살짝 낸 한겨레결체로 본문 서체를 과감하게 바꿨는데, 당시엔 그것만으로도 “이거 도대체 뭐야?”(성경에 나오는 '만나'의 의미가 정확하게 이것이다-_-) 하는 반발이 벌써부터 터져나오기도 했다고 한다.

애초에 과거 기계식 타자기 시절에 네벌식, 다섯벌식 같은 불편한 입력 방식이 있었던 것도, 세벌식만으로 타자를 하면 자형이 너무 들쭉날쭉하고 못생겼기 때문이었다. 그만큼 사람들의 문자 습관이라는 건 무척 보수적이다.

그 반면에 서양 먹물 좀 먹었거나 일말의 선각자 자질이 있는 분은, 한글 자형이 정사각형 일색이기만 해서는 로마자(p, d, v 같은 들쭉날쭉 다양한 글자가 있는) 같은 가독성이 살아나질 않는다면서 그래도 탈네모 글꼴에 희망을 걸고 있는 경우가 있기도 하다. 그렇잖아도 국어 정서법에는 대문자도 없고, 고유명사도 없고, 영문 정서법 같은 엄격한 띄어쓰기가 정착해 있지 않으며, 문장 부호의 활용이 활발한 것도 아니다. 어찌 보면 굉장히 난감한 상황이 아닐 수 없다. 한글 전용론자라면 맨날 한글이 우수하다고 자뻑만 할 게 아니라, 현실에서 드러나는 한글의 단점을 한글로 해결하는 방법도 연구해야 하지 않겠는가?

컴퓨터용으로 만들어진 세벌식 글꼴은 최소한의 보정을 거친다. 가령, 간의 ㄴ은 감의 ㅁ보다 약간 위로 올라가며(공간이 너무 벌어지니까), 진짜 곧이곧대로 타자기 FM대로 1*1*1벌이라기보다는 최소한 2*1*2벌(특히 글자별 폭의 격차를 줄여서 디자인할 때) 이상이 시도되기도 한다.
<날개셋> 편집기에 존재하는 샘물이나 타자기 같은 글꼴은 에디팅 엔진의 한계 때문에 폭은 불변폭이나, 너그럽게 보면 세벌식 글꼴의 범주에 들어간다.

세벌식이라는 이념은, 한글을 풀어쓰기 형태로 파괴하지 않고 최소한의 형태와 원리를 유지하는 한편으로, 또 사람과 기계 모두에게 편리한 간결한 방법으로 한글을 입출력할 수 있는 정점을 찍은 일종의 교리이다.
탈네모 가변폭 한글 글꼴이라는 개념 자체는 글자판과는 별개로 일부 디자이너들이 시도하기도 했지만, 세벌식이 한글 글꼴에 그런 맥락의 변화를 시도하는 데에도 응당 영향을 끼쳤다고 볼 수 있는 셈이다.

이 이념의 영향을 받아 1980년대에 이미 안 상수 교수가 캐드를 이용한 디자인으로 안상수체 내지 안체를 개발했으며, 1990년대에는 한 재준 교수가 공 병우 박사와 합작으로 공한체와 한체 시리즈를 내놓았다. 대표적인 가변폭+세벌 글꼴이다.
안상수체는 아래아한글 2.1 (1993)에서 처음으로 도입되었고, 공한체/한체는 아래아한글 96에서 도입되어 우리에게 친숙해졌다.

여러분은 이런 탈네모, 세벌, 가변폭 한글 글꼴에 대해서 어떻게 생각하시는가?
일단, 이런 글꼴들은 생김새가 이질적일 뿐만 아니라 기존 네모 글꼴과는 디자인된 metric이라고 해야 하나, 전반적인 크기가 전혀 어울리지 않아서 같이 쓰기가 더욱 힘들다. 같은 크기로 맞췄을 때 저 글꼴은 여타 네모 글꼴들보다 훨씬 더 작아 보인다.

탈네모 글꼴을 처음으로 시도한 디자이너들은, 단순히 '생소하고 디자인이 정착해 있지 못하며, 완성도 높은 탈네모 글꼴이 아직 나오지 않아서 거부감이 드는 것일 뿐이다'라고 생각했다. 즉, 시간이 탈네모 글꼴의 문제를 점차 해결해 줄 거라고 생각했다. 실제로 2011년이 된 오늘날, 굳이 세벌이 아니더라도 가변폭 글꼴에 대한 국민적인 이질감은 예전보다는 줄어든 것 같다.

그러나 그래도 갈 길이 멀다. 아무래도 탈네모 글꼴이 명조· 고딕의 벽을 완전히 넘을 수 있을 것 같지는 않다. 특히 정사각형 안에 차곡차곡 자모가 질서정연하게 배치되는 명조· 궁서· 문화바탕 같은 미려한 서체의 완성도는, 탈네모 글꼴 주장자들이 결코 무시해서는 안 된다.
그런 글꼴이 괜히 수십~수백 년의 짬밥을 먹으면서 국민들로부터 사랑받고 살아남은 게 아니다. 탈네모 글꼴은 여전히 세리프 계열 글꼴이 빈약하며, 그나마 세리프 축에 드는 공한체는 진짜 무늬만 세리프이지 명조 같은 급에 비할 바가 못 된다. 즉 여전히 실험적인 수준을 벗어나지 못하고 있다는 뜻 되겠다.

하지만, (또 반전을 해야겠다)
그럼에도 불구하고
한글은 한자 같은 아예 픽토그램급의 상형문자가 아니고 일정한 규칙과 체계가 있는 '자질문자' 시스템인데..
천편일률적인 정사각형에만 맞춰 쓰는 건 많이 아까운 것도 사실이라고 본인은 생각한다.
이것이 앞으로 한글 타이포그래피가 풀어야 할 숙제 중 하나이다.

믿거나 말거나. MS 워드는.. 2007의 바로 직전의 2003 버전까지만 해도 가변폭 한글 글꼴이 전부 불변폭처럼 고정폭으로 찍혔다! 한글은 한자와 마찬가지로 무조건 정사각형이라고 전제를 했던 것 같다.
워드패드--정확히 말하면 그 밑에서 돌아가는 리치 에디트 컨트롤-- 도 초창기 버전은 마찬가지였는데, 이건 아마 윈도우 2000/XP 타이밍 무렵부터 개선되었지 싶다.

과거의 아래아한글 97은 정사각형 글꼴을 쓸 때는 안 그런데 공한체나 안상수체 같은 가변폭 글꼴로 한글을 입력하면 매번 줄 전체가 번쩍거리며 바뀌는 게 보여서 불편했다. 이 문제는 차세대 엔진 기반인 워디안/2002부터 바로 개선되긴 했다.

Posted by 사무엘

2011/08/25 09:23 2011/08/25 09:23
,
Response
No Trackback , 7 Comments
RSS :
http://moogi.new21.org/tc/rss/response/560

« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 10 : Next »

블로그 이미지

철도를 명절 때에나 떠오르는 4대 교통수단 중 하나로만 아는 것은, 예수님을 사대성인· 성인군자 중 하나로만 아는 것과 같다.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2020/02   »
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29

Site Stats

Total hits:
1329103
Today:
134
Yesterday:
539