공부하면서 든 생각

국어학이란 게 어떤 학문인지, 말뭉치(코퍼스) 연구라는 게 어떤 건지 슬슬 적응이 돼 간다. 또 여기가 사전 연구 전문이다 보니, 평소에 전혀 생각하지 않았던 국어사전이라는 게 어떻게 만들어지는지, 심지어 예문은 어떻게 뽑고 예문에 들어가는 철수, 영희 같은 명칭은 어떤 원칙으로 뽑는지 같은 것도 세부 사항을 그쪽 일을 하는 친구들에게서 들으니 재미있다.
코퍼스는 한글 사용 빈도 파악과 글자판 연구에도 사용 가능할 듯?

1.
본인이 생각하는 사전 표제어 기록 (이의 제기 환영)

백과사전에서 풀이가 가장 긴 단어: 대한민국 (우리나라의 역사, 지리, 분야별 현황 등이 죄다 좌르륵~)
혹은 United States (위와 비슷한 이유로), human (인간의 모든 것 ㅋㅋㅋ)

한영사전이나 국어사전에서 풀이가 가장 긴 단어: 보다 (see, seem 등~~)
영한사전에서 풀이가 가장 긴 단어: have

2.
영어에 '모르다'를 뜻하는 한 단어짜리 동사가 없다는 건 무척 흥미로운 사실이다.
'-에 무지한' 정도에 해당하는 형용사는 있지만, "어서 불어 / 난 모른다!"를 깔끔하게 표현할 수 있는 한 단어는 없다. 기껏해야 do not know.
아마 영어는, 뭔가를 모른다는 건 마치 뭔가가 '없는 것'처럼 상태일 뿐이지 '알다'처럼 정식으로 동사가 될 자격은 없는 개념이라고 생각한 모양이다. 하다못해 forget도 아니고.. 한자에서도 '모를 X' 같은 글자는 본 기억이 없다.

사실, 영어에는 '없다'라는 깔끔한 단어도 없다. 그냥 없는 주체 앞에다가 no를 붙여서 There is no X 또는 No X exists 정도로 표현되는 게 고작. 그런데 반대로 한국어는 nothing이나 void에 정확하게 대응하는 추상적인 명사 단어가 없다. 無는 접사에 더 가깝다.

3.
한국어에서 '뛰다'가 어째서 run도 의미하고 jump도 의미하는지는 오랫동안 본인의 의문점이었다.
마치 '푸르다'가 어째서 blue도 의미하고 green도 의미하는지 의아했던 것처럼 말이다.

단군의 후손들은 파랑과 초록도 구분 못 하는 색맹이었단 말인가? 어떻게 들판도 푸르고 하늘과 바다도 동시에 푸를 수가 있을까?
'푸르다'는 관용적으로 blue와 green을 싸잡아 일컬을 수 있게 놔 둔다 치더라도, '파랗다'는 blue로 완전히 굳혔으면 하는 바람이 있다. 움직여도 되는 신호등 색깔은 파란불이 아니라 초록불이나 차라리 푸른불로 표현을 바꿔야 하지 않나 싶다.

어쨌든 '뛰다'도 그렇게 논란의 여지가 있는 단어이다. 물론, 달릴 때는 걸을 때와는 달리 두 다리가 동시에 공중에 떠 있는 타이밍이 있다. 그 점에서는 run이 jump와도 공통점을 지닌다.
이것도 '뛰다'는 무조건 jump로, run은 '달리다'로만 강제로 구별을 시켜 버리면 어떨까 하는 생각을 혼자 해 봤는데, 쉽지 않은 문제이다.
마치 '손뼉을 치다'와 '박수를 치다'는 뉘앙스가 서로 완전히 다른 단어인 것처럼, '달리다'가 어울리는 상황과 '뛰다'가 어울리는 상황이 좀 구분이 되는 것 같아서이다.

4.
결정적으로는,
"한 대 맞고 두 대 친다"
"햇볕도 안 들고 양지바른 곳"
"서양 갑옷이 묘하게 존재감 있는 이런 요가 교실은 싫어"

같은 명문장들에 대해서도 이건 부사어, 이건 관형어, 이건 서술절 등 문법 구조와 parse tree가 그려진다. 저런 대사가 예문으로 잔뜩 수록되어 있는 문법 책이 있다면, 저런 대사 패러디가 수록되어 있는 성경 만화만큼이나 행복할 것 같다. ㅋㅋㅋㅋㅋ

5.
우리말에서 '저지르다'는 뭔가 나쁜 일을 벌이고 사고를 친다는 뜻의 타동사이다. 저지른 대상을 목적으로 받는다.
영어로는 주로 commit에 대응한다. 다만, commit 자체는 '저지르다'보다 뜻이 훨씬 더 넓은 말이기 때문에 위임하는 것도 commit이고, 소스 코드를 저장소에다 반영하는 동작도 commit이라고 한다.

실수부터 시작해 살인, 간음, 반역, 폭력, -질, -짓, -죄, -악, 비리, 불효, 과오, 만행 등 거의 모든 나쁜 짓이 '저지르다'의 목적어가 될 수 있다.
그런데 이례적으로 '자살'을 저질렀다고는 안 한다. 그냥 '자살'을 한다고만 하지. 정작 영어로는 정확하게 commit suicide라고 하는데도 한국어에는 그에 정확하게 대응하는 표현이 없으니, 이는 특이한 면모가 아닐 수 없다. (뭐, 영어로도 suicide 자체만으로 '자살하다'라는 자동사가 될 수도 있긴 함)

내가 짐작하건대 한국어의 '저지르다'에는 "나쁜 짓을 하고도 당사자가 그 행위의 영향을 받지 않고 멀쩡하게 남아 있는 경우"라는 뉘앙스가 내포된 것 같다. 자살은 분명 나쁜 짓이지만, 당사자가 죽어 버린다는 점에서 다른 악행과는 차이가 있다.

6.
이 외에도, 한국어로는 컴퓨터 내지 인터넷에다가 바로 '하다'를 붙이지만, 영어는 do가 아닌 use가 쓰인다.
그러고 보니 한국어에는 운동 경기에다가도 '하다'를 붙이기 때문에 영어 직역투로 '축구를 논다' 이렇게 말하면 전형적인 번역투 비문이 된다. 실제로 한국어 배우는 영어권 사람이 초창기에 자주 저지르는 실수라고 함.
영어로는 산은 높다(high)고 표현하지만 건물은 마치 사람의 키처럼 tall이라고 표현한다.
open/close(열다, 닾다, 펴다, 덮다, 다물다, 감다...)라든가 wear(입다, 쓰다, 끼다, 신다...)의 표현 차이는 그야말로 판타지 수준.

같은 의미를 전달하더라도 단어와 단어가 결합하는 선호도는 언어에 따라 편차가 꽤 큼을 알 수 있다.
학부 시절엔 이런 생각은 혼자 머릿속에서나 해야 했는데, 여기 와서는 언어 현상에 대한 생각을 과 친구들이나 교수님과 마음껏 주고받을 수 있어서 참 좋다.
학부를 전산학 전공한 것도 후회 없고, 대학원으로 지금 과에 간 것도 잘 갔다.

Posted by 사무엘

2010/10/28 08:52 2010/10/28 08:52
,
Response
No Trackback , 12 Comments
RSS :
http://moogi.new21.org/tc/rss/response/399

Trackback URL : 이 글에는 트랙백을 보낼 수 없습니다

Comments List

  1. 김재주 2010/10/28 09:54 # M/D Reply Permalink

    김 기윤님 // 컴퓨터에게 인간의 말을 context적 측면을 포함시켜 완벽하게 이해시킬 수 있는 날이 온다면 그에 따라 언어간 번역기도 완벽해질 겁니다.


    달리 말해 그런 날은 최소한 근시일내에는 오지 않을 것이라는(...) 뜻이죠

  2. 주의사신 2010/10/28 10:14 # M/D Reply Permalink

    1. 영어권 사람이 한국어 발음 할 적에 자주 실수하는 것 중 하나는 '엄마'를 '어마'로 발음한다는 것입니다.

    같은 발음을 굳이 2번 안 한다는 것입니다.

    거기서 착안해 볼 때, '섬머'보다는 '서머'가 더 영어 발음스러운 느낌이 나는 것을 알 수 있습니다.


    2. 중국어에서 모른다는 '不知道'라고 씁니다. "뿌쯔따오"정도로 발음이 나는데, 생각해 보니 중국어에도 딱히 모른다를 한 단어로 표현하지 못하는 것 같습니다.

    위 단어를 우리 식대로 읽어 보면 뭔가 철학적인 느낌이 납니다.


    3. 철수, 영희, 홍길동이 왜 수능 문제나 교과서 등에서 쓸만한 이름 없으면 그냥 등장하는 이름이 되었는지 궁금합니다. 혹시 아시나요?

  3. 사무엘 2010/10/28 16:30 # M/D Reply Permalink

    김 기윤, 김재주: 전세계 언어의 공통적인 면모만 쏙 뽑아서 기계가 판독 가능한 intermediate(중간) 언어를 만들려는 시도를 그 똑똑한 전산학자, 언어학자들이 한 게 어제 오늘 일이 아니지만.. 호락호락 잘 되고 있지 않죠. 그만치 언어라는 건 신비로운 존재입니다.

    주의사신: 오홋, '모르다'가 존재하는 언어가 그리 흔치는 않은가 보군요.
    철수, 홍길동 같은 만만한 이름이라는 개념은 어느 언어에서나 편의를 위해 어느 정도 존재하지 않나 싶습니다. 영어만 해도 Jack, John 등 굉장히 발달해 있죠. ㅎㅎ 그래도 국어사전에 철수, 영희가 기재돼 있지는 않은데, 영한사전은 아예 well-known 이름들이 사전 등재까지 돼 있으니까요.

  4. 푸른·가람 2010/10/28 17:43 # M/D Reply Permalink

    푸르다 같은 경우, 사실 인지과학적으로 접근했을 때 이유가 보였던 걸로 알고있습니다. 서구권하고 동아시아권에 색을 구분하는 기준(?)이 달랐었거든요. 이 쪽에 대해서 관심이 가시면 뒤져보면 좋을겁니다. (라고 쓰고 까먹었습니다라고 읽으면...) 그게 몸에 있는 색을 구분하는 세포 등등하고도 관계가 꽤 깊었던걸로 기억하거든요.
    대강 서양의 언어에서는 파란색하고 초록색을 잘 구분 가능한 대신, xx색하고 yy색을 구분을 잘 못한다. 동양에서는 파란색하고 초록색을 잘 구분하지 않는 대신, xx색하고 yy색을 잘 구분한다. 그건 고대에 각각의 지역에 사는 사람들이 두 색을 잘 구분할 필요가 없었고, 그것이 언어 습관에 남은 것이다. 이런 식으로 설명을 들으면서 배웠었거든요. 카이스트에서 인지과학 수업 들은 후배가 있으면 잡고 흔들면 기억하는 사람 있지 싶습니다.

    사실 어원을 따라 올라가면 푸르다의 어원은 풀이고, 파랗다의 어원은 바다라고 합니다. 저는 아마 이 두 단어가 별도의 색을 구분하기 위해서 먼저 나왔었는데, 바다나 풀 중 하나밖에 없는 내륙지방에서 두 색을 구분할 필요가 딱히 없어서 표현이 섞인 것이라고 생각합니다.

    1. 사무엘 2010/10/29 01:27 # M/D Permalink

      이 블로그에서는 처음 뵙네요. 반갑습니다. ^^
      말씀하셨듯이 우리말의 색깔 체계가 아무 이유 없이 지금처럼 된 건 아닐 겁니다.
      우리말은 순수하게 색만을 나타내는 표현이 딱 3원색과 Black & White로만 구성되어 있는 게 인상적인데요,

      희다 / 하얗다
      검다 / 까맣다
      붉다 / 빨갛다
      누르다(press 아님) / 노랗다

      같은 바리에이션 쌍이 있습니다.
      푸르다 / 파랗다
      도 그런 맥락인 것 같습니다.

  5. 정 용태 2010/10/29 02:36 # M/D Reply Permalink

    그러고보니.. 일본어에도 단어자체로 "모르다"를 나타낸말이 바로 떠오르지 않네요..
    시루는 보고 듣고 배우거나 해서 알다,<-> 모르다(시라나이知らない)
    와카루는 이해하다, 이것도 바꿔보면 (와까라나이分からない)

    아.. 그리고 이런 주제의 글을 보니 길이만,시정곤,최숙희 저 "인간, 컴퓨터, 언어" 책을 아주 감명깊게 읽은 기억이 나네요 ^^

    1. 사무엘 2010/10/29 08:11 # M/D Permalink

      일본어까지 한 표 추가. ㄳㄳ
      시 정곤 교수는 카이스트에서 이 분야 선구자 중 한 분이죠.

  6. 다물 2010/10/29 14:42 # M/D Reply Permalink

    3번 신호등은 초록이라고 요즘 애들은 배운다고 들었습니다. 파란색이랑 초록색은 구분을 하는게 맞겠죠.

    1. 푸른·가람 2010/10/29 22:16 # M/D Permalink

      전 구분 안하는게 맞다고 봅니다. ㅜㅜ
      꿈이 없어요. 푸른 하늘과 푸른 바다, 푸른 숲에서 푸른 숲만 초록 숲으로…… 이런 느낌이거든요. 만약 꼭 바꿔야 한다 싶었다면, 초록불이 아니라 푸른불 같은 식으로 했으면 좋았을텐데 말입니다. 사전에서 綠을 찾아봐도 푸를 록이고요.

    2. 사무엘 2010/10/30 19:03 # M/D Permalink

      제 지론은 '푸르다'는 either green or blue. 아예 없앨 수는 없죠. 우리말과 우리 민족의 정서상 그건 남겨둘 필요가 있지만,
      '파랗다'만이라도 blue only로. 그 정도 구분은 필요하다고 생각해요.
      제가 국립 국어원장이 된다면.. 언어 정책 쪽으로 굉장한 독재를 생각하고 있습니다. ㄲㄲㄲㄲㄲ

  7. 다물 2010/10/31 22:01 # M/D Reply Permalink

    국어원장으로 그러려면 짤리지 않을까 생각이. 그냥 꼭대기로 올라가세요. 대통령은 임기 보장이니.

    1. 사무엘 2010/11/01 12:49 # M/D Permalink

      본격 정치계 데뷔. ㅋㅋㅋㅋ

Leave a comment
« Previous : 1 : ... 1862 : 1863 : 1864 : 1865 : 1866 : 1867 : 1868 : 1869 : 1870 : ... 2204 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

Site Stats

Total hits:
3042063
Today:
1690
Yesterday:
1700