« Previous : 1 : 2 : 3 : 4 : 5 : ... 13 : Next »

곧 있으면 한글날이기도 하니 오랜만에 이 주제로.. ^^
나는 표준어와 맞춤법, 띄어쓰기 규정을 숙지하고, 어지간해서는 이것들을 최대한 준수하면서 글을 쓴다.
가령, 다르다/틀리다, 안/않, 되/돼 같은 거야 이견의 여지가 없으니 당연히 무조건 구분한다.
하지만 내가 꼭 지키지 않거나 예외를 두는 요소들은 다음과 같다.

-- 순우리말 또는 우리식 한자 발음으로 성 1, 이름 2자 형태가 아닌 성명들은 띄어 쓴다. '윤봉길, 안중근, 김 구, 박 마리아, 남궁 억' (단, 여기 내 개인 블로그에서는 1:2 형태까지도 다 띄어 쓰고 있음)
-- 외래어 명칭 다음에 일반명사가 결합할 때도 띄어 쓴다.
백두산, 한라산, 한강, 흑묘백묘론, 불교, 유교
에베레스트 산, 후지 산, 마지노 선, 모기지 론, 양쯔 강, 나일 강, 라인 강, 이슬람 교, 힌두 교, 조로아스터 교

이건 글자 단위 붙여쓰기를 좋아하는 한자 패러다임에다가 단어 단위 띄어쓰기를 좋아하는 라틴 패러다임이 나중에 섞이면서 벌어지는 어쩔 수 없는 혼란이다.
그렇다고 한글을 몽땅 다 풀어 써 버리면서 완전히 후자대로 할 수는 없으니 전자와 후자를 적당히 절충해야만 한다. 잘 정의된 띄어쓰기는 특히 한글 전용 주장하는 사람이 영원히 풀어야 할 숙제이다.

옛날 사람들은 한자 혼용만 한 게 아니다. 같은 한글도 고유명사나 외래어를 별도의 폰트로 일일이 구분해서 표기할 정도로 세밀했다.
내 개인적으로는.. 필요하다면 이 어절이 체언-조사인지 용언-어미인지 엄밀히 구분하는 표기도 도입돼야 한다고 본다. '삶은 계란'이 계란의 상태를 말하는 건지 인생의 본질을 말하는 건지 기계적인 구분이 필요할 때 말이다.

-- 주요 행적이 20세기 중화민국· 현대 중국/대만 배경인 중국인은 현지음으로 이름 표기. 청나라나 그 이전 중국인은 한국식 한자음으로 표기.
-- 접사인지 관형어인지 긴가민가한 단어는 일일이 띄어 쓰지 않는다. '전세계' the whole world는 원래 '전 세계'가 맞다고는 하지만 개인적으로 붙여 쓰는 게 더 편하게 느껴진다.
-- '맞다'는 동사뿐만 아니라 형용사적 용례도 허용해야 할 것 같다. 유사 단어인 '걸맞다', '알맞다'는 다 형용사이지만.
-- "강하고 담대하라" 역시 비문이 아니라 좀 허용해야 할 것 같다. 저게 잘못됐으면 "내가 거룩하니 너희도 거룩하라" 알아듣는 데 아무 지장 없는 이런 선언도 틀리게 된다. '거룩하다'도 동사가 절대 아니고 '거북하다'와 동급인 형용사인데?
우리말이 용언이 정말 애매하고 므흣한 품사통용 면모가 있다.

-- "잘 되길 바래".. 이것도 원래는 '바라'가 맞는데.. 아무도 그렇게 안 쓴다. 사실상 특례가 주어져야 하지 않을지? "바랬다"는 "바랐다"로 고쳐야겠지만, 저 종결어미는... 글쎄다.
-- 'S+모음' 외래어를 그냥 외래어로 쎄게 적는 편이다. 씬(scene), 쏘리(sorry), 싸인파(sine), 싸인(autograph). 이럴 때 신, 소리, 사인은 얼마나 뜬금없게 보이는가.
현대차에서도 소나타를 쏘나타로 괜히 바꾼 게 아니다. ㄲㄲㄲ

-- 개인적으로는 '처' 대신 '쳐'라고 쓰는 걸 아주 선호한다. "이거나 쳐먹어", "창고에 쳐박혀 있는 물건", "잠이나 쳐 자?", "저 사람 쳐 돌았구만" 등등 ㅋㅋㅋㅋㅋ
-- 몇몇 접사 내지 의존명사는 '깜, 꽈, 짜' 이렇게 된소리로 쓰고 싶다.

지난 1988년 한글 맞춤법 개정 때는 한자어의 음을 한글로 표기하는 방식이 단순화됐다.
실제 발음 때 들어가는 사이소리를 무시하고, 언제나 원래 한자음만 적는 걸로 바뀌었다.
숫자, 곳간, 셋방, 횟수 같은 6개 예외만 인정하고 나머지는 ㅅ을 뺀다. 촛점이 아니라 초점, 갯수도 아니고 개수..

저 쌍팔년도 시절에는 말에 된소리 거센소리가 늘어나면 사람 심성이 거칠어진다(!!!!!!) 이런 풍조가 강했다.
햇님이 아니고 해님.. 효과는 효꽈가 아니라 반드시 '효과' 그대로. 김밥도 김빱이 아니라 '김밥' 그대로..
그러니 사이소리는 말을 쓸데없이 쎄게 만드는(!!) 원흉이니, 표기에 더욱 반영되지 않고 무시됐다.

하지만 이 사이소리는 불필요하게 들어가는 게 아니라 동음이의어 구분이나 어원 구분, 형태소 경계 구분 같은 여러 역할도 한다.
여러 예가 있지만 하나만.. 내 개인적으로는 prime number를 뜻하는 '솟수'까지 '소수'라고 바꾼 건 잘못된 조치였다고 본다. '소수'는 안 그래도 뜻이 겹치는 동음이의어가 많은데 말이다.

개드립을 좀 치자면.. 표준어 제정한 사람들이 모두 문과 출신밖에 없어서 저렇게 된 게 아닐까? =_=;;;; 문송합니다 -_-;;
'솟수'라고 예외를 추가로 인정하거나, 아니면 씨수, 핵심수, 으뜸수 등.. 완전히 다른 말을 그때 새로 만들어서 학교에 보급했어야 했다. 그리고 대가도 뭐냐. 댓가라고 해 줘야지.

나는 뭐 인터넷이나 스마트폰 이런 말을 순화하느니 그럴 게 아니라, '장' page / chapter 같은 기본적인 말부터 순우리말 대체제를 만들어야 한다고 생각한다.
말로 들어서 변별이 안 되는 거를 한자로 표기해 봤자 근본적인 문제 해결이 되지 않는다.

그래도 그나마 다행인 건, 이 프라임 '소수'라는 건 정수론에서 다루는 개념이기 때문에 '소수점' 따위하고는 영역이 겹칠 일이 없다는 것이다. 그 소수하고는 혼동될 일이 없다.
하지만.. 소수의 반의어가 합성수도 될 수 있고, 다수도 될 수 있으니.. 꺼림칙하다는 사실 자체는 변하지 않는다.

이상이다.
말이 나왔으니 말인데..
그러고 보니 지난 1990년대 이래로 지금까지 국내에서 30년 가까이 한글 맞춤법 검사기 내지 형태소 분석기 외길을 파 온 연구실은 다음과 같다. 이분들 2020년대 기준으로는 은퇴가 거의 임박했거나 이미 은퇴했다.

  • 부산대 권 혁철 교수: 아래아한글의 맞춤법 검사기
  • 한국외대 유 재원 교수: 마소 Word 한글판의 맞춤법 검사기
  • 항공대 이 긍해 교수: 두벌식 기반 한-영 자동 전환 오토마타를 개발했다.
  • 국민대 강 승식 교수: 초창기 한국어 형태소 분석기의 원조가 아니었나 싶다.
  • 울산대 옥 철영 교수: 형태소 분석기의 떠오르는 강자이다.

아래아한글의 맞춤법 검사기는 오랫동안 개발돼 왔고 퀄리티가 좋은 편이지만, 2000년대 이후부터는 단순히 학교 문법뿐만 아니라 민간 국어 운동 이념이 들어간 판정도 많이 하고 있어서 약간 논란거리이다.
가령, 그냥 맞춤법· 오타를 지적하라고 돌리는 검사기에서 "일제시대가 아니라 일제강점기라고 써야 맞습니다"...;; 이런 것까지 굳이 지적할 필요가 있을까..?? 이런 식이다.

꼭 맞춤법 검사가 아니더라도 개인적으로 한국어· 한글 정보 처리 분야에서 꼭 필요하다고 생각하는 기능은 다음과 같다.

-- 띄어쓰기를 재구성하기. 하나도 띄어 쓰지 않았거나, 임의로 줄이 바뀌면서 어절 경계 정보가 소실된--특히 pdf나 ocr에서 긁어 온-- 텍스트의 문장을 원래대로 재구성하기
(영문도 대소문자나 하이픈 관련해서 휴리스틱이 필요한 처리가 있긴 하다. 하지만 그건 한국어보다는 훨씬 더 간단하다.)
-- 텍스트를 쭉 읽으면서 한자어는 몽땅 한자로 바꿔 주기. 당연히 헷갈리기 쉬운 한자를 틀리지 말아야 한다.
-- 텍스트를 이대로 읽을 때, 쓰여 있는 대로 곧이곧대로 발음되지 않는 부분에 대해 토 달기 (긴소리, 사이소리, 말음 법칙, ㅢ의 발음 따위)

Posted by 사무엘

2024/10/06 19:35 2024/10/06 19:35
, , ,
Response
No Trackback , 2 Comments
RSS :
http://moogi.new21.org/tc/rss/response/2350

우리가 매체에서 접하는 옛날 풍경 모습이란 게 한때는 그냥 사람이 붓에다 물감 찍어서 그린 그림이 전부였다.
그러다가 그게 흑백 사진을 거쳐서 컬러 사진으로 바뀌었는데, 이제는 애초에 흑백 사진밖에 전해지는 게 없던 장면조차 컬러로 재구성된 게 늘고 있다.
컬러이더라도 화질이 안 좋았던 것을 리마스터링까지 한다. 이런 건 소실된 색/화소 정보를 AI의 힘으로 창작해서 복원한 것이다.

AI는 완전히 생판 무에서 유를 창조할 정도로 혁명적인 일은 절대 못 한다.
뭔가 패턴이 있고 생노가다 같긴 하지만, 진짜 노가다보다는 미묘하게 복잡하고 전문성과 창의성(?)이 필요해서 자동화가 안 되고 인력 수작업이 필요했던 일들.. 그러면서 법적 책임과 부담감이 크지는 않은 일.
AI는 딱 그런 업종을 0순위로 잠식할 것으로 보인다.

(1) 음악: 없는 곡을 AI가 작곡도 하는 세상인데, 기존 악보 멜로디를 읽고서 E G Fm 등 코드를 매긴다거나 반주를 넣는 건(편곡) 당연히 자동화될 것이다. 이것도 답이 한 가지만 있는 게 아니기 때문에 곡에 대한 해석과 창작이라는 범주에 든다!
코드를 만에 하나 좀 이상하게 넣었다고 해서 당장 인명· 재산 손실이 발생하는 것도 아니고.. AI화하기에 딱 좋아 보인다.

(2) 폰트: 한 폰트 패밀리로부터 다양한 굵기 내지 이탤릭 바리에이션을 자동 생성하기. 윤곽선을 단순히 기계적으로 산술적으로 부풀리기만 하는 게 아니라, 그로 인한 세밀한 공간 배치를 인간이 보기 좋게 알아서 하는 것 말이다. 힌팅을 더 똑똑하고 정교하게 생성하는 것도 포함이다.
그리고 한글· 한자의 경우, 샘플 몇 글자만 넣어 주면 그로부터 규칙성을 파악해서 나머지 수천 자의 글자 모양까지 알아서 유추해서 자형 생성하기.

AI는 한글· 한자에 대해서도 알파벳처럼 폰트들이 엄청 많이 넘치도록 개발되게 도와줄 것이다. 한글· 한자가 글자수가 수천 자나 된다고 해서 진짜로 문자로서 자형의 절대적인 정보량? 엔트로피가 알파벳의 수백 배 이상인 건 아니다. '가각간갇'이 무슨 알파벳의 ABCD 급으로 서로 완전히 다른 건 아니기 때문이다.

옛날엔.. 알파벳은 글자 수가 적어서 폰트도 크기가 작고 쉽게 만들 수 있는 반면.. 한글 한자는 너무 무겁고 뚱뚱하고 컴퓨터 자원도 많이 차지한다고.. 이러니 동양이 서양보다 국가 경쟁력이 떨어지고 열등하고 도태할 수밖에 없다는 식으로 극단적으로 생각하는 정서가 있었다. 100여 년 전, 공 병우니 최 현배니 하던 시절엔 기계식 타자기만 갖고도 문자의 우열이 비교될 지경이었으니 말이다.

지금은 그 정도로 강박관념을 가질 필요는 없다. 컴퓨터 자원이야 풍부해서 넘쳐나고, AI가 사람으로 하여금 진짜로 본질적으로 창의성이 필요한 작업만 하면 되게 나머지를 보조해 줄 것이기 때문이다.
다만.. 인간이 이런 AI를 만들기 위한 연구 개발은(코딩, 수학식, 논문 등)... 알파벳처럼 원초적으로 가볍고 취급하기 쉬운 tier 1급 문자로 행해졌음이 부정할 수 없는 사실이다.

(3) 코드 정적분석: 재래식 알고리즘만으로는 컴퓨터 프로그램을 정적분석만으로 실행 결과를 100% 정확하게 예측하고 논리 결함을 찾아내는 게 불가능하다. 그 이상부터는 그냥 휴리스틱/AI의 영역으로 갈 수밖에 없다.
그리고 코드뿐만 아니라 주석에 적힌 자연어 문구도 의미를 파악해서 "이거는 시스템 정보나 패스워드가 하드코딩된 거 아냐?" 같은 것도 정적분석이 찾아낼 수 있다. AI는 재래식 정적분석 툴의 쓸데없는 오탐들을 줄이는 데 기여할 수 있다.

(4) 그 밖에 이런 AI 기술로 내 생각엔 인쇄된 글자 모양을 보고 그냥 OCR을 하는 게 아니라 이게 무슨 폰트인지를 알아맞힌다거나, (산돌, 윤~~ ㅋㅋㅋ) 거대한 인파 사진을 보고 여기 사람 머리가 몇 개인지 카운트 하는 것.. 아 이건 딥러닝 AI까지는 아니라 그냥 컴퓨터 비전이려나.. 이런 기술이 개발되면 일상생활에 도움이 될 것 같다.

(5) 그리고 식당· 카페의 무인 키오스크가 아예 커맨드라인 콘솔이 도입될 게 아니라면 진짜 사람 말을 빨랑빨랑 알아들었으면 좋겠다. 지금 터치스크린 인터페이스는 너무 느리고 답답한 반면, 단순 주문 접수는 지금 정도의 NLP로도 그렇게 어렵지 않을 테니 말이다. 확실히 AI 덕분에 단순 안내 데스크나 전화 상담 직원은 많이 없어질 것 같다.

다만, AI는 저렇게 창의성이 필요한 분야, 참고· 보조용 도구로서 강세이다. 법적 책임까지 수반되는 분야에 진입하는 건 많이 더디지 싶다. 그래서 의료 법조 쪽은 그냥 자문· 상담부터 시작할 것으로 보이며, 자동차의 완전 자율주행은 아직 갈 길이 멀어 보인다.

* 철도는 통제가 너무 잘 된 환경이니 AI 없이 재래식(?) 로직만으로 이미 무인 자동운전이 가능할 지경이다. 차량 번호판 숫자나 QR코드를 인식하는 것과 비슷한 수준이다. (이 정도로 잘 통제된 이미지의 인식은 AI가 아니라 그냥 통상적인 컴퓨터 비전 분야..)
그러니 자동차와 철도의 중간 난이도인 비행기나 선박의 운항에 AI 기반의 자동 운항이 먼저 파고들지 않을까 싶다. 허나, 승객 수백 명이 타는 여객기에 무인까지는 아니어도 부기장이 없어지고 1인 조종이 가능해질지는 과연..?? 저비용 항공사에서 작은 기종부터 1인 조종을 시킬 수는 있겠다.

* 미용· 이발은 굳이 AI화 자동화하자면 못 할 건 없지만.. 굳이 그럴 필요가 없다고 여겨진다. 사람이 직접 가위 들고 사람 머리 깎는 건 가까운 미래에도 변함없을 것 같다. ㄲㄲㄲㄲㄲㄲ

* 빌 게이츠는 무려 25~30년 전부터 제품에다가 자연어를 알아듣는 AI 비서? 에이전트를 넣으려고 애썼던 사람이다.
마소 Bob이라든가 Office 길잡이..;;는 좀 무리한 흑역사였긴 하지만.. 반대로 저 아저씨가 시대를 앞서간 시도를 한 거라고 볼 수도 있다. 그런 귀요미를 겨우 램 16MB, 150MHz짜리 펜티엄 컴터에다 집어넣으려 했으니 욕 먹었던 거지..;; 현실의 기술이 아이디어를 뒷받침하지 못했다.

* 미국 말고 의외로.. 중국이 2010년대 이후부터 머신러닝, 언어모델 쪽 연구를 많이 하는 것 같다. 외국의 최신 논문을 찾아 보면 중국 사람 이름이 엄청 많이 보인다.
그런데 중국은 그런 첨단 AI 기술을 이용해서 인터넷의 불온 컨텐츠를 검열하고 인민들 행동패턴을 감시하는 데도 적극 활용한다는 게 함정....

지난 1990년대 중반까지 기계번역 프로그램이 잠깐 나오다가 유행이 식은 적이 있었다. 일한이라면 모를까 영한은 이거 뭐 도저히 실용적인 결과가 나오지 않았기 때문이다. 하물며 한영은.. 난 지구가 멸망할 때까지 절대 개발되지 못할 거라고 생각했었다.
그런데 인공신경망 기반 AI로 언어 장벽이 이 정도까지 무너지고 낮아진 건 참으로 놀라운 일이다.

물론 무슨 기업간 회의나 대통령 연설, UN 컨퍼런스를 기계번역으로 때워도 되는 건 아니지만, 일상적으로 뭔 말인지 내용 파악하는 용도로는 기계번역이 정말 쓸 만해졌다.
게다가 이게 텍스트를 읽는 것에만 국한되지 않는다. waveform 형태의 말소리를 받아 적은 transcript를 생성하고 그걸 번역까지 하다니.. 유튜브에서 자기 동영상의 음성에서 자막을 아주 정확하게 실시간 생성해 주는 것만 해도 신기하기 그지없다.

암호 해독을 위해 언어학자가 아니라 수학자가 필요한 시대는 이미 20세기 중후반에 찾아왔다. 이제는 기계번역이나 자연어 처리 영역도 언어학자가 아니라 수학자와 데이터 과학자의 차지가 됐다.
2020년대가 되니 인간이 달이나 화성이나 해저에 기지를 만드는 건 전혀 가망이 없고, 그 대신 쌍팔년도 SF에서 거의 상상하지 못했던 스마트폰과 유튜브가 대세가 됐다. 그래서 카폰이라는 게 완전히 사라졌고, 무전기는 군· 경· 소방 같은 특수 직종에서나 쓰이는 물건이 된 거다. 뭐, 언어 자동 통번역기는.. 그 시절에도 상상은 했었고 얼추 실현돼 간다.

머신러닝에서 모델이라는 건 코드와 데이터의 성격을 모두 지니고 경계가 참 애매한 것 같다. =_=;; 물론 순수하게 데이터에 속하는 건 훈련용으로 먹이는 텍스트나 그림들이겠지만 저런 신경망 자체도 머신러닝 라이브러리 코드의 관점에서는 데이터일 것이다.
그리고 훈련시키는 건 뭔가 압축하는 것과 비슷하고, 이를 바탕으로 현실의 문제를 풀이하는 건(추론) 압축을 푸는 것과 비슷해 보인다.

이런 AI는 참 엄청나고 대단하긴 하지만.. 공짜로 평범한 계산량으로 돌아가는 물건이 아니다. AI를 돌리기 위해 동원되는 컴퓨팅 자원을 보면 정말 억소리 난다.
chatGPT가 저렇게 답을 '즉시' 뱉어내기 위해서 지구 반대편에서는 상상을 초월하는 고성능 슈퍼컴이 전기를 있는 대로 잡아먹고 열을 펑펑 내뿜으며 돌아가야 한다. 살인적인 분량의 신경망 연산이 행해지기 때문이다. 저기 서버가 하루 유지 비용이 원화로 몇 억? 몇십 억이니 그런다. 이때 컴퓨터 내부의 신경망 상태는 상상을 초월하게 너무 복잡하기 때문에 훈련이나 추론 과정의 추적이 도저히 불가능할 지경이다.

인간은 오랫동안 절대 불가능하다고 여겨졌던 유인 달 착륙과 귀환을 몇 차례 성공하긴 했다. 그러나 그건 정말 위험하고 어렵고 힘들고 비싸게 가까스로 해낸 것이었다. 민간인의 대중적인 달 여행이라든가 달· 화성 기지로 이어지는 건 지금 관점에서도 가까운 미래엔 요원하다.

그리고 AI의 발달 추세에도 이런 우주 개발과 비슷한 면모가 있는 것 같다. 과거에 불가능하다고 생각했던 자연어 처리가 가능해지기는 했지만.. 그걸 가능케 하는 컴퓨팅 환경이 저 우주 로켓 같은 물건이라는 거다. 물론 컴퓨터 업계도 가만히 앉아서 손가락만 빠는 건 아니니.. 그 연산에 특화된 CPU를 만들어 간다.

30여 년 전, 486이니 펜티엄이니 하던 시절엔 멀티미디어 지원이 컴터 업계의 최대 관심사였던 것 기억하시는가?
크게 (1) 동영상 아니면 (2) 게임용 3D 그래픽 실시간 렌더링이라는 두 분야이다.
하긴 그 시절엔 MPEG 동영상을 감상하기 위해서 전용 카드를 꽂네 마네 했던 것 같다. 요즘은 재생이 아니라 컴터 화면을 실시간으로 녹화하고 인코딩할 때에나 전용 카드가 필요한 듯하다.

나중에는 엄청난 물량을 자랑하는 멀티미디어 연산에 특화된 명령이 CPU에 추가되고, GPU라는 건 그래픽 가속기라는 이름으로 도입되곤 했었다.
그랬는데 이제는 단순 그래픽 처리를 넘어 머신러닝 신경망 연산에 특화된 CPU가 대세이다. 당연히 서버에 접속해서 API를 호출해서 구현된 거라고 생각한 통· 번역이 핸드폰에서 비행기 모드까지 켰는데도 동작한다는 게 정말 신기하다.

저런 컴퓨터에 비해 인간의 두뇌는? 환경에 끼치는 부작용이 없고 당분 몇 스푼만 공급해 주면 한 나절을 거뜬히 돌아간다.
물론 두뇌와 컴퓨터가 서로 비교 가능한 존재는 아니지만 어떤 면에서는 생체라는 게 참 경이롭다. 두뇌와 컴퓨터는 다리와 바퀴가 다른 것만큼이나 다른 건지도 모른다.

그러고 보니 우리나라의 이스트소프트는 맨 처음 1990년대엔 21세기 워드라는 평범한(?) 업무용 프로그램을 만들었다가 알툴즈로 명성 내지 악명을 떨쳤고.. 그러다가 게임이 더 돈 된다고 생각했던지 '카발'이라는 온라인 게임을 만들었고 지금 와서는 AI 기업을 표방하고 있다. (게임과 AI 모두 GPU가 쓰인다는 공통점이..)
각각의 제품들이 어떤 평을 받는지에 대해서는 논란의 여지가 있지만, 어쨌든 시류를 따라 참 다양한 분야를 개척하면서 생존하려고 애쓴다는 것 하나는 확실해 보인다.

Posted by 사무엘

2024/06/22 08:35 2024/06/22 08:35
, , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2311

병원이 1차(동네의원) 2차 3차(대학병원급)로 나뉘고, 재판소(법원)가 지방-고등-대 3계층으로 나뉘고..
금융기관도 제1 제2 제3(사채)으로 급이 나뉘고..
냉전 시절에 세계 나라들이 제1(자유진영), 제2(공산권), 제3(나머지 신흥 독립/중립국)으로 나뉘었다.

그런 것처럼 좀 뜬금없지만 세계 문자들을 얼추 3개 그룹으로 나눌 수 있겠다.

1.
제1군은 형태가 제일 단순한 풀어쓰기 음소문자들이다. 서양의 라틴 알파벳, 러시아 키릴, 그리스 문자 따위.
기계화하기에 제일 유리하다. 기계식 수동 타자기는 말할 것도 없고, 컴퓨터 기준으로도 1980년대 8비트 PC의 메모리와 속도, 디스플레이 해상도로도 모두 거뜬히 구현 가능했다. 극악의 저해상도 8*8 픽셀 블록으로도 표현 가능할 정도니까.

한글 풀어쓰기라든가 반각 가타카나는 더 복잡한 자국 문자를 최소한으로 변형해서 제1군처럼 처리하려 노력했던 흔적이다.
세벌식 쌍초점 타자기(+ 직결식 폰트)는.. 한글을 외형상 모아쓰기를 유지하면서 제1군처럼 처리하는 굉장히 획기적인 방법론을 구현했다.

2.
다음으로 제2군은 동아시아 한중일의 소위 '2바이트 문자'에 속하는 한글, 가나, 한자 같은 문자들이다.
제1군 문자보다 훨씬 더 뚱뚱해서 전/반각 구분이 필요하고, 실용적인 수준의 문자 집합 크기도 수천 자에 달한다. 문자의 크기 대비 디스플레이 해상도, 컴의 메모리와 속도, 입출력 오버헤드 등을 감안했을 때 8비트 컴으로는 감당이 안 되고 최소 '16비트' 정도는 필요하다. 입력을 위해 IME라는 소프트웨어 계층이 필요하다.

내 한글 입력기는 이런 고민 과정에서 개발이 시작됐다.
우리나라 자국 문자는 1군이 아니라 2군에 속하는데? 대문자나 바리에이션 문자가 없는 대신에 모아쓰기가 특징인데?
그렇다면 이 특성을 그저 "부담, 오버헤드, 짐, 단점이 아니라 개성과 특징, 장점으로 살릴 수 없을까..?"

컴퓨터라는 기계가 존재하고 한글이라는 문자가 존재한다면 그 사이에서 생각할 수 있는 미친짓은 다 할 수 있는 소프트웨어 기반을 만들었다. 최소한, 아이디어가 있는데 그걸 구현할 수 있는 프로그램이 없어서 못 쓴다는 말은 안 나오게 말이다.

왜 일본에서 무슨 영상물이나 물건 만든 걸 보면.. 장인정신에 창의적인 걸 넘어서 혀를 내두를 정도로 '쓸데없이 고퀄리티'스러운 게 많다.
"걔네들이 자국 문자가 한글이었다면 그 정신머리 근성으로 이런 입력기 정도 만들었을 것이다~~" 난 이걸 염두에 두고 프로그램을 만들었다. 근데 그런 짓을 현실의 일본인이 하지는 않을 테니까 한국인이 해야지.

(내 프로그램에서 제공하는 한글 입력 예제 중에는 일본인이 고안한 것도 하나 수록돼 있다. ㄱ+ㅏ+ㅏ로 '까'를 만드는 특이한 방식...)

  • 그런 기술 기반 위에서 공평하게 오덕질을 하다 보면 “세벌식이 잉여질 오덕질할 게 더 많고 활용 범위도 더 넓다는 게 입증된다. 초성 종성 구분하고 동기화할 골머리 대신, 초성 종성 병렬화가 가능하다~
  • 타자기에서 컴퓨터에서 바뀌었다고 두벌 세벌 차이가 없는 게 아니다.. 이것도 입증된다.
  • 기왕 1군이 아니라 2군에서 판을 짤 거면 이렇게 놀아야 문자 차원의 경쟁력이 선다..

이게 20년 전이나 지금이나 변함없는 내 지론이다. ^^

3.
그리고 끝으로 제3군은 뭐.. 제1군은 물론이고 제2군보다도 더 복잡한 로직이 동반돼야 입출력 가능한 문자이다. 이른바 complex script.
아무래도 8비트, 16비트를 넘어 32비트 이후의 컴터 시대가 돼서야 제대로 표현 가능해졌다.

  • 문자의 정보량이랑, 화면에 보이는 글자 수· 길이 사이에 개연성이 전혀 없다던가. -_-;;
  • 같은 문자가 앞뒤 글자가 무엇이냐에 따라서 형태가 막 달라진다던가..
  • 글자를 하나 찍고 끝이 아니라 뭐가 덕지덕지 바리에이션이 많다던가..
  • 유니코드의 등장 이전엔 애초에 코드값이 부여조차 되지 않았던가..

아랍, 태국, 베트남 문자가 이런 3군까지 간다. 텍스트 에디터를 만들어서 블록이나 cursor 이동을 구현하는 것도 훨씬 더 어렵다.
아까 제2군은 각각의 글자가 복잡하고 무거워서 1군보다 처리하기 까다로웠을 뿐, 3군 같은 형태의 난해함· 복잡함은 없다는 걸 생각해 보자.

라틴 알파벳은 아주 특이하게 날려 쓴 필기체를 구현할 때에 폰트에 한해서나 이런 기술이 필요하다.
한글은 옛한글까지 생각하자면 일부 기술이 3군까지 내려간다.

한글 기계화 카테고리에 거의 5년 만에 새 글이구나.. ㅡ,.ㅡ;;
자고로 문자는 그림보다는 숫자에 더 가까운 형태로 만드는 게 처리하기 더 용이할 것이다. 암호학을 생각해 보시길.. 문자를 숫자처럼 취급하지 않으면 정보이론이라든가 암호학이란 게 존재할 수 없다.

Posted by 사무엘

2024/04/17 08:35 2024/04/17 08:35
,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2287

1. 단모음 A와 O

라틴 알파벳에서 A와 O는 통상적으로 ㅏ, ㅗ 음가에 대응하는 것으로 여겨진다. 독일도 그렇고, 또 영어의 종주국인 영국도 그런 편이다.
하지만 영어를 사용하는 실질적인 최대강국인 미국에서는 이들 발음이 변해 버려서 비영어권 국가에서 외래어의 표기에 많은 혼란을 주고 있다.

걔네들은 ㅏ, ㅗ이던 것이 ㅐ, ㅏ로 변해 버렸다. 그러고 보니 U도 ㅜ냐 ㅓ냐 갖고 굉장히 오락가락하네.. 모음삼각도로 표현하자면, 다들 시계 방향으로 살짝 회전해 버린 것 같다. 안 변한 건 I(ㅣ)와 E(ㅔ)뿐이다.

그래서 톰이냐 탐이냐.. 도트냐 닷이냐도 헷갈리고, 할로윈이냐 핼러윈이냐도 헷갈린다. shop도 쇼핑, 워크샵/워크숍, 포토샵 등이 매우 혼란스럽다.
일본에서는 단모음 A는 일편단심으로 ㅏ로만 적고 있다. 그래서 패밀리는 그냥 파미리이고, 애니메이션도 아니메이다. 그러니 쟤들은 ㅏ와 ㅐ가 구분이 잘 안되겠지만 우리말에서는 A와 E, 즉 ㅐ와 ㅔ가 구분이 안 돼서 문제이다.
우리나라는 미국 스타일로 음차하려는 경향이 있지만, 일본은 서양 문물을 받아들인 시기가 굉장히 일러서 그런지 영국· 독일의 보수적인 스타일을 여전히 고수하는 것 같다.

그래서 '아이패드'(pad)는 일본어로 '아이팟또 アイパット'인데.. '아이팟'(pod)은 '아이포또 アイポ-ト'라고 한다.
A와 O의 발음 괴리의 직격타를 제대로 맞았다. ㄲㄲㄲㄲ

영어의 이런 발음 변화는 영어 자신의 관점에서도 별로 좋은 현상이 아니다. 스펠링과 발음이 심하게 따로 노는 언어가 돼 버렸기 때문이다. 하지만 그것만 빼면 영어 정도면 다른 언어들에 비해 문법이 단순하고 배우기 쉬운 축에 드는 것 같다.
영어 정도의 과거형 불규칙이나 복수형 불규칙 난이도가.. 설마 한국어의 미친 높임법과 호칭, 용언 불규칙 활용 난이도에 비하겠는가? =_= 라틴어나 러시아어, 독일어의 미친 굴절에 비할 수준이겠는가? 그럴 리가 없기 때문이다.

우리말은 한때는 ㅏ와 ㅓ가 다른 것만큼이나 ㅐ와 ㅔ가 달랐던 적이 있긴 한 것 같은데 말이다.. 근데 어쩌다 '내'와 '네' 1인칭과 2인칭 대명사가 구분되지 않는 난장판이 돼 버렸을까?
이건 심각한 문제이다. 그러니 '네'가 현실에서는 '너'나 '니'로 불안하게 자꾸 바뀌는 것이다. 한국어를 공부하는 외국인 학습자의 입장에서도 아주 보기 좋지 않다.
아울러, '날다'의 활용형이 '나는'이 돼 버려서 I am과 겹치는 것도 영 보기 좋지 않다. '날으는'을 무작정 비표준으로 치부하고 금지하기가 곤란한 노릇이다.

2. 한자어처럼 생긴 외래어

바지 선(barge), 바자 회(bazaar), 마지노 선(프랑스의 지명 Maginot), 지로 용지(giro), 모기지 론(mortgage loan), 비박(Biwak)...;;

이런 것들은 한자어가 전혀 아니다. 특히 모기지 론은 '론'조차도 論이 절대 아니고 loan일 뿐이다. 마지노 선이 마지+노선(路線)이 아니듯이 말이다.
'비박'의 경우는 무려 독일어 일반명사이고, 사실은 우리말로도 '비바크'라고 표기해야 맞다. 숙박 泊하고는 전혀 관계 없다.

이래서 옛날에는 사람들이 표기를 더 꼼꼼하게 하려 애썼던 것 같다. 국한문 혼용은 말할 것도 없고, 인명 지명 같은 고유명사나 심지어 외래어는 폰트(서체)를 달리해서 표기해 놨다.
한글에다가 한자의 획 모양을 접목해서 날카로운 느낌을 주는 '순명조'라는 서체 말이다. 이게 옛날 동화책이나 교과서에서는 외래어를 표기하는 서체였다.

난 한자 혼용까지는 너무 오바이다만, 그 대신 개인적으로는 성 이름을 띄어 쓰는 것, 그리고 외래어 고유명사 뒤에 붙는 명사는 띄어 쓰는 것에 지지 소신이다. 이것까지 안 하면 구분이 너무 안 되는 것 같다.
태산, 백두산, 일본어, 평화선
에베레스트 산, 나일 강, 후지 산, 산스크리트 어, 마지노 선

3. 표기 수단

일본어는 변별 가능한 음운이 부족해서 그런지, 장단(긴/짧은)이라도 한국어보다 훨씬 더 엄격하게 구분하려는 것 같다. 그래서 대놓고 길쭉한 가로줄이 장음 부호로 쓰인다. 같은 소리라도 이게 있느냐 없느냐에 따라 의미가 완전히 달라진다.

서양의 알파벳 기반 정서법에서는 짤막한 가로줄(하이픈)이 (1) 정도가 좀 약한 띄어쓰기, (2) 긴 단어를 앞뒤 줄에 걸쳐서 열거하는 용도로 쓰이니 이와 좋은 대조를 이루는 것 같다.
그러고 보니 서양 정서법에서는 일본어의 장음 부호 같은 긴 가로줄은.. 음운 계층에서의 장음이 아니라 우리 식으로 치면 ‘줄표’.. 문장 단위에서 뜸을 들이는 걸 나타낸다. 음운 계층에서의 장음은 그냥 글자를 aa ee ei 늘어놓는 식으로 해결하니 말이다.

문자에 대해 더 생각해 보자면.. 라틴 알파벳은 대소문자 구분이 있어서 문자 용도에서 수직적인 상하 계층을 만든다. 고유명사나 이니셜을 대문자로 쓴다.
일본어는 히라가나-가타카나 구분이 있어서 수평적인 역할 구분을 형성한다. 잘 알다시피 외래어나 의성어가 가타카나로 표기된다. 알파벳으로 치면 이탤릭에 얼추 대응할 듯?

한글은 글자 차원에서는 초중종성을 모아서 스스로 굉장히 잘 완성된 형태를 형성한다. 한국어 역시 일본어보다는 음운이 풍부하고 또 복잡한 훈독이 없으니, 자국 모아쓰기 표음문자만 닥치고 늘어놓는 ‘전용’을 하는 방향으로 정서법이 깔끔하게 정착했다.

그게 대체로 좋긴 하지만, 그래도 장단을 표기에 너무 반영을 안 하다 보니 길고 짧음의 구분이 한국어에서 통째로 소멸하는 것 같아 아쉽다. 그런데 한글은 그 상태로 완성도가 너무 높기 때문에-_- 추가적인 계층을 만들 여지도 별로 없는 것 같다. 그 이상 글자의 형태를 구분하는 건 폰트의 영역으로 가야 할 듯..

필요한 경우, (1) 장음/단음이나 (2) 사이소리 정도는 기호 차원에서 표현할 방법이 꼭 있어야 할 것 같다. 이건 음운 차원이고..
더 욕심을 내자면 평소에는 붙이지만 필요에 따라 체언-조사 내지 용언-어미를 구분하는 마크, 이 명칭이 외래어나 고유명사임을 나타내는 마크, 이 어절이 체언인지 용언인지를 나타내는 마크 같은 것도 좀 있었으면 좋겠다. 가운뎃점은 일본에서 유래된 건지 모르겠다만.. 콤마보다 더 크거나(세미콜론) 작은(가운뎃점) 보조 구분자도 반드시 필요해 보인다..

4. 나머지

(1) 영어권에서는 글자를 읽을 때 같은 글자가 연속해서 나올 때 double/triple로 더 즐겨 대체하는 성향이 있다.
C++ C double plus / 007 double O seven / www triple W
우리말 "씨뿔뿔, 공공칠, 더블류더블류더블류"와 비교해 보자. =_=;;

(2) 베트남 - 비엣남, 베토벤 - 베트호픈, 맥아더 - 매카서..
뭔가 대놓고 독일식 같지는 않은데 실제 발음과 미묘하게 동떨어진 외래어 표기가 좀 있는 것 같다.
한국어와 영어의 음절 구분 방식이 다른 것도 있고, 옛날에는 실제 발음보다는 스펠링 형태를 더 고려해서 한글 표기를 정했던 것도 있다.
하지만 이미 굳어지고 정착해 버린 건 어쩔 수 없다 치는데.. 하루아침에 터키 대신 튀르키예는 너무 뜬금없고 좀 문화 충격까지 느껴졌다. =_=;; 스페인 - 에스파냐도 아니고 이건 뭐..

(3) 메시지 - 마사지 - 소시지~~ 음운 형태가 비슷한 단어들이다.
'메세지'라고 쓰고 싶다면 소시지도 소세지가 돼야 맞으며, '맛사지'라고 쓰고 싶으면 메시지도 멧시지가 돼야 할 것이다. 이런 식으로 서로 표기 방식을 보완하면 된다.
디저트 - 데저트(사막)-_-도 영어 스펠링과 발음이 헷갈리기 좋은 듯.. ㄲㄲㄲ

Posted by 사무엘

2023/10/12 19:46 2023/10/12 19:46
, , , , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2218

여러 단어들의 형태와 의미

1. 단어 의미의 차이

(1) '오타쿠'라고 그 이름도 유명한 일본어가 국내로 유입돼 들어왔는데.. 이게 표현과 의미가 분화됐다.
앞부분을 떼어낸 오덕은 말 그대로 일본 애니, 미소녀, 모에 하앍하앍, 피규어.. 이런 특정 분야와 관련된 원래 뜻이고,
뒷부분을 떼어낸 덕후는 매니아, 전문가, 기크, 너드..라는 뜻인 것 같다. 역덕 밀덕 철덕에서는 접사로도 쓰인다.

(2) 나룻배는 뭐고 거룻배는 뭐지..??
수하물 수화물도 그렇고. 마치 성경 용어 환난과 환란만큼이나 별 차이 없이 섞여 쓰이는 단어 같다.

(3) 외도: 한국어에서는 ‘배우자의 외도’라고 보통 불륜, 간통, 음행 쪽만 가리킨다. 그러나 일본어에서는 그냥 일반적인 부도덕 죄악 악행을 모두 가리킨다. 휴먼버그 대학교 고문 소믈리에의 대사를 통해서 알게 됐다. -_-
외모: 한국어에서는 일단은 성형수술과 관계 있을 정도인 겉모습에만 국한되어 쓰이는 편이다. 그러나 성경에서 “하나님은 외모를 취하지 않으시고”(person)는 가오뿐만 아니라 능력, 피지컬처럼 사람의 전반적인 스펙을 모두 일컫는 의미이다.
外자가 들어가는 흥미로운 단어 쌍이다.

(4) 저것 말고도 '비겁', '묵살' 같은 한자어도 한국어와 일본어가 뉘앙스가 미묘하게 다르다는 게 잘 알려져 있다.
우리말로는 둘 다 아주 부정적인 뉘앙스의 단어인 반면.. 일본어로는 전쟁에서 적을 기막히게 속이고 낚고 농락해서 싸그리 몰살시켜도 비겁(!!)하다고 그런다. 긍정적인 뉘앙스가 담긴 교활이나 악랄, 영악이라는 의미도 좀 포함한다는 뜻이다. 선전포고 없이 진짜 치졸 비열하게 진주만을 공격한 거 말고, 저런 것까지 말이다.
그리고 묵살은.. 한국어에 의미하는 ‘무시’의 강화 버전뿐만 아니라 신중한 보류..까지 의미한다. 과연 사무라이뿐만 아니라 에둘러 말하기의 달인인 일본 문화답다. 허나, 쟤들은 포츠담 선언까지 묵살한다고 모호하게 답변했다가 결국은 핵을 쳐맞았다. -_-

(5) 컴퓨터 프로그래밍에서 직렬화란.. 어떤 오브젝트의 내부 상태를 스트림 형태의 비휘발성 메모리에다가 쭉 덤프해서 나중에 다시 원래대로 읽어들이고 복원 가능하게 하는 기능을 말한다. 배열, 리스트가 아니라 트리 구조 같은 비선형 컨테이너는 직렬화를 위해서 코딩 기법이 좀 필요하다.
그런데 병렬화는? 같은 목적을 위해 수행되는 많은 작업들을 CPU 코어 여러 개에다 분산시키고 동시에 수행하도록 해서 전체 소요 시간을 줄이고 성능을 끌어올리는 걸 말한다. 그러니 직렬화-병렬화는 분야가 서로 완전히 다른 의미를 지닌다~!

(6) 우리말 내지 이쪽 문화권에서는 돼지가 무척 공격적인 동물이라고 생각했는가 보다. 그래서 ‘저돌적’이라는 단어가 있으며, 여기서 ‘저’는 돼지 猪이다. 심지어 '저돌희용'이라는 한자성어가 있다. '멧돼지 희'라니.. 참 희한한 한자인데.. 울나라 상용 한자가 아닌 듣보잡 글자이다.
그런데 영어권에서는 숫양이 사납고 성깔 더럽다고 생각했는지, ram에 저돌적이라는 뜻이 들어있다. 우격다짐으로 밀어붙이다, ‘공성 망치로 공격하다, 배끼리 서로 들이받다’ 같은 옛날 전쟁 전술과 관련된 살벌한 뜻이 들어있다.
옛날 영화 벤허에서도 갤리선에서 최고속을 가리키는 용어가 3등 battle speed, 2등 attack speed를 넘어 ramming speed였다..;;

(7) 영어에는 prosecute(기소)와 persecute(박해)가 형태가 비슷해서 이를 이용한 언어드립이 있는 걸 개인적으로 어디선가 봤었다. 악질 검사한테 박해 받는다..;; 뭔가 심상이 자연스럽기 때문이다.
translation(번역)과 treason(반역)도 비슷한 관계이다. 이건 굉장히 공교롭게도 영어와 한국어 모두 형태가 비슷한 단어쌍이다~!

(8) AV..
AV 단자라고 하면 오디오/비디오라는 뜻이다.
AV 1611이라고 하면 공인된 번역본이라는 뜻이다.
일본 AV라고 하면... 19금이라는 뜻이 된다. 의미와 용도가 완전히 제각각이다.. ㅋㅋㅋㅋㅋ

2. 욕처럼 들리는 단어

(1) 시발: 시발 자동차, 구로 역 시발..;;; 전설적인 예시이다.
채널A 카톡쇼에 출연했던 어떤 자동차 업계 원로의 회고에 따르면.. "시발 시발 우리의 시발~~~" 이러는 라디오 광고 CM쏭까지 있었다고 그런다.
그리고 필리핀에는 시발롬 Sibalom 이라는 지역이 있다.. ㅠㅠㅠㅠㅠㅠ.

(2) 옛날 일본의 히로히토 천황은 본명이라고 해야 하나 휘호가 迪宮였는데.. 발음이 '미치노미야'였다. 영어로도 Prince Michinomiya Hirohito 라고 썼다.
일제 식민지 조선인들한테 "미친놈이야"라고 당연히 놀림감 0순위였으며, 일본도 이 사실을 광속으로 인지하고 단속을 벌였다.

(3) rape: 어떻게 노란 유채 식물이 이런 끔찍한 범죄와 동음이의어인지 궁금하다. 그래서 영어로는 원래 명칭대로 안 부르고 카놀라 Canola라고 부른다.
하긴 유채는 순우리말 명칭도 굉장히 뜬금없다. '평지'라고 하네...;;;

(4) retard: 학창 시절에 접했을 음악 나타냄말에도 '리타르단도'(점점 느리게)가 있고, 또.. 항덕이라면 비행기 조종에서도 어떤 기종은 착륙 착지 때 GPWS에서 retard, retard~~ 라고 안내를 해 준다. '엔진 출력 낮춰, 속도 줄여~!' 이런 뜻..
근데 현실에서는 retard는 음악이나 비행기 출력이 아니라 지능 발달이 더딘 사람을 일컫기도 한다. '백치 아다다'에서 백치처럼 말이다.
비행기가 성공적으로 착륙하면 이탈리아 같은 일부 문화권에서는 승객들이 환호하고 박수도 치는데.. 정작 조종실 계기판에서는 병~~신 병~~신(약오르지ㄲㄲ) 이런 어감의 놀림(??)이 흘러나온다는 게 웃기게 느껴질 수 있다.

3. 언어유희

  • 헌신만 하다가 헌신짝 취급 당한다.
  • 다짐을 너무 많이 하면 다 짐이 된다
  • 교사 지침서 때문에 교사가 지침..
  • 지적이지만 지적질 하지는 않는 사람이 좋다~~ ㄲㄲㄲㄲㄲㄲ

그리고 파이널 Pinal air park(애리조나), 페인 Paine field(워싱턴 시애틀).. 둘 다 항공과 관련된 유서깊은 시설이 있는 지명이다.
전자는 노후 비행기 보관소이다. 그래서 최후 final과 비슷한가..?? -_-;; 그리고 후자는 위치에서 짐작이 가듯, 보잉 사 에버렛 공장에서 생산되고 출고된 비행기들이 첫 출발하는 곳이다. 비행기의 출산의 고통을 의도해서 pain 드립을 쳤는지 모를 일이다. -_-;;

Posted by 사무엘

2023/10/10 08:35 2023/10/10 08:35
, , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2217

우두머리의 명칭

행정구역부터 살펴보면..
  • 반장? 통장?: 이런 게 있는 줄도 몰랐는데.. 주민등록 옮기고 전입신고를 하고 나니 실거주 중인지 인증 연락이 이 계층의 사람에게서 오더라. 이건 월 몇십만 원 남짓한 거의 용돈 받는 파트타임 알바 급의 존재감인 걸로 안다.
  • 마을 이장, 동장: 역시 현실에서의 존재감은 잘 모르겠다. 여기까지는 그냥 임명직이다. 동사무소, 주민센타, 행정복지센타.. 이런 이름은 좀 그만 바꿨으면 좋겠다.
  • 구청장: 구의 대표만 어째 '청'짜가 붙어 있다.

  • 시장, 군수: 여기부터는 선출직. 또한, 평범하게 '장' 접사만 붙는 건 시장이 마지막이다. 군은 어째 '수'가 붙어 있네?
    서울특별시장은 다른 시장/군수, 심지어 도지사보다도 서열이 더 높다고 한다.
  • 도지사: '지사'라는 유니크한 명칭이 등장한다. 미수복 영토인 황해도, 함경남북도, 평안남북도에 대해서도 명목상으로나마 도지사를 두고 있다는 건 공공연한 사실이다. 이북5도청이라는 이름의 관청도 있다.

그 다음 마지막 최종 보스가 대통령이다.

  • 우리나라는 연방제 급의 지방자치를 하기에는 덩치가 너무 작은 관계로.. 여전히 중앙 정부의 입김이 압도적이다.
  • 우리나라는 부통령이 없는 대신, 국무총리가 비중과 권한이 크다. 그러니 이 사람이 대통령 권한대행도 맡는다. 부통령은 리 승만 1공화국 시절에만 있었다.
  • 사실, 입헌군주제에서 얼굴마담 군주를 대신해서 실질적인 정치를 하는 그 무언가는 prime minister '수상'이라고 불리는데, 이 직함이 '총리'라고 번역되기도 했다. 아라비안 나이트에서 쟈파, 일본에서 아베나 고이즈미 같은 사람 말이다.

이렇게 명칭을 늘어놓아 보니, 우두머리를 가리키는 직함명이 단순 '-장' 이상으로 굉장히 다양함을 알 수 있다. 교장, 사장, 회장 같은 것과는 상황이 다르다.

  • 정부 기관들은 '-청'자로 끝나다 보니 '-청장'이라는 명칭이 자연스럽게 붙는다. 구청장뿐만 아니라 병무청장, 기상청장, 경찰청장 등..
  • 촌장, 추장은 전근대 시절을 다루는 외국물 번역 용도로만 쓰이는 용어인 것 같다. 특히 추장은 문명화되지 않은 부족의 우두머리라는 이미지가 강하다. 인디언..??
  • 그리고 '총'자. 대학교의 우두머리는 교장이 아니라 총장이라고 불린다. 그리고 한국 은행은 행장이 아니라 총재..;;
  • '총통'은 앞서 언급했던 대통령과 총리가 결합된 엄청난 타이틀이다. 장 제스나 히틀러 같은 외국의 독재자에게만 쓰이곤 했다.

조선 시대의 관아는 주민센타 겸 지방 법원 겸 경찰서 통합이었는가 보다. 하긴, 거기 가서 곤장도 맞고 오니까.. 사또 내지 원님도 행정과 사법이 통합된 그 무언가였던 듯하다.

"당신을 XXX 혐의로 체포한다. 당신은 묵비권을 행사할 수 있고, 모든 증언은 당신에게 불리하게 작용할 수 있으며..."가 아니라..
"네 이놈, 죄인은 오라를 받으라~! 니 죄를 니가 알렷다~!! 죄를 이실직고할 때까지 죄인을 매우 쳐라!!!" 이러는 게 참 화끈하긴 했다. =_=;; 명칭부터가 경찰이나 공안이니가(두루 살핀다, 공공의 평안을 도모함) 아니라 포도청.. 도적 잡는 관청이라는 뜻이었다.

Posted by 사무엘

2023/02/28 08:35 2023/02/28 08:35
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2131

한자어 어휘 관찰

1. 한자 義

義는 '의롭다, 옳다, 올바르다' 등의 아주 좋은 뜻을 나타내는 글자인데, 어쩐 일인지 글자 내부에 '양'이라는 부수가 포함되어 있다.
아 그래서 "한자에 담긴 창세기"를 지지하는 진영에서는 한자에 진작부터 "어린양"이라는 기독교 개념이 담겨 있다는 식으로 해석을 해 왔다.

개인적으로는 이게 정말 신빙성 있는 해석인지 잘 모르겠다. 하지만 최소한 船의 8이 노아의 가족을 의미한다는 떡밥보다는 어린양이 '좀 더' 개연성이 있어 보이긴 한다. 하긴, '아름답다' 美에도 '양'이 있으니 참 신기한 노릇이다.

그런데 이 義는.. 모조, 가짜, '실물이 아니지만 실물에 준하는' 이런 뜻이 있다. 그래서 의형제, 의수 의족 의안에서 '의'가 '가짜'라는 뜻의 義이다.
동일한 글자에 옳다 바르다.. 의롭다랑 '가짜'라는 뜻이 같이 있는 게 굉장한 의외이지 않은가? 게다가 이건 다의어이지, 동음이의어 관계가 아니다.
저 의가..

  • 依 손발 없는 장애인이 의지할 만한..
  • 儀 모양 외형만.. (예의)
  • 醫 의학의 힘으로 재현한..

어느 것도 아니라니 굉장히 의외로 느껴진다.;; 의형제까지는 이해가 되지만 의수 의족 의안은..?
비록 레알 실물이 아니지만 "부정적인 어감"이 덜한 모조 대체품이라는 단서가 붙어야 할 듯하다.

2. 2음절 한자어의 앞뒤

우리말의 한자어는 비슷한 뜻의 한자 2개가 적당히 결합해서 단어가 된 경우가 많다.
'은혜'라든가.. 그리고 '명령'도 둘 다 뜻이 비슷하기 때문에 태조 왕건 드라마의 대사도 "폐하의 명이시니라 / 폐하의 영이시니라. 눈을 감아라."가 오락가락했다는 얘기를 본인이 예전에 한 적이 있다.

기린이나 앵무 같은 동물 이름도 그냥 '기린 기, 기린 린(麒麟)', '앵무 앵, 앵무 무(鸚鵡)' 한자의 결합이다. ㄲㄲㄲ
다만, 사자는 '사'만 獅이고 '자'는 그냥 잉여 글자 子이다. 일본에서는 한자로는 동음이의어 변별이 안 돼서 저건 그냥 영어 '라이온'으로 부르고 말이다.

이 자리에서 또 제시하고 싶은 예는 '역참'이다. (驛站) 이건 중앙 정부에서 파견된 파발꾼이 말 타고 장거리를 달리다가 지친 말을 교체하거나 각종 중간 보급을 받는 기지의 명칭이다. 고속도로 휴게소의 전근대 버전뻘??
역참은 한 왕조 내지 중앙 정부의 통치력이 닿는 곳 이내엔 당연히 모두 설치되어야 했다. 동서양 어디에나 비슷한 기지가 있었고 조선의 경우 암행어사의 파견과도 접점이 있었다.

마패는 원래 암행어사 신분 자체를 입증하는 표식이 아니라, 그냥 역참 시설을 이용하고 말을 불출할 자격이 있음을 나타내는 표식이다.
그리고 "암행어사 출두요~!" 소리와 함께 우루루 뛰어오는 암행어사 편의 포졸들은 지방 관아가 아니라 바로 역참에 소속된 제3자 '역졸'이다. 무슨 특검도 아니고.. 암행어사는 조선만의 참 특이한 제도이긴 했다.

아무튼, 이런 말 대신 철도가 등장하면서 '역참'이라는 시설은 그냥 철도역으로 자연스럽게 대체되었는데.. 한국과 일본에서는 앞글자 '역/에키'를 떼어간 반면, 중국에서는 뒷글자 '참'을 떼어갔다는 차이가 있다. 중국어로는 철도역을 '차참'이라고 한다.

3. 순우리말과의 관계

(1) '거리'는 순우리말로는 길거리 street라는 뜻이지만, 한자어로는 distance라는 뜻이다.
'고장'은 순우리말로는 지역, 마을이라는 뜻이지만, 한자어로는 기계 고장, 트러블, 탈, 문제라는 뜻이다.
'저자'는 현재 한자어 author이라는 뜻으로 거의 굳어져 있지만, 순우리말 고어로.. 장터, 도떼기시장, 가게라는 뜻이 어렴풋이 있다. '저잣거리', 그리고 '저자 시'(市)에서 그 흔적이 남아 있다~!!
이들은 순우리말은 모두 뭔가 지리와 관련된 용어라는 공통점이 있다.

(2) 육지 land를 뜻하는 '뭍'은 앞으로 수십 년 뒤에는 거의 듣보잡 사어가 되지 않을까 싶다.
빚 증서를 나타내는 '어음'은 한자어가 전혀 아닌 순우리말이다.

(3) 잎을 달여 마시는 식물 '차'는 순우리말이다. 차의 한자어는 '다'(茶)이며, 바퀴 달린 탈것을 가리키는 차(車)가 한자어이다.

(4) 놈 자(者), 계집 녀(女)를 보면.. 어쩌다가 순우리말이 천박한 표현으로 전락했나 궁금해진다. "제 뜻을 실어 펴지 못할 놈이 하니라" 특히 계집은 여자에 대해서 거의 흑인-니그로 같은 급의 멸칭이 된 듯하다. 같은 여자끼리 서로 싸울 때나 사용하는 단어이다.
요즘은 한자의 훈 자체가 사람 자, 여자 녀로 바뀌기도 했지 싶다. 문둥병, 장님 같은 말까지 나병, 맹인 등으로 바뀌었고 말이다.

4. 은혜

'은혜'라는 단어는 여러 언어에서 여자 이름으로 쓰이는 것 같다. 우리말은 말할 것도 없고, 영어권에도 Grace나 Gracia가 있으며 일본어에도 '메구미'(惠)가 있다.
우리나라 통일/새 찬송가에서 일본인 작사로 알려져 있는 가장 유명한 곡은 나카다 우고 작사의 "은혜가 풍성한 하나님은"인데.. 얘는 원어 가사도 영어 번역이 아니라 일본어로 기재된(Megumi hukaki mikami yo ...) 거의 유일한 곡이다.

본인은 '메구미'를 배틀로얄에서 미츠코에게 낫으로 목이 따여 죽는 여학생 이름으로만 오랫동안 알고 있었다. ㅠㅠㅠ ^^;; 은혜라는 뜻이긴 하지만 딱히 기독교적인 심상을 담은 건 아니다.
이는 마치 서울 은평구와 비슷한 처지이다. 은평은.. 딱 정확하게 은혜와 평화에서 유래되었지만, 신약 바울 서신에 나오는 은혜와 평강(평안)하고는 아무 관계가 없기 때문이다.

5. 나머지

(1) 요즘은 무슨 물자나 서비스의 가격이 올랐을 때 '인상/상승'이라는 평범한 단어를 찾기가 어렵다.
가격을 올리는 당사자는 '조정, 합리화, 현실화'라고 말을 돌려서 표현하고,
언론에서는 1%가 오르든 0.1%가 오르든 언제나 '폭등'이라고 보도하기 때문이다. -_-;;

(2) 암석의 생성 원리가.. 한자의 제자 원리(육서)와 대응하는 구석이 있는 것 같다.
화성암: 상형 지사
퇴적암: 회의 형성
변성암: 전주 가차 ㄲㄲㄲ

(3) 우리나라의 성씨하고 한자 부수가 좀 성격이 비슷해 보인다.
귀화해서 생긴 너무 예외적이고 마이너한 성씨를 빼면 성이 내가 알기로 250여 개 정도 있어서 부수의 개수 214와 비슷하다.
부수의 획수 범위 1~17획은 ㄱ부터 ㅎ까지 자음 순서 14와 비슷하다. ㅋㅋ
하긴, 우리나라는 자국민에게는 창씨가 금지되어 있고, 성씨가 너무 적은 게 그냥 특징인지.. 문제점인지 좀 그렇다.

(4) 태권도, 그리고 태풍.. 얘들은 의외로 '태'의 한자가 太나 泰가 아니다.
태권도의 '태'는 跆(밟다, 발로 차다)인데, 국어에서는 태권도 계열의 단어 말고는 사실상 쓰이는 곳이 없는 글자인 듯하다.
그리고 태풍도 아주 의외로 태풍이라는 뜻의 전용 글자인 颱가 존재한다. 태풍의 뜻이 태풍이라니 뭔가 재귀적이다만.. 얘 역시 태풍 말고 다른 용도가 존재하지 않는다.

(5) 갓난아기가 맨 처음으로 접하는 단어, 맨 처음으로 시도하는 발음이란 게 뻔할 뻔자이다 보니..
전세계 언어들이 다 '엄마'에는 M 소리가 들어가고, '아빠'에는 어떤 형태로든 B/P 소리가 들어간다는 것이 주지의 사실이다.
그런데 '엄마'의 포스에 비할 바는 못 되지만 해충 '모기'도 세계 언어들 상당수에는 M 소리가 들어있다고 한다. 흥미로운 점이다. 영어 mosquito, 그리고 마침 한자 蚊도 음이 '문'이다.

Posted by 사무엘

2023/02/11 08:35 2023/02/11 08:35
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2124

1.
정관사 the는 뒤의 단어가 꼭 모음으로 시작하지 않더라도, ‘THE / 바로 그 ..’ 강조의 의미로 ‘더’ 대신 ‘디’라고 강하고 길게 발음될 수 있다.

2.
우리말 조사 중에는 앞의 체언에 종성이 있는지의 여부에 따라 음운이 더 첨가되는 게 있다. '-(으)로' 내지 '-(이)면'처럼 말이다. 뭔가 언어 차원에서 '자음-모음, 자음-모음' 이렇게 이어지는 걸 더 자연스럽게 생각했기 때문인 것 같다.

킹 제임스 성경 영어에도 이와 비슷한 유형으로 운율이나 음절수를 맞추기 위한 동일 단어 바리에이션이 있었다. do의 3인칭 단수 굴절은 doth(1음절)와 doeth(2음절)이 굳이 나뉘어 있었고, 의미가 거의 같지만 to(1음절)와 unto(2음절)이 나뉘어 있었다. 읽히는 상황에서 자연스러운 것을 그냥 취사선택하면 됐다.
문맹이 많고 종이와 필기구가 귀했던 시절에는 일상생활에서 암기· 암송의 비중이 훨씬 더 컸으며, 텍스트를 외우기 쉽게 배치하고 노래로 만드는 행위의 비중이 컸지 싶다.

3.
behind는 ‘비하인드’가 아닌 ‘바하인드’라고 발음되는 경우가 유난히 많은 것 같다.
내가 태어나서 최초로 접한 곳은 라이온 킹에서 티몬과 품바의 대사 put your past behind you였는데.. 저기서만 저러는 게 아니더라. (☞ 보기 2분 30초 이후)

영어 단어는 강세가 없는 모음이 ㅓ와 ㅡ 비스무리한 어정쩡한 약한 소리 schwa로 바뀌는 경향이 있다.
그래서 before 정도면 '비'가 '브'처럼 밍숭맹숭하게 발음될 수 있으며, 이에 대해서는 본인도 충분히 인지하고 있다.
하지만 behind의 경우는 schwa가 아니라 아예 대놓고 '아' 소리가 너무 분명하게 느껴지는데.. 이건 별개의 변종 발음으로 봐야 하지 않나 싶다.

4.
wicked, rugged는 wick나 rug에다가 -ed 어미가 붙은 단어가 아니며, 어원상 -ed가 없는 단어들과는 전혀 무관하다.
그렇기 때문에 ‘위크트, 러그드’가 아니라 i 소리가 분명히 첨가되어 ‘윅키드, 러기드’가 맞는 발음이다. 나 같으면 스펠링을 그냥 -ed가 아니라 -id로 정했을 것 같다.
한국어로 치면 ‘반짇고리’, ‘옜다’처럼 사잇소리가 아닌 단순 축약형이기 때문에 받침 스펠링이 ㅅ로 아닌 단어하고.. 상황은 다르지만 좀 비슷한 느낌이다.

5.
요즘 당장 네이버도 그렇고, 영한사전에서 i 발음을 작은 I (U+26A)로 표기해 놓은 게 있어서 이건 도대체 뭔가 궁금했다.. 저게 IPA 정의상 더 정확한 표기이구나. i가 옛날식 비표준 표기였다고 한다.

6.
노벨 화학상을 받은 유명한 핵 물리학자의 이름은 어니스트 '러더퍼드'(Rutherford)이다. 한글 표기로나 실제 발음으로나 문제가 없다.
그런데 과학 말고 신학에서 거론되는.. 17세기 스코틀랜드의 장로교 목사의 이름은 새뮤얼 '루터포드'(Rutherford)라고 더 널리 알려져 있는 것 같다.;; 내 개인적으로는 전자는 20여 년 전 학창 시절부터 들었지만 후자는 완전 처음이었다.

원어상의 발음이 다를 것 같지는 않은데 왜 이런 차이가 발생했나 모르겠다. John Rutter도 '루터'인지 '러터'인지 잘 모르겠다.

7.
위와 비슷하게,

  • 만델브로트(수학) → 망델브로
  • 호이겐스(천문) → 하위헌스
  • 나트륨(화학) → 소듐
  • 엔젤 → 앙헬(베네수엘라 폭포 이름)
  • 터키(나라 이름) → 튀르키예!!!!

분야를 막론하고 각종 명칭을 현지 발음을 존중해서 표기하는 것으로 추세가 바뀌는 것 같다.
한 20세기 말 정도엔 독일식· 일본식 발음을 영어로 바꾸는 것 위주였는데 말이다. (왁찐· 비루스 → 백신· 바이러스, 밧데리 → 배터리, 반도 → 밴드..)

8.
영어에서 음절말에서 L+자음은 한국어의 음운 구조와는 상극이어서 발음이나 표기가 굉장히 난감한 음운 조합이다.
world 내지 film의 발음을 생각해 보자. 이런 건 영국식과 미국식의 차이가 어떤지 궁금하다.

9.
온도를 나타내는 섭씨 화씨는 동양에서 외국 인명 Celsius, Fahrenheit를 음차한 표기인 반면,
Confucius, Mencius는 반대로 서양에서 중국 인명인 공자· 맹자를 음차한 표기이다. 흥미로운 차이점이다~!
게다가 인명이랍시고 동양에서는 Mr. 씨를 붙여 줬고, 서양에서는 무슨 로마 제국 인물처럼 '-우스' 접미사를 붙여 줬다. ㄲㄲㄲㄲ

10.
알파벳 X는 거시기, 삐리리~ 말고도..

  • 대문자 단독으로는 글자 그대로 eks라고 읽는다. X-ray X-file, XP 미지수일 때는 소문자 단독도 있다.
  • 종성에서 ks라고 발음되며 이게 가장 보편적이다. box, taxi, fax, tax 등.
    초성에서는 그냥 z로 발음되는 편이다. 이런 발음을 의도한 고유명사도 많다. xylophone, Xaero, xenon, Xerox
  • 단, 아시아권 언어의 로마자 표기에서는 s나 sh로 발음되기도 한다. xi-, xu- 이렇게 시작하는 편.
  • cross, Christ라고 읽기도 한다. X-mas, Jesus is X, No X-ing 하긴, X의 획이 서로 교차하는 형태이고, 그게 45도 기울인 십자가를 연상시키기도 해서 이런 독음도 생긴 것이다. 수학에서 ×는 cross product라고 불린다.
  • 로마 숫자를 의미할 때는 'ten'으로 발음된다. Mac OS X
  • 그리스 문자를 표방할 때는 그냥 k라고 발음되기도 한다. LaTeX (뭐, 우리식 발음이라고 이것도 '라텍쓰'를 꿋꿋이 고집하는 분도 있다. 하긴, 옛날에 단재 신 채호 선생도 워낙 민족주의 의식이 강해서 세수할 때 허리를 안 숙이고, 이웃 네이버를 네이그후보어라고 발음하곤 했다.;; )

Y가 반자음도 되고 장모음, 단모음이 다 되는 것 이상으로 X는 발음이 굉장히 유동적인 글자임을 알 수 있다. 사실, 여러 언어들에서 x의 발음은 제각각으로 차이가 많이 나는 편이다.

지금 도스/윈도 명령 프롬프트에 있는 xcopy라는 외부 명령에서도 x는 cross를 의미한다. 아마 서브디렉터리들을 드라이브간(between, inter-, cross-)에 그대로 통째로 복사하는 기능을 부각시키기 위해 붙여진 이름이 아니었나 싶다. 기존 내부 명령인 copy에는 없던 기능이기 때문이다.

영어는 혀는 좀 대충 굴리더라도 억양과 강세가 정말 큰 비중을 차지하는 언어이다.
can이랑 can't만 해도, T소리의 유무가 전혀 아니라 오로지 길이와 억양으로 구분하는 물건임이 주지의 사실이다.
영어 인스트럭션을 느린 가상머신 소프트웨어 에뮬레이션이 아니라 하드웨어 차원에서 네이티브로 돌리는 바이오닉 CPU의 소유자들이 부럽다.;;;

Posted by 사무엘

2023/02/04 19:35 2023/02/04 19:35
,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2121

1. 몸 풀기 개드립

  • 헬쓰카레  health care
  • 순대 / 아이스크림(sundae)
  • danger / 단거
  • Giftgas 선물까스

2. please, give

영어에는 한국어 같은 문법 차원에서의 높임법이 없는 대신..
please가 한국어의 부사 '좀' 내지 보조사 '-요' 역할을 하면서 부드러운 부탁· 간청의 뉘앙스를 전달한다.
저 동네에서는 과장 좀 보태면, 식당에서 주문을 할 때도 please를 붙이느냐 빼먹느냐에 따라 서비스의 수준이 달라질 정도라고 한다. 그 정도면 돈 안 드는 팁이나 마찬가지인 것 같다.

please와 관련된 불멸의 영화 명대사는 터미네이터 2 초반부의 You forgot to say 'please'..;; 일 것이다.
어느 건장한 근육질 청년(T-800 ㄲㄲㄲ)이 알몸 차림으로 빠에서 어느 오토바이 폭주족 양아치한테 다짜고짜 "당신 옷이랑 신발이랑 오토바이 내놔" 이러니 양아치가 어이가 없어서 빵터지면서.. "근데 말이 좀 짧네?"와 함께 담배빵을 놓는 장면 말이다.

사용자 삽입 이미지

약간 점잖게 의역하면 "줘" / " '주세요'가 아니고?" 인데,
더 많이 거칠게 의역하면 "내놔" / "근데 말이 짧다? / 좀 싸가지가 없네" 정도로 하면 될 것 같다.

이러니 한국어는 너무 복잡 미묘해서 외국인이 어설픈 기계번역 돌리는 정도로는 한국인 행세하는 게 어림도 없고 불가능하다.
같은 튜링 테스트라도 영어가 아닌 한국어라면 난이도가 넘사벽으로 급상승할 듯..
모 페친님의 말마따나 구글 할아버지 AI래도 아직 한참 더 걸리지 싶다. -_-;;

저 터미네이터 대사와 대구를 이루는 대사로 개인적으로 떠오르는 건.. 역시 비슷한 시기(1991년 ????)에 개봉한 미녀와 야수에서 벨이 아버지의 안부를 걱정하는 대사이다.
"이 거울은 당신이 보고 싶은 걸 무엇이든 바로 보여줄 거예요." (영어 대사는 기억 안 나고 검색하기 귀찮으니 패스~)
I'd like to see my father, please. ("우리 아버지를 좀 보여 주세요~ / 보고 싶어요.")
이때는 벨이.. 정중하게, 다소곳하게, 공손하게 댄디하게.. 말 끝에다 please를 붙여서 부탁을 한다. =_=;;;

다만, 영어 성경(KJV)에서는 please라는 단어가 이런 뜻으로는 전~~혀 쓰이지 않았고 오로지 '목적어 누구누구를 기쁘게 하다'라는 뜻의 타동사로만 쓰였다. 반의어 displease, 수동태 pleased 같은 파생이 있을 뿐.
부탁하는 뜻의 추임새 please는 오히려 I pray thee (바라건대/부디) 로만 쓰였다.

한국어는 '주다' give에 대해서도.. 특별히 '나한테 주다'를 나타내는 불완전동사 '달다' '다오, -도'가 있고,
그리고 특별히 강제로 빼앗는 문맥에서는 '내놔'라고 표현하는 편이다.
난 똑같은 정보를 전달한다 해도 한국어 문장을 생성하고 알아듣고 행간 파악하는 게 영어보다 인간 두뇌의 계산량과 CPU 소모가 더 많다고 생각한다.
Give me the(ze) phone. 전화기 내놔~ (쿵 퓨리에서 히틀러 대사 중..).

3. great

영단어 great는 물리적인 크기가 거대한 것뿐만 아니라 ‘짱~ 좋다, 멋지다~ 훌륭하다, 위대하다’처럼.. 크기가 큼으로써 수반되는 여러 긍정적인 심상, 아니 더 나아가 인품이 존경스러운 것까지 다 포함하는 단어이다.
가령, 조선 세종이나 고구려 광개토왕을 그냥 왕이 아니라 ‘대왕’이라고 부르고 영어로도 the Great이라고 추존해 주는 건 그 사람이 덩치가 컸기 때문이 아니다.

성경의 왕하 4:8에 나오는 수넴 여인은 다름아닌 great woman이라고 묘사되어 있다. 이건 무슨 뜻일까? 집이 부자? 신분이 귀족? 성품이 대인배 혜자? 아니면 진짜 피지컬이 여자답지 않은 거구? 이거 의미가 약간 중의적이어서 성경 역본마다 워딩이 달라지는 편이다.

이렇게 물리량이 가치 판단으로 이어지는 건 새삼스러운 일이 아니다. 그래서 옛날옛적에는 무게의 단위가 화폐의 단위로 곧장 이어지는 경우가 많았다. 파운드, 탤런트 따위.
그리고 크기, 무게 다음으로 온도 버전은 cool이 있다. 이것도 감탄사로도 쓰일 정도로 정말 좋은 뜻이다.

4. present

명사 present는 현재라는 뜻도 있고 선물이라는 뜻도 있는 동음이의어이다.
그래서 "과거는 이미 history이고 미래는 mystery일 뿐이다(운율..!). 하지만 지금 현재는 우리에게 주어진 gift이기 때문에 present라고 불린다" 라고.. 굉장히 재치 있는 격언이 만들어져서 쿵푸 팬더 만화영화에서 인용되기도 했다. "인생은 Birth와 Death 사이의 Choice이다" 처럼 말이다.

그런데 <오징어 게임>에서는 상우가 선물 투자를 잘못해서 쫄딱 망했다고 나오는데 이 선물은 경제· 금융 용어이다. 기훈은 말을 잘 못 알아들어서 "얘 여친이라도 생겼나? 무슨 비싼 선물을 사 줬길래 저 지경이 됐나??" 이런 식으로 오해하는데..
정작 이 선물(先物)은 영어로 futures이다. 그래서 이 대사가 영어로 번역될 때는 미래 인생이 저당 잡혔냐는 쪽으로 오해하는 걸로 의역됐다.
한국어와 영어의 동음이의어 덕분에 선물이 현재와 미래를 왔다갔다 하는 게 흥미롭다.

5. 큰 바위 얼굴

소설 <큰 바위 얼굴>에서 ‘큰’은 원어가 겨우 big이나 large 따위가 아니라 great일 거라고 합리적인 추측이 가능할 것이다. 물리적으로 거대한 것과 사람 인품이 대인배로 성숙한 것을 절묘하게 조화시켰으니까..!! 실제로 그렇더라.
단, 바위는 의외로 rock이나 그에 준하는 단어가 아니라 그냥 stone이더라. 큰 철판 얼굴이나 큰 포커페이스가 아니라 큰 바위 얼굴인 것이 인상적이다.

좀 뜬금없는 얘기이지만, 개인적으로는 본문 중에 정력-_-이라는 단어가 있어서 중학교 시절부터 저 소설을 꽤 강렬하게 기억하고 있었다. “그의 얼굴에는 정력이 넘쳐흐르고…”

영어 원문을 보니 스태미나 같은 단어 따윈 없다. 그냥 full of energy를 피 천득 선생이 저렇게 번역한 것이더라. 피와 천둥의 군인이 원기왕성하고 성경의 신 34:7 “늙어서도 타고난 힘이 줄지 아니하였더라 nor his natural force abated”이랬다는 것을 저 어휘로 표현했을 뿐이다.
단지, 후대에 와서야 정력이 거의 성력에 가까운 뜻으로 와전되고 있고 말이다.

외래어에서는 사람들이 ㅈ으로 대표되는 구개음을 선호하는 경향이 있다.
알고리듬(-thm)을 알고리즘으로, 베이식(basic)을 자꾸 베이직으로.. 트리 대신 츄리..;;
이게 한국인만 그러는 게 아니어서 일본어는 더 심하고.. 쿵 퓨리에서는 히틀러가 the(더)를 ‘저/자’로.. 발음한다. 그럼 정력은 성력의 구개음화 버전으로 봐야 할지 이런 엉뚱한 생각도 든다. ㅡ,.ㅡ;;

6. energy

아 그리고.. 수 년 전엔 유튜버 ‘올리버쌤’이 궁예의 “누가 기침 소리를 내었는가?” 씬을 영작 더빙한 적이 있었는데..
“저 자의 머릿속에는 마구니가 가득하다”를 that man is full of NEGATIVE energy라고 번역했었다. -_-
그냥 에너지가 충만한 것과, 부정적인 에너지가 충만한 것의 차이가 저렇다는 것을 염두에 두면 되겠다. ㄲㄲㄲㄲ.

7. 새로운 문명의 이기를 가리키는 용어

다음 물건들은 20세기 초에 발명되고 용어가 정립됐는데.. 의미가 확장된 과정이 굉장히 뜬금없어서 유의어인지 동음이의어인지 논하기가 난감할 정도인 것 같다.

  • 탱크: 원래 물탱크 같은 저장고라는 뜻이다가 전차라는 의미까지 추가됐다. 단순 장갑차가 아니라 '무장'이 추가된 장갑차..
  • 타이어: "땅바닥을 하염없이 굴러다니면 쟤도 피곤하겠다"..;; 라는 어린아이의 발상을 거쳐서 고무 테가 둘러진 바퀴라는 뜻이 추가됐다. "귀가 불 붙으면?" 만큼이나 뜬금없다.ㅠㅠㅠㅠ
  • 배터리: 전기 셀이 군대 제식 하듯이 일렬로 쭉 늘어서 있는 모양에서 유래되었다. =_= 그래서 이 단어는 전지라는 뜻뿐만 아니라 포병 부대, 더 나아가 폭행, 구타라는 법적 의미까지 갖게 됐다. 쉽게 말해 빠따 bat와 battery는 어원상 서로 관련이 있다!

8. 비속어

(1) scram
"(썩) 꺼져~!!!"라는 뜻이다. 영화 정무문에서 이 소룡이 "난 니들하고는 싸우고 싶지 않으니 너흰 어서 비켜 / 짜졋 / 꺼졋!!" 이렇게 소리를 지를 때 영어 자막이 저렇게 나갔다.

(2) screwed
스크루라는 물건이 어떻게 생겼는지를 생각해 보자. 우리말에도 "인생 꼬였다, 군생활 꼬였다" 같은 말이 있는데 이와 딱 정확히 대응한다.
드라마 "오징어 게임"에서 달고나 게임 편을 보면, 주인공 성 기훈이 우산 모양을 고르는 장면이 있다. 그런데 그 복잡한 윤곽대로 달고나를 뜯어내야 된다는 걸 뒤늦게 알게 되자 "X됐다!!"라고 개그대사를 날리는데, 그게 영어 자막으로는 I'm screwed 라고 나갔다. =_=;;

영어 쪼랩의 입장에서는 F-word 위주로만(~ off, ~ up -_-;;) 표현이 떠오를 것 같다만.. 이 상황에서 의외로 scr-로 시작하는 대체제가 존재한다.

(3) bastard
점잖게 사생아· 서자라는 뜻만 있는 게 아니다. 우리말 구어의 '짜식, 새X'에 거의 정확하게 대응하는 비속어의 뜻도 있다고 한다. 하긴, 둘 다 원래 뜻에 무슨 자식, 후세라는 뜻이 있기도 하다. ㄲㄲㄲㄲ

(4) bullshit
문자적인 뜻은 소똥인데.. 우리말로 치면 '개뿔 쥐뿔' 같은 뉘앙스가 담겨 있다.. '헛소리, 허튼소리'.. 더 나아가 '개소리'라는 뜻이며, 'X랄', '염병하네~' 같은 감탄사의 용도로 쓰인다. 개소리를 들어서 어이없음을 표현하는 감탄사 말이다.

B로 시작하는 위의 두 단어는 영화 킬 빌에서 제일 먼저 봤다.
그렇잖아도 킬 빌이 '빌'에 '베아트릭스 키도' 이러면서 B를 갖고 어쩌구 하는 것 같던데 말이다.

그 밖에 crap도 bullshit과 비슷한 뜻이 있는 것 같고..
asshole은 "쟤 완전 밥맛이다, 재수없다" 같은 용도로 정말 많이 쓰이는 뒷담화 용어이다..
scumbag은 그냥 새끼가 아니라 '*** 새끼' 정도로 사람을 모독하는 욕설이다. 얘는 풀 메탈 자켓 영화를 통해 알게 됐다. -_-;;

Posted by 사무엘

2023/01/06 08:36 2023/01/06 08:36
,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2110

우리말 어휘 메모

1. 곁의 두 숫자를 한데 싸잡아 지칭하기

예전에 몇 번 언급했던 바와 같이, 한국어는 영어 대비 참 기괴한 면모가 많은 언어이다.

  • 청자를 포함하지 않으면서 화자를 낮추는 1인칭 복수 대명사 ‘저희’
  • 청자를 의식하지 않는 독백투 “어 그게 뭐더라?” 따위
  • 부정 의미의 한 단어 타동사 “모르다”.. 내가 아는 외국어 중엔 이게 존재하는 언어는 없다. 전~부 “do not know”.. ‘알다’에다가 not 연산자를 씌울 뿐이지. 한국어에서 “싸다 / 비싸다”와 비슷하게 말이다.

그리고 한두, 두셋, 서너, 너댓, 대여섯, 예닐곱처럼 주변의 숫자 둘 정도를 싸잡아서 일컫는 므흣한 단어가 존재하는 것도 독특하다.
영어에서 아주 적절한 사례를 개인적으로 꼽자면.. 디즈니 포카혼타스에서 초반부 뮤지컬 ‘Virginia Company’ 노래의 reprise 부분에 나오는 요 대사가 아닐까 한다.

We'll kill ourselves an Injun--or maybe two or three
우린 인뎐도 해치울 거야~ 하나? 아니면 두세 놈 정도?


이건 “신대륙을 개척하다가 미개한 야만인과 맞닥뜨리면? 야만인쯤이야 걍 없애 버리면 그만이지~ 숫자가 많지도 않을 거야” 정도의 뉘앙스이다.
자막이나 더빙은 저런 뉘앙스를 짧은 음표와 화면에 도저히 담을 수 없기 때문에 아주 아주 뭉뚱그려진 의역만 나갔다.

  • 저 영어 문장은 kill Indians라고만 하지 않고 간접목적어 ourselves를 집어넣은 4형식 문장이다. God will provide himself a lamb처럼..;; (저 성경 구절은 뭐 5형식 중의적 해석까지 가능..)
  • Indian을 Injun이라고 줄여 놓은 걸 보면.. 구개음화는 꼭 한국어에만 존재하는 음운 변화가 아님을 알 수 있다. 하긴, don’t you / could you 따위의 발음이 ‘츄 / 쥬’로 바뀌는 것도 같은 예이다.
  • 뒷부분에 mine, mine, mine 노래에서는 제임스 폐하를 Jimmy라고 가리키는 것도 나오는데.. 우리나라는 아시다시피 애칭이라는 개념이 없는 문화권이다. (Bill이랑 William이 어떻게 같은 이름인가!) ‘지미’가 아니라 ‘젬쑤 왕’ 정도로 줄이는 게 더 직관적일 것 같다.

2. 동물 관련 순우리말

(1) 흘레
동물의 교미(mating)를 나타내는 명사이며 '흘레하다'라는 형태로 동사도 될 수 있다.
이 단어는 국어사전에도 엄연히 올라 있긴 하지만.. 현실의 인지도는 가히 듣보잡 사어 수준이다. 텔레비전 순우리말 퀴즈 같은 데서나 나올 것 같다. 저 말소리가 어딜 봐서 그런 동작을 연상시킬 수 있을까..??

매기: 수퇘지와 암소가 흘레하여 낳는다는 짐승. (표준 국어 대사전)


그래서 '짝짓기'라는 말이 대신 쓰이게 됐는데.. 이걸 처음으로 퍼뜨린 곳은 다름아닌 '퀴즈 탐험 신비의 세계' TV 프로였다고 한다.

(2) 무녀리
한자어 무녀(巫女/舞女) 따위와는 전혀 관계 없고, 그냥 '문열이'를 대충 풀어서 적은 것이다. 한 배에서 태어난 여러 포유류 새끼들 중에서 엄마 태라는 문을 제일 먼저 열고 나온 놈을 '무녀리'라고 한댄다.
그런데 이런 무녀리는 확률적으로 다른 새끼들에 비해 덩치 작고 약하고 젖 쟁탈 경쟁에서도 밀리는 경우가 많다. 그래서 얘는 사람으로 치면 열 달을 덜 채우고 좀 모자란 채 태어난 '팔불출'과 비슷한 뉘앙스의 단어가 됐다.

이 단어를 '문열이'라고 형태를 밝혀 표기하지 않는 이유는.. '문닫이'라는 단어가 있는 게 아니니 생산성이 없고, 의미도 gate/door opener라는 원래 뜻과는 상관이 없어졌기 때문이다.
쉽게 말해 '지키미'를 '지킴이'로 적는 것보다도 명분이 더 없기 때문이다.

참고로 '열쭝이'라는 말도 있다.
이 역시 "1.겨우 날기 시작한 새 새끼 2.겁이 많고 나약한 사람"이라는 뜻.

3. 돼지에게서 유래된 한자어

돼지를 가리키는 가장 일반적인 한자어는 돈(豚)이긴 한데.. 다른 한자도 있다. 마치 개를 가리키는 견(犬)과 구(狗)의 관계와 비슷해 보인다.

  • 저돌적: 앞뒤를 헤아리지 않고 돌진하는. '저'가 저팔계, 제육 할 때의 猪(돼지 저)이다. 멧돼지가 원래 저렇게 저돌적으로 돌진을 잘 하나 보다. '전투적으로, 의욕적으로' 대신 '저돌적'을 즐겨 사용해야겠다. ^^;;
  • 해안면: 강원도 양구에 원래 뱀이 그렇게 많이 들끓었나 보다. 그런데 돼지를 잔뜩 데려와서 키우니 돼지가 뱀들을 내쫓거나 잡아먹어서 없애 줬다고 한다. 그래서 지명의 '해'가 亥(돼지 해)이다.

4. 도전

현재까지는 '도전'이라는 말이 챌린지의 뜻으로 압도적으로 많이 쓰이지만, 앞으로 미래엔 전기 절도(盜電)라는 쓰임도 늘어나지 않을까 싶다. 도청, 도촬처럼 말이다. 챌린지와 어감상 구분하기 위해서 '도'는 좀 장음이 될 것이다.

세계 각국이 앞으로 2, 30년 안으로 내연기관 자동차를 주류에서 퇴출시키려 하고 있다. 그 자리를 전기차가 차지할 것이고 충전 시설이 곳곳에 들어설 것이다.
충전 시설을 이용하려는 운전자 사이에 자잘한 마찰이나 분쟁이 발생할 것이다. 그리고 이를 계기로 꼭 자동차가 아니라 폰 충전기를 공공장소 콘센트에다 몰래 쓰윽 꽂는 것도 지금보다 더 강하고 적극적으로 금지되는 분위기가 형성되리라 여겨진다.

아직까지는 우리나라가 이런 것에 관대한 편이다. 하지만 일본은 그렇지 않다. 자리값에 이미 그런 가격이 포함돼 있는 카페 같은 곳이 아닌 이상, 범죄를 저지르지 않으려면 콘센트를 사용하는 것도 반드시 꼬박꼬박 돈을 내야 한다.
이런 시국이 예상되는데 앞으로 즐겨 쓰이게 될 단어는 아무래도 '도전'의 새로운 동음이의어 한자어일 수밖에 없다. 지금도 사전에 올라 있기는 하지만 잘 쓰이지 않을 뿐.. 하지만 언론에서 매번 번거롭게 '전기 절도'라고 풀어서 쓰지 않는 한, '도전'의 쓰임이 재조명을 받게 될 것이다.

5. 군대, 경찰, 소방..??

공무원 중에서 사회의 치안과 안녕을 직접적으로 담당하는 직업, 대놓고 순직할 가능성이 높은 직업, 오늘날까지도 계급장 달린 제복이 남아 있는 직업을 꼽자면 군인, 경찰, 소방관을 꼽을 수 있을 것이다. 각각 외적과 싸우고 자국 범죄자와 싸우고, 화마와 싸운다는 차이점이 있을 뿐.. 거기에다 자연재해나 유해조수와 싸우는 건 일단 소방관에서 시작하는데, 감당이 안 되면 경찰, 군인의 순으로 공조도 하게 된다.

군인, 경찰관, 소방관이 들어가 있는 조직을 건물 관점에서 가리키는 명칭은 각각 군부대, 경찰서, 소방서 정도에 대응한다.
그런데 집단 전체의 총체적인 명칭은 무엇일까? 군인이 있는 곳이야 군대 내지 그냥 군이라고 간단하게 부를 수 있을 것이고, 경찰도 단독으로 직업이나 집단, 심지어 사람까지도 두루 간편하게 가리킬 수 있다. 꼭 경찰'관'이나 순경이라고 안 해도 된다.

하지만 '소방'은 그렇지 않다! 이 단어는 그냥 '화재를 진압하거나 예방함', firefighting이라는 동작만 나타낼 뿐, 그 일을 수행하는 관청 조직이라는 뜻이 없다. 그래서 신문 기사를 쓸 때 난감하다.
"신고를 받은 경찰과 소방(???)에서는 멧돼지의 포획에 나섰다" 이런 식으로 간편하게 워딩을 할 수 없기 때문이다. 그나마 '소방 당국' 정도는 돼야 관청 조직이라는 뜻이 들어가니 번거롭다.

"경찰을 부르겠다!", "경찰에 신고하겠다", "군대를 동원해서 진압하겠다"
이런 상황에서 경찰, 군대 대신에 소방 당국을 집어넣으려면 어떡해야 할까?
그러니 신고 전화번호인 119 '일일구'가 소방 당국을 가리키는 편의상의 총칭으로 통용되고 있는 거다. 신기하지 않은가? 경찰에 신고하려고 할 때 "112 불러라, 112에 신고해라" 이렇게는 잘 말하지 않는다는 걸 생각해 보자~!

게다가 119는 화재뿐만 아니라 전반적인 의료 응급 상황까지 다 처리하지 않는가? 애초에 '소방'이라는 말만으로는 불충분하다.
수백 년 뒤, 먼 미래에 우리의 후손은 필요에 따라서 '이릴구' 이런 말을 표준어로 받아들여서 "화재와 응급 환자, 자연재해에 대처하는 정부 조직" 이렇게 될지도 모른다. 언론에서 "경찰과 이릴구가 출동.." 운운하면서 말이다. 그건 중립적인 2인칭 대명사 '너님/유님'만큼이나 하나도 이상할 것 없는 자연스러운 현상일 것이다.

6. 방송

라디오나 텔레비전 따위가 없던 시절, 우리말에서 '방송'이라는 단어는 원래 '내놓아 보냄', 석방과 거의 같은 뜻이었다고 한다.
영어로 치면 release와 비슷한데.. 영어에서는 죄수만 release하는 게 아니라, 제품을 출시하는 것도 release라고 한다. 한국어에서는 생각할 수 없는 의미 확장이다.

한편으로 현재 영어에서 방송을 뜻하는 broadcast는 원래 씨앗을 널리 흩뿌린다는 뜻인 농사 용어였다.;;
이런 걸 생각하면 언어의 의미 변화라는 게 참 신통방통하게 느껴진다. 우리말에서 '생도'도 꼭 사관학교 재학생에 국한되지 않은 제자, 학생이라는 더 넓은 뜻이 있었던 것처럼 말이다.

7. 나머지

(1) '백엽상'은 백이 white 白이 아니었구나..!! 충격이다. =_=;; 당연히 화이트일 거라고 믿어 의심치 않았는데.. 다른 어원에서 유래됐기 때문에 100 百이라고 한다.
옛날에는 학교마다 운동장 한켠에 있었던 물건이지만 요즘은 거의 찾을 수 없어지고 있다..

(2) 우리말에 "if and only if"(역도 성립하는 필요충분조건)라든가 "and/or"(둘 다인지 하나만인지는 중요하지 않)을 분명히 나타내는 조사, 부사, 어미 따위가 좀 있었으면 좋겠다.

(3) '괴멸/궤멸'은 분간이 거의 안 되는 발음에 뜻은 거의 같은 단어쌍인 것 같다. '저지/제지', '환난/환란'처럼 말이다.
우리말에 이런 예가 더 있지 싶은데 당장은 기억이 안 난다.

(4) 우리말은 '낳다'와 그 반의어 '태어나다'가 모두 능동인 반면, 영어는 be born이 수동 형태이다. '출산되었다/출산 당했다' 이렇게 워딩을 하지 않는다는 게 인상적이다.
영어는 '결혼하고 결혼 당하다'(marry and be married to)라고 말하지만, 한국어는 이 역시 '장가 가다, 시집 가다'라고 모두 능동이라는 차이가 있다.

(5) 금융과 관련된 '외상, 어음'이 한자어가 전혀 아니고 순우리말이라니 굉장히 의외이다.
기왕이면 더치페이, 1/n을 뜻하는 '각추렴'도 대중적으로 더 널리 쓰였으면 좋겠다.

Posted by 사무엘

2022/07/02 08:35 2022/07/02 08:35
Response
No Trackback , 8 Comments
RSS :
http://moogi.new21.org/tc/rss/response/2038

« Previous : 1 : 2 : 3 : 4 : 5 : ... 13 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/11   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Site Stats

Total hits:
2978099
Today:
1227
Yesterday:
1399