« Previous : 1 : ... 4 : 5 : 6 : 7 : 8 : 9 : 10 : 11 : 12 : ... 183 : Next »

컴퓨터 소프트웨어계에는 이미 작성되어 있는 프로그램을 실제로 돌려 보지 않고(샌드박스 가상 머신 안에서..) 형태만 들여다보고는 버퍼 오버런이나 메모리 누출 같은 잠재적 위험성 및 논리 결함을 어느 정도 찾아 주는 '정적 분석'이라는 기술이 존재한다. 그 프로그램이 기계어 바이너리 형태이건, 고급 언어 소스 코드이건 형태는 무엇이건 상관없다.

그런데 정적 분석 툴은 그 누가 만든 것이라도 원천적으로 이론적으로 근본적으로 100% 정확하게 작동하지는 못한다.
이에 대해서 "아니 소스 코드가 무슨 자유 의지를 지닌 생명체도 아닌데 그 뻔한 로직을 분석해서 결과를 사전 예측하는 게 그렇게 어려운가? 단순히 소모하는 메모리와 계산량만 많아서 어려운 거라면 컴퓨터의 성능빨로 극복 가능하지 않은가? AI 기술을 접목하면 되지 않는가?" 처럼 생각하기 쉽다.

하지만 그렇지 않다. 그 말은 저런 차원이 아니다.
그런 함수는 단순히 현실적으로 구현하기가 어려운 정도가 아니라 논리 차원에서 모순에 빠지며 존재 불가능하기 때문이다. "모든 창을 막는 방패와 모든 방패를 뚫는 창 세트"와 동급으로 존재 불가능하다~! 창이나 방패의 제조 기술과는 무관하게 말이다.

가장~~ 원초적인 정적 분석 프로그램을 생각해 보기로 한다.
분석할 대상인 프로그램 코드, 그리고 그 프로그램에다가 넘겨줄 입력 데이터.
이 둘을 인자로 받아서 이 프로그램의 시시콜콜한 무슨 메모리 문제 따위를 진단하는 게 아니라..
이 프로그램이 무한 루프에 빠지지 않고 실행이 종료되기는 할지를 정확하게 판단해 주는 bool DoesThisProgramReturn(func, argument) 라는 가상의 함수 프로그램을 생각해 보자.

argument는 현실의 프로그램으로 치자면 명령 인자뿐만 아니라 프로그램이 파일이나 네트워크 형태로 읽어들이는 방대한 입력 데이터까지 모두 포함하는 개념이다. "일괄 처리 형태가 아니라 입출력이 실시간으로 들어오는 프로그램은요?" 이건 이 시점에서 그리 중요한 문제가 아니니 논외로 한다.
func는 뭐.. C/C++로 치면 기계어 코드를 가리키는 함수 포인터 정도로 생각하면 이해하기 편하겠다.

당연한 말이지만 저 함수 자체는 절대로 무한 루프에 빠지지 않고 언제나 유한 시간 안에 답이 나오는 게 보장된다. 무한 루프에 빠지는 프로그램을 의뢰했더라도 말이다. 그러므로 DoesThisProgramReturn(DoesThisProgramReturn, xxx)는 xxx로 무엇을 넘겨주건 그 정의상 리턴값이 언제나 true가 된다.

그럼.. 저 가상의 함수는 어떤 식으로 동작할지를 생각해 보자.
func가 가리키는 코드를 읽으면서 while(true); 같은 패턴을 발견한다거나,
더 구체적으로는 예전에 한번 거쳤던 state와 동일한 state로 이미 지났던 지점을 또 지나는 게 감지되면.. 이 프로그램은 실행이 끝나지 않는다는 결론을 내릴 수 있을 것이다.

이거 만델브로트(망델브로) 집합을 그릴 때 주어진 복소수의 발산 여부를 판별하는 것과 비슷하게 느껴진다.
배배 꼬인 복잡한 프로그램에서는 좀 어렵겠지만 그래도 도저히 불가능한 문제는 아니어 보이는데..??

하지만 튜링 기계는 우리가 흔히 생각하는 것보다 자유도가 더 높은 계산 모델이다.
메모리에 저장된 주소값에 해당하는 다른 메모리의 값을 마음대로 읽고 쓸 수 있을 뿐만 아니라(= 포인터) 거기 저장된 데이터를 코드로 간주해서 실행할 수도 있다(= 함수 포인터).

재귀 호출도 되고.. 또 앞서 살펴보았듯이 DoesThisProgramReturn 자신조차도 튜링 기계에서 실행되는 함수이기 때문에 DoesThisProgramReturn의 인자로 전달할 수 있다. 그리고 분석 대상인 타 함수가 얘를 또 호출할 수도 있다.
이런 상황까지 다 허용 가능해야 한다면 DoesThisProgramReturn의 존재 가능성은 굉장히 난감해진다.

아래와 같이.. DoesThisProgramReturn가 true라고 판정한(= 실행이 끝난다) func에 대해서는 "반대로" 자신이 무한 루프로 가 버리고, 실행이 끝나지 않는 함수에 대해서는 실행을 끝내는 HangIfReturns이라는 함수를 정의해 보자.

bool HangIfReturns(func) {
    if (DoesThisProgramReturn(func, func)) while(true);
    return true;
}

그러니 HangIfReturns(DoesThisProgramReturn)을 하면.. 얘는 무한 루프에 빠지게 된다.
DoesThisProgramReturn은 자기 자신에 대해서는 앞서 정의한 바와 같이 언제나 true를 되돌리고(= 늘 깔끔하게 실행 종료) if문을 만족하기 때문이다. 여기까지는 쉽다.

하지만 반대로 HangIfReturns가 DoesThisProgramReturn의 인자로 들어가면 어떤 일이 벌어질까? DoesThisProgramReturn(HangIfReturns, HangIfReturns)는 리턴값이 무엇이 되는 게 이치에 맞을까? 이제 좀 머리가 복잡해질 것이다.

DoesThisProgramReturn(HangIfReturns, HangIfReturns)가 true라면.. HangIfReturns 안의 if문은 true가 되므로 HangIfReturns은 무한 루프에 빠진다. 그러면 저 함수의 리턴값은 원래 false가 되어야 하게 된다.
반대로 저 리턴값이 false라면.. 역시 이제 HangIfReturns는 실행이 깔끔하게 종료되므로 저 함수의 리턴값을 정면으로 부정하는 결과가 나온다.

요컨대 HangIfReturns가 무한 루프에 빠지는지의 여부는 DoesThisProgramReturn의 리턴값에 따라 달라지는데, 이 과정에서 서로 물고 무는 구조적인 모순이 발생하는 셈이다.
이 모순은 DoesThisProgramReturn라는 함수가 존재한다는 가정으로부터 비롯되었다. 그러니 튜링 기계 하에서 다른 코드의 실행 종료 여부를 완벽하게 판단하는 코드를 똑같은 튜링 기계 기반으로 구현하는 것은 불가능하다는 것이 입증된다.

이 논리는 "정지 문제"(halting problem)이라고 불리며, 컴퓨터라는 기계의 계산 가능 범위를 고민하게 하는 매우 탁월한 통찰이다. 이걸 처음으로 생각해서 논문으로 발표한 사람이 바로 그 이름도 유명한 앨런 튜링이다.

과학 철학에서 "반증 가능한가", 천문학에서 "관측 가능한가"처럼.. 전산학에서는 "계산 가능한가, 튜링 기계를 돌려서 답을 구할 수 있는 문제인가"가 중요한 고민거리가 된다. 계산 자체가 이론적으로 가능해야 그 다음 관심사는 "실용적으로 유의미한 시간 만에 빨리 해결할 수 있는가?", 더 구체적으로는 "입력 크기 N에 관한 다항식 급의 시간 안에 해결 가능한가 (팩토리얼이나 지수 함수 급이 아니라)"라는 시간 복잡도가 될 것이다.

TSP(순회하는 세일즈맨) 문제 같은 NP-완전 문제는 이론적으로 알려진 시간 복잡도가 너무 높기 때문에 실생활에서는 적당히 성능이 좋은 다항 시간 근사 알고리즘이 쓰인다.
그래도 정지 문제는 3-SAT 문제라든가 NP-완전처럼 시간 복잡도를 따지는 증명보다는 덜 난해하고 직관적인 설명도 가능하기 때문에 수식 없이 블로그에다 증명 방식을 소개도 할 수 있다. 현실에서는 논리적으로 100% 완벽하고 헛점이 없고 100% 정확하게 동작하지는 못하지만 그래도 현실적으로 충분히 정확하고 속도도 적절한 각종 소스 코드 정적 분석 기능이 개발되어 쓰이고 있다.

Posted by 사무엘

2021/05/24 19:36 2021/05/24 19:36
, , , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1891

5 16과 5 18

1. 군사혁명

사용자 삽입 이미지

이건 우리나라의 역사를 크게 바꿔 놓은 혁명이었다. 저 우표가 나왔던 때는 당해(1개월), 그리고 1주년이었는데.. 올해는 무려 60주년이다.

원조가카는 그 암울하던 시절에 어째 자기 목을 걸고 저렇게 나라를 뒤엎어서 통째로 마개조할 생각을 했는지.. 가히 또라이 그 자체였다. 10여 년 뒤엔 이걸로도 모자라서 유신이라는 것까지 만들어 내고..
할배는 자기가 물러난 이후로 웬 미친 후계자가 갑툭튀해서 그래도 선한 독재를 하고 있는 걸 하와이에서 인지할 기회는 있었나 모르겠다.

10수 년 전부터 해 온 생각이지만, 할배는 정말 모세 같다. (넘사벽급의 위대한 초대 지도자. 홍해 -- 원자탄, 타지에서 죽음)
원조가카는 느헤미야(느 4:17, 일하면서 싸우고 싸우면서 일하고..)나 웃시야 왕(대하 26. 영농과 국방 개혁, 기계 제조) 같다.

박 정희 시절부터 사회 시스템이 바뀐 것 중 하나가 단기 대신 서기 연호이다. 그래서 당장 저 우표만 봐도 1961년에 나온 첫 버전은 날짜가 단기로 표기된 반면, 1주년 기념 우표는 서기 표기이다.

사용자 삽입 이미지

그리고 우리나라 근현대사에서 빼놓을 수 없는 중요한 사진 중 하나가 바로 이거다. 자유당 시절의 정치 깡패들이 서울 시내에서 공개 조리돌림 당하는 거. "나는 깡패입니다. 국민의 심판을 받겠습니다" =_=;;

특히 다른 깡패들은 여럿이 뭉쳐서 퍼레이드(?)를 했지만, 수괴이던 이 정재는 단독으로 제일 앞장서서 가면서 개쪽을 당해야 했다.
옆에 감시하는 사람들은 경찰도 아니고 무려 특수부대 급의 군인이었다. 알고 보니 이것 말고 다른 각도와 시점에서 찍은 사진도 여럿 전해진다.. 오오~

대한민국에서 1948년 건국 이래로 공권력에 의해 공개 조리돌림이 행해진 건 이게 유일하다. 우리나라 역사상 살인 없이 연쇄 강간만으로 사형이 선고된 건 5공 시절이 유일했듯이 말이다.
이때가 혁명일로부터 겨우 닷새 뒤인 1961년 5월 21일이었다는 것도 같이 알아 두면 좋다. 요즘은 악질 음주운전 사고 가해자나 아동 학대치사 살인범을 이런 방식으로 죄값을 좀 치르게 했으면 좋겠다.

2. 광주 사태

1980년대 노래 중에서 '바위섬'이라는 유명한 노래가 있다. 얘는 벧후 3:5-6의 without form and void 분위기를 온몸으로 외치는 노래 같다.

  • 파도가 부서지는 바위섬 인적 없던 이 곳에
    (==> 하늘들이 옛적부터 있었고 또 땅이 물에서 나와 물 가운데 서 있는 것을)
  • 어느 밤 폭풍우에 휘말려 모두 사라지고
    (==> 그때 있던 세상은 물의 넘침으로 멸망하였으되)

성경에 창 1:1과 1:2 사이에 정말 엄청난 일이 있었던 것처럼, 저 노래도 사실은 정말 엄청난 과거 사건을 모티브로 삼아서 만들어진 거라고 한다.
그럴싸해 보이지 않는가? 언젯적부터 해 온 오래된 생각인지 기억조차 가물가물하다.

5월 16일로부터 겨우 이틀 뒤는 어째 16하고는 이념적으로 완전히 딴판인 기념일이다. 이 날에 대한 나의 생각은 이렇다.

  • 소수의 북괴 공작원이 시민을 사칭하면서 진짜 시민과 군경 사이를 이간질하고 서로 오해하게 만들고, 약간만 대립하고 끝났을 사건을 악에 받친 유혈 참극으로 도지게 만들었을 가능성은 있음.
    (진실을 규명하려면 이런 거나 규명해야 하는데, 인제 와서 규명이 제대로 될 가능성은 거의 없음. 참고로 1980년대 초는 무장공비가 활발하게 드나들었으며, 동해 서해의 남부 지방까지 막 침투하고 잡히기도 하던 시절이었음.)

  • 누구 말처럼 600명씩이나 침투는 가능하지 않음. 6 25 초반의 대한해협 해전 때의 북괴 공작원의 침투 규모하고 딱 혼동한 것 같다.
    더 옛날에 북쪽에 더 가깝게 침투했던 울진-삼척 무장공비도 100여 명에 불과했고, 그것도 여러 차례 나뉘어서 침투한 것이었다.

  • 안면인식으로 30여 년 전의 광수 찾는 건 너무 심한 뱀발 무리수

  • 무기고 탈취와 탱크 조종, 능수능란한 군사 활동 자체만으로는 북괴 공작이라고 전혀 간주할 수 없음.
    저 땐 남한도 남자들이 군사 독재 하에서 군복무를 3년씩이나 강제로 했었다. 훗날 LA 폭동 때도 군대에서 배운 게 제대로 발휘됐다니까?

  • 북괴에서 띄워주고 선전한다고 해서 그게 반드시 자신과 관계 있는 사건이라는 보장도 없음.
    아웅산 테러 공작원의 존재는 생까고, 효순이 미선이한테는 평양 학교 명예 학생 임명도 하고 저런다. 이것 말고 다른 일관성 없는 반례는 얼마든지 있다.

그러니,

  • 시민군들이 몽땅 북괴 공작원 빨갱이라는 소리나, 그 반대 극단으로 진압군이 멀쩡한 비무장 시민들 가슴을 도려내고 싸이코패스마냥 총질했다는 소리는 거의 다 신빙성이 결여되는 과장 거짓이라 여겨진다. 악의적이거나, 아니면 너무 오래돼서 기억이 왜곡됐거나.
  • 도를 넘는 성역화, 그리고 반대로 도를 넘는 폄하와 비하 모두 금물. 시민 희생자를 추모할 거면 진압 군경 전사/순직자도 같이 추모해야 한다.
  • 김 일성이건 전땅크건 회고록은 공평하게 다 출간하면 된다.

그리고 무엇보다 중요한 것은..
광주 사태가 진짜로 전대갈의 쿠데타에만 반대하고 항거하는 민주화(?) 시위였다 하더라도 그건 나라를 북괴 침략으로부터 지키고 가난을 떨쳐낸 것보다 더 중요하고 시급하고 위대한 업적은 절대 아니라는 것이다.
파급력과 영향력을 따지자면 4 19 의거보다도 가중치가 더 낮다. 그냥 제주 4 3 사태나 박통 말기의 부마 항쟁 이런 것보다 급을 높게 쳐야 할 이유를 난 모르겠다.

그런데 지들이 뭐 나라를 구하기라도 한 줄 알아요. 유공자 생색 제일 많이 내고.. 뭐? 5 18 왜곡 금지법??
이딴 식으로 나오니 그때 정말로 억울하게 무고하게 오인 사격으로 죽었을 수도 있는 광주 시민을 같은 대한민국 국민으로서 추모하고 기리고 싶은 생각마저도 싹~~ 사라지게 된다.

나도 망망대해 위에 솟은 바위섬 꼭대기에서 밤에 텐트 치고 코딩 하다가 자 보고 싶다~
그리고 저 노래의 모티브인 동네는 구질구질한 피해의식 반골기질 좀 버리고(모든 사람이 그렇다는 건 물론 아님) 건전한 생각과 의식으로 "재창조" 됐으면 좋겠다.

Posted by 사무엘

2021/05/22 08:36 2021/05/22 08:36
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1890

1. 비트 연산 관련 버그

프로그래머가 살면서 설마 컴파일러의 버그를 볼 일이 얼마나 될까? 이건 마치 버스· 트럭· 택시 등 운전으로 먹고 사는 기사 아저씨가 잘 가다가 차량의 엔진 결함이나 급발진을 경험하는 것만큼이나 끔찍한 경험일 것이다.

본인은 최적화 옵션을 빡세게 주고 나면 Visual C++ 컴파일러가 비트 연산 쪽으로 유난히도 말귀를 못 알아먹는 현상을 종종 목격했다.
7년쯤 전에 VC++ 2010 기준으로 (1) bit rotate 연산을 <<, >> | 따위로 구현한 게 제대로 동작하지 않는 것을 목격했다. 그 함수만 #pragma를 줘서 최적화를 강제로 꺼야 오류가 발생하지 않았다.

그리고 2019년쯤에는 (2) WORD, BYTE 따위를 비슷한 연산으로 한데 합쳐서 DWORD를 만들려고 했는데.. 이것도 변수 내용을 강제로 로그를 찍으면 문제가 없지만 간단하게 값만 되돌리게 하면 틀린 값이 돌아왔다.
인라인 함수, 매크로 함수, 최적화 강제 해제 등 별별 방법을 써도 소용없어서 결국은 무식하게 memcpy로 값을 오프셋별로 강제 복사해서 문제를 회피해야 했다.

그 뒤, 19.5.x급으로 그 당시로서는 최신 업데이트가 적용됐던 Visual C++ 2019에서 더욱 황당한 일을 겪었다.
내가 하고 싶은 일은 8비트 char 값을 그대로 부호 없는 형태로만 바꿔서.. 즉, -3을 253으로만 바꾼 뒤 다른 산술 연산 처리를 하는 것이었다. 그런데 (3) 컴파일러가 말귀를 못 알아듣고 숫자를 32비트로 취급하면서 앞에 0xFFFFFF00를 제멋대로 붙였다.

숫자는 내가 기대한 것보다 엄청나게 큰 값으로 바뀌었으며, 프로그램은 이 때문에 오프셋 계산을 잘못해서 메모리 오류가 발생했다. 내가 아무리 강제 형변환 연산을 집어넣어 줘도 오류는 없어지지 않았다. 계산값에다가 원래는 할 필요가 없는 &0xFF 필터링을 강제로 하거나, 이 역시 최적화를 꺼야만 오류가 사라졌다. 이런..

이 세 사례는 모두 비트 연산 + 최적화와 관련된 컴파일러의 난독증이라는 공통점이 있었다. 2010으로 32비트 코드를 빌드하던 시절이나, 2019로 64비트 코드를 빌드하던 시절이나 마찬가지이니.. 딱히 버전과 아키텍처를 가리지도 않는 것 같다.

더 자세한 정황을 나열하지 못하는 이유는 이것들이 전부 방대한 회사의 코드를 취급하다가 발생한 일이기 때문이다. 그래서 동일 문제를 재연할 수 있는 최소한의 케이스를 따로 분리할 수가 없다. 그 함수만 텅 빈 프로젝트에다가 떼어내서 돌리면 당연히 문제가 발생하지 않는다.
하지만 동일 코드를 사용하여 macOS, 안드로이드 등 타 플랫폼에서 돌아가는 제품에서는 버그가 발생하지 않으니 이건 일단 Visual C++만의 문제라고 봐야 할 듯하다.

2. UTF-8 지원 여부와 미스터리한 오동작

Windows는 전통적으로 ANSI 인코딩(?) 천국이던 운영체제였다. 그래서 유니코드 자체는 진작부터 지원했지만 UCS-2 내지 UTF-16 같은 별도의 2바이트 단위 인코딩 형태로만 지원하는 것을 선호했다. 1바이트 단위 인코딩인 UTF-8의 형태로 지원하는 것에는 대단히 보수적이고 인색했다.

오죽했으면 Visual C++이 취급하는 리소스 스크립트 *.rc라든가 resource.h의 기본 포맷도 유니코드 기반으로 바뀌긴 했는데.. UTF-8이 아니라 UTF-16으로 바뀌었다. 거 참..

그래도 세월이 흐르니 마소에서도 대세를 거스를 수 없는지라, 명령 프롬프트에서 제한적이나마 65001 UTF-8 코드 페이지를 지원하기 시작했다. Windows 10 19xx 버전부터는 메모장이 기본으로 지정하는 텍스트 저장 인코딩이 UTF-8로 바뀌기도 했다.
심지어 Visual C++ 컴파일러 역시 UTF-8 인코딩의 소스 코드를 인식하기 시작했다. 단...!! 이건 2% 부족한 아쉬운 면모가 좀 있다.

바로.. 파일 앞부분에 BOM이 있을 때만 UTF-8로 인식한다는 것이다. 그렇지 않으면 그냥 ANSI이다.
소스 코드의 인코딩을 강제로 지정하는 옵션이 소스 코드 내부에 #pragma 같은 형태로 좀 있었으면 좋겠지만 그렇지는 않다. #pragma code_page라는 게 있긴 한데, C 문법을 일부 빌려 온 리소스 스크립트에만 쓰인다.
파일 내부 대신, 컴파일러의 옵션으로 /source-charset:utf-8 요런 게 존재하고, 줄여서 그냥 /utf-8이라고만 해도 된다.

생각해 보면 설정이 하나만 있는 것으로 충분하지 않다. 소스 코드 자체는 인코딩이 UTF-8인데 그 안에서 L로 둘러싸이지 않은 "한글"이라는 문자열 리터럴은 KS X 1001로, 즉 길이가 4바이트이고 전체 크기가 5바이트인 문자열을 의도한 것일 수 있다. 그렇게 실제로 의도된 인코딩을 지정하는 옵션은 /execution-charset이라고 따로 있으며, /utf-8은 두 charset을 모두 utf-8로 지정한 것과 같은 효과를 낸다.

그런데 컴파일러는 그렇게 인식시키면 되지만 에디터의 동작에 여전히 함정이 남아 있다.
BOM도 없고 딱히 한글· 한자 같은 문자도 없이 모든 문자열이 간단한 1바이트 숫자· 알파벳 따위로만 구성된 평범한 파일의 경우, Visual Studio IDE는 얘를 기본적으로 ANSI 인코딩 파일로 간주한다. 그 파일에 나중에 한글· 한자가 부주의하게 추가된다면 인코딩이 영락없이 잘못 지정될 수 있다. 이 기본 동작을 고치는 방법이 있는지는 난 아직 모르겠다.

그런데 그렇다고 BOM을 넣어 버리면..?? BOM은 Windows 동네에서나 통용되지, 리눅스 등 타 운영체제에서는 그냥 민폐 덩어리인 문자이다. 소스 파일의 앞에 저런 문자가 떡 있으면 컴파일러가 잘못 먹고 체하는 수가 있다.
그러니 한 소스를 여러 플랫폼에서 공유하는 경우, 모든 코드의 인코딩은 그냥 닥치고 BOM 없는 UTF-8로 통일하는 게 안전하다. 이 문제에 관한 한은 Visual C++이 타 빌드 툴들의 표준 관행에 맞춰 줘야 한다. BOM는 이식성을 저해하기 때문이다.

모종의 이유로 인해 Visual C++에서 소스 코드의 인코딩이 잘못 인식되면 빌드 과정에서 깨진 문자가 있다고 C4819라는 경고가 발생한다. 깨진 문자가 주석 내지 조건부 컴파일에 걸려서 어차피 빌드되지 않는 영역에 있을 때는 저게 딱히 문제될 게 없다. 단지, 문자열 리터럴 내부에 들어있던 한글· 한자가 깨지면 심각한 문제가 될 것이다.

그런데 내 경험상.. 주 번역 단위에 해당하는 소스 파일과, 걔가 인클루드 하는 헤더 파일 간에 인코딩이 다를 때도 상당히 골치 아픈 문제가 발생하곤 했다.
C4819 말고도 C4828이라고 파일의 줄 수가 아닌 오프셋 운운하면서 굉장히 기괴한 경고가 떴다. 최신 컴파일러에서는 이 경고가 삭제되었는지 조회되지도 않더라.

그리고 정말 믿을 수 없지만 컴파일러가 완전히 뜬금없는 에러를 내면서 동작을 멈췄다. 실제로 문법 오류가 전혀 없는 구문에서도 쓸데없는 에러가 발생했으며, 그 소스 파일에 실제로 존재하지 않는 칸 번호를 언급하기도 했다.
이렇게만 말하는 나도 황당하고 읽는 분들도 상황을 받아들이지 못하시겠지만.. 내가 실제로 겪은 상황이 저랬다.

이 역시 회사에서만 겪었기 때문에 정확· 엄밀하게 재연 케이스를 만들지는 못하겠다. 아까 얘기했듯이 (1) /utf-8 옵션을 global하게 준 상태에서 소스와 헤더 파일들의 인코딩이 충돌 난 것, 그리고 아마도 (2) precompiled 헤더를 쓰는 소스와 그렇지 않은 소스가 한 프로젝트 안에서 좀 뒤섞여 있는 것, (3) namespace와 using이 좀 복잡하게 얽혀서 인텔리센스도 오락가락 하는 상황인 것이 다 조금씩 영향을 주지 않았을까 생각된다.

이 난국은 모든 코드의 인코딩을 BOM 없는 UTF-8로 정리하고, 모든 코드에다가 한글로 dummy string을 만들어서 Visual Studio IDE가 파일을 ANSI (cp949) 인코딩으로 잘못 저장하는 일이 없게 조치를 취함으로써 해결되긴 했지만..
그때 그 문제가 왜 발생했으며 그 상황을 어떻게 재연할 수 있는지는 모른 채 미스터리로 남게 되었다.

회사에서는 길지 않은 기간 동안에도 이 정도의 이상한 버그를 몇 차례 경험했는데.. 개인적으로 날개셋 한글 입력기를 20여 년 가까이 만들어 온 동안은 컴파일러의 버그를 경험한 적이 거의 없다는 것이 참 신기하다. IDE야 불필요하게 다운되거나 뻗는 버그를 여럿 경험했지만 컴파일러가 문제를 일으킨 적은 없었다.
모든 코드가 깔끔하게 KS X 1001 레거시 인코딩이고, 회사 코드보다는 규모가 작고 모듈 구조가 깔끔하고, 전부 precompiled 헤더를 사용하기 때문이 아닌가 생각한다.

소스 코드의 인코딩이 UTF-8이 아니거나, UTF-8이더라도 앞에 BOM이 있는 것 자체를 경고로 처리하는 건 너무 과격할까? 그리고 #include에서 경로 지정을 /가 아닌 \로 한 걸 경고로 처리하는 옵션도 있으면 좋겠다. 이런 건 Windows 환경에서나 통용되지 밖에서는 전부 민폐 에러 요인이 되기 때문이다. 본인이 직장의 공동 작업 과정에서 종종 실수했던 적도 있는 사항들이다.

3. 인텔리센스의 오동작

끝으로, 이건 실제로 생성된 exe/dll의 동작과 관계 있는 치명적인 문제는 다행히 아니지만.. Visual C++ IDE가 텍스트 에디터에서 사용하는 인텔리센스도 일부 특이한 상황에서는 말귀를 못 알아듣고 오동작할 때가 있다.

본인이 겪은 경우는 클래스(가령 A)의 선언 내부에 MFC의 DECLARE_DYNAMIC 같은 복잡한 custom 매크로를 넣은 뒤, 곧장 private/public/protected 같은 접근 권한 지정자가 나올 때이다. 그러면 인텔리센스가 그 뒤에 이어지는 멤버 및 내부 enum/class (가령 B) 따위 선언을 파싱을 제대로 못 한다. ClassView를 보면 A의 멤버 목록에 B의 멤버들이 잘못 표시되며, B 선언 이후에 등장하는 A의 진짜 멤버들은 전혀 인식되지 않는다.

ClassView뿐만 아니라 텍스트 에디터에다 불러온 소스 코드에서도 각종 경고와 에러 밑줄이 A의 멤버들이 누락된 것처럼 쭈루룩 뜬다.
그렇기 때문에 A 클래스의 구현부에서는 인텔리센스와 자동 완성, 심벌 위치 조회 같은 기능들을 활용하지 못하면서 코딩을 꽤 불편하게 해야 한다.

이런 초보적인 문제는 Visual C++ 6 ncb 시절에나 보던 게 아니었나? 왜 발생하는지 모르겠다.
최신 업데이트를 적용한 Visual C++ 2019에서도 동일하게 발생한다. 본 컴파일러가 아니라 인텔리센스 컴파일러이니 딱히 특정 Visual C++ 컴파일러 툴킷만의 문제도 아닐 것이다.

뾰족한 해결책은 없고, 인텔리센스를 헷갈리게 하는 그 문제의 매크로를 클래스 선언의 맨 앞이 아니라 맨 뒤로 옮김으로써 문제를 회피할 수 있었다. 흠...

4. 도킹 하다가 뻗음

역시 컴파일러가 아닌 IDE 얘기이고, 옛날 버전에서만 발생하는 문제이기 때문에 지금 큰 의미는 없지만..
Windows 10 19xx대 버전부터인가 Visual Studio 2013 (그리고 아마 2015도)에서 각종 문서 편집 창이나 보조 윈도우(출력, 속성, 디버그 등등)를 어디에든지 도킹을 해서 붙이면 프로그램이 뻗어 버린다.

2010이 언제부턴가 실행될 때 Microsoft.Vsa.tlb 파일이 없다는 에러를 내는 것과 비슷한 현상인 것 같다. 그래도 얘는 정상 실행은 되고 프로그램 사용에 문제가 없는 반면, 저건 창을 내 마음대로 배치할 수 없게 만들고 프로그램이 뻗기까지 하기 때문에 상당히 심각한 문제이다.
저런 단순 UI는 운영체제건 VS건 한번 만들고 나서는 고칠 일이 없는 기능일 것 같은데.. 둘 다 내부적으로 뭘 건드리길래 이런 부작용이 발생하는 걸까..??

하긴, 더 옛날엔 Visual Studio 2005도 Windows Vista에서 실행하려면 sp1에다가 Vista 지원 추가 패치까지 설치해야 겨우 돌릴 수 있었다. 아래아한글 2005와 2007도 Vista 이후의 운영체제에서 실행하려면 업데이트부터 대판 설치해야 했었으니 이런 예가 전혀 없지는 않구나.

어떤 프로그램이 후대의 운영체제에서 단순히 GUI나 외형의 glitch 정도가 발생하는 걸 넘어 아예 뻗고 실행이 안 되는 건.. 대부분 보안 강화 때문이지 싶다. 문서화되지 않고 미래에 얼마든지 달라질 수 있는 특성이나 동작에 의존하게 프로그램이 만들어진 경우야 걔의 잘못이겠지만, 흔한 경우는 아닐 것이다.

Posted by 사무엘

2021/05/19 08:35 2021/05/19 08:35
, ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1889

1.
손으로 쇠붙이를 만진 뒤에 손에서 느껴지는 쇠비린내는 평소에 손에서 분비되는 자잘한(...) 액체 물질이 철과 마주쳐서 변질되면서 나는 냄새일 뿐이다. 금속 쇠붙이 자체는 원래 그 어떤 냄새도 나지 않는다.;;
인체의 땀도 분비된 직후에는 별 냄새가 안 나다가 나중에 세균에 의해 분해되고 부패되면서 지린내가 난다. 이와 비슷한 이치이다.

2.
하품은 통념과 달리, 꼭 산소가 부족해서 발생하는 이벤트는 아니라고 한다. 인체 자체가 이산화탄소 과다에 반응하지, 산소 부족에 반응하는 구조가 아니라는 것은 주지의 사실이다.

3.
어라..? 햇빛을 맨눈으로 보고 있으면 재채기가 나는 건.. 난 하품 할 때 눈물 나는 것만큼이나 누구에게나 똑같이 발생하는 현상이라고 생각했는데 그렇지 않은가 보다. 전체 인구의 2~30%가량에서만 발견되는 현상이라니! 게다가 유전 형질 때문인지 무엇 때문에 발생하는 현상인지 아직 의학적으로 제대로 규명도 되지 않았다고 한다.
하긴, 먼 옛날 초딩 시절에 본인은 난 밝은 낮 하늘에 뭔가 알갱이, 입자 같은 게 비쳐 보이는 게 공기의 분자-_-;;;일 거라고 생각했었다. '비문증'이라는 현상이라는 걸 알게 된 건 최근의 일이다.

4.
무산소 운동을 많이 했을 때 근육이 저리고 통증이 느껴지는 것은 젖산이 분비되어서 그런 것이라고 지난 수십 년간 과학 시간에 가르쳐져 왔으나.. 더 자세히 관찰해 보니 그렇지 않다는 것이 밝혀졌다. 주변의 칼륨 이온의 농도 때문이라고..
사실, 이런 통증은 인체가 느끼는 다른 많은 고통들과 마찬가지로 몸을 망가뜨리지 않고 보호하기 위해 발동되는 경고 신호이다.

몸을 망가뜨리기 위해 굳이 근육을 무리하게 혹사시키며 운동을 하지 않아도 된다. 사람이 꼼짝도 안 하고 시체처럼 부동 자세로 오래 있으면.. 체중에 너무 오래 짓눌린 부위가 피가 잘 안 통해서 그것만으도 저림, 가려움을 느끼게 된다. 팔이나 무릎을 굽힌 부자연스러운 자세가 아니라 최대한 편하게 누워 있더라도 이런 현상을 피할 수 없다.

그러니 정상적인 사람이라면 저절로, 심지어 자는 중에도 본능적으로 몸을 수시로 뒤척이게 된다. 그런데 척수 손상 등으로 인해 하반신/전신이 마비된 사람은 이런 통증을 못 느낀다.
몸을 그대로 잘못 방치했다간 등이나 엉덩이 일부 부위에 그 이름도 무서운 욕창이란 게 생겨서 조직이 괴사해서 썩게 된다. 이런 참사를 예방하려면 간병인이 환자의 체위를 수 시간 주기로 바꿔 줘야 한다.

뭐, 단순히 신체 부위가 피가 안 통해서 저리는 것은, 처음에 얘기했던 근육통하고는 근본이 좀 다른 얘기이지만, 어쨌든 몸을 보호하려는 의도의 통증이라는 점은 동일하다. 영화 <항거>에서 형무소에 갇힌 죄수들이 일부러 방을 빙글빙글 왜 돌았는지, 그리고 사람을 벽장에다 선 채로 집어넣고 며칠 방치하는 게 그것만으로도 왜 잔인한 고문인지 이제 이해가 될 것이다.

뭔가 굉장히 희소한 병에 걸린 어떤 사람 중에는 선천적으로 통증을 전혀 못 느낀다거나, 땀을 전혀 못 흘린다거나 하는 경우가 있다. 그게 좋은 게 절대 아니다. 위험한 줄 모르고 뜨거운 물에다 손을 담그고 있다가 손을 완전히 망가뜨린다거나, 더운 곳에서 땀을 안 흘리고 있다가 그냥 픽 쓰러지고 훅 가기 때문이다.

글쎄, 무중력 상태에서는 중력이 없고 짓눌림이란 게 없으니 욕창 걱정은 안 해도 될 것 같아 보인다만.. 그건 또 완전히 다른 방식으로 인체의 생리에 좋은 상태가 아니다.

5.
살이 찌고 체중이 늘어난 것은 비록 현대의 바쁜 사무직 직장인에게 쉽지만은 않겠지만 식탐 자제하고 운동을 많이 함으로써 고칠 수 있다. 살을 빼고 체중을 줄이고, 지방 대신 근육을 늘릴 수 있다.

그러나 관절 같은 것은 운동으로 단련 가능하지 않다. 성장이 끝난 뒤부터는 일방적으로 약해지고 퇴화만 하며 부상을 입어서 다칠 위험이 커진다. 어린 시절에는 내리막을 아무렇지도 않게 빨리 내려갔는데 나이가 들면 그런 것도 함부로 하기 어려워진다.

또한, 탈모는 현대 의학으로도 불치병으로 여겨지고 있고.. 얼굴이 자외선 맞아서 검어지고 타는 것도(한자어로 한 단어가 없을까?) 마치 노화나 단백질의 열변형만큼이나 뒤로 되돌릴 수 없는 비가역 현상이다.;; 에구~ 이런 걸 생각하면 섬뜩하고 좀 후회도 된다. 있을 때 관리를 잘 했어야지..

6.
병 중에는 환자 혼자만 앓고 마는 게 아니라, 남까지 원인균이나 바이러스를 옮기기 쉬운 무서운 전염병이라는 게 있다. 그리고 그 전파 매개라는 게 생각보다 다양하다.

  • 공기: 결핵, 홍역, 천연두/수두
  • 비말: 감기, 폐렴, 코로나19!!
  • 물/음식물: 장티푸스, 콜레라, 이질
  • 접촉/체액: 에이즈, 각종 성병, 에볼라, 파상풍

도대체 병원체가 분자 수준으로 얼마나 가벼우면 공기를 타고 날아다니며 퍼질 수 있는지 궁금할 지경이다. 공기와 비말 감염을 막으려고 마스크라는 물건이 발명되어서 현재 인류 역사상 유례가 없이 많이 소비되고 있다.

그래도 지금까지 의약학과 보건 기술이 눈부시게 발달한 덕분에 요즘은 인간의 평균 수명이 크게 늘었고, 노인도 옛날처럼 이빨 빠진 꼬부랑이가 되는 게 아니라 예전보다 많이 쟁쟁하고 건강하다. 다른 전염병으로 일찍 죽지 않으니, 암이라는 더 미세하고 고차원적인 병에 걸려 죽는 빈도가 더 늘었다.
암은 최소한 전염병은 아니다.;; 그리고 세균이나 바이러스가 아니라 그냥 암 '세포'라고 부른다.

Posted by 사무엘

2021/05/17 08:37 2021/05/17 08:37
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1888

프로그래밍에서 메모리를 가리키는 포인터라는 건.. 그 특성상 돌아가는 컴퓨터의 machine word와 크기가 동일하다. 하지만 현실에서 포인터(= 메모리 주소)를 구성하는 모든 비트가 골고루 쓰이는 일은 몹시 드물었다.

먼저, 컴퓨터의 실제 메모리 양이 포인터가 가리킬 수 있는 범위보다 훨씬 적다. Windows의 경우, 32비트 시절에는 user mode에서는 대부분의 경우 포인터의 상위 비트가 언제나 0이었던 것이 잘 알려져 있다(하위 2GB까지만 사용).
하물며 64비트는 공간이 커도 너무 크기 때문에 가상 메모리 관리 차원에서도 아직은 40~48비트까지만 사용한다. 상위의 무려 16비트가량이 쓰이지 않는다는 것이다. 램이 32GB여도 겨우 35비트면 충분하니까..

가난하고 배고프던 20세기 16비트 시절에는.. 반대로 포인터 하나만으로 겨우 몇백 KB~수 MB 남짓한 메모리도 한번에 다루지 못했다. 그래서 far 포인터니 huge 포인터니 별 삽질을 다 해야 했는데 그때에 비하면 지금은 격세지감이 따로 없다.

저렇게 상위 비트뿐만 아니라 하위 비트도 마찬가지이다. padding, align 같은 이유로 인해, 메모리 할당 함수의 포인터 리턴값이 홀수가 될 일은 일반적으로 없다. 아니, 겨우 2의 배수가 아니라 4나 8의 배수가 될 수도 있으며, 이 경우 하위 2~3개 비트도 0 이외의 값을 가질 일이 없게 된다.

그러니 포인터를 저장하는 공간에서 0 이외의 값이 들어올 일이 없는 비트에다가 자신만의 정보를 넣는 꼼수를 부리는 프로그램이 예로부터 줄곧 존재해 왔다.
이거 무슨 변태 같은 짓인가 싶지만.. 이제 막 32비트로 넘어가긴 했지만 아직 가정용 컴퓨터들의 평균적인 메모리 양이 수 MB대밖에 안 됐던 시절이 있었다. 이때는 메모리가 부족해서 하드디스크 스와핑이 일상이었다. RAM을 1바이트라도 더 아끼는 최적화가 필수였다.

가령, 다재다능한 자료구조인 빨강-검정 나무를 생각해 보자.
노드의 색깔을 나타내는 겨우 1비트짜리 정보를 위해서 굳이 bool 멤버를 추가하는 건 굉장한 낭비라는 생각이 들지 않는가? 단 1비트 때문에 구조체 패딩까지 감안하면 무려 2~4바이트에 달하는 공간이 매 노드마다 허비되기 때문이다.
안 그래도 노드의 내부엔 left/right 같은 딴 노드 포인터가 있을 것이고, 포인터 내부에 쓰이지 않는 1비트 공간이 있으면 거기에다 색깔 정보를 박아 넣고 싶은 생각이 들 수밖에 없다. 비트필드와 포인터의 union 써서 말이다.

물론, 그렇게 0으로만 채워지던 공간을 운영체제에서도 나중에 유의미하게 사용하기 시작하면.. 그 꼼수 프로그램은 재앙을 맞이하게 된다.
대표적인 예로 마소에서는 32비트 기준으로 사용자:커널이 통상적인 2GB:2GB가 아니라 3GB:1GB로 주소 공간을 분할하는 기능을 Windows에다가 추가했다.

이러면 사용자 모드의 포인터도 2GB가 넘는 영역에 접근할 수 있으며 최상위 비트가 1이 될 수 있다. 그런데 포인터의 최상위 비트를 자기 멋대로 사용하고 있는 프로그램은.. 뭐 메모리 뻑나고 죽을 수밖에 없다.
64비트 환경에서는 겨우 1비트가 아니라 상위 word 전체를 다른 용도로 전용해도 당장 이상이 없으며 이 추세가 앞으로 몇 년은 가지 싶다. 컴퓨터의 램이 256~512GB나 1테라까지 간다면 모를까..

요즘 컴퓨터야 메모리가 워낙 많고 풍족하니, 굳이 저런 꼼수를 동원하는 프로그램은 별로 없을 것이다.
하지만 저 때가 되면 또 꼼수 부리는 말썽꾸러기 프로그램과의 호환성 때문에 주소 공간을 옛날처럼 상위 16~32GB까지로 봉인하는 옵션 같은 게 또 등장할지도 모른다.;;; HIGH_DPI_AWARE처럼 LARGE_ADDRESS_AWARE 시즌 2 말이다.

여담이지만 Windows의 경우, 실행 파일은 시작 주소가 언제나 64KB의 배수 단위로 부여되기 때문에 HINSTANCE/HMODULE은 아래쪽은 무려 word 덩어리가 언제나 0이 된다. 이 특성을 이용해서 운영체제의 LoadLibraryEx 함수도 하위 몇 비트를 자기 마음대로 활용하기도 한다.

※ 나머지 메모

(1) unsigned 타입에 대해서 단항 연산자 -를 적용해서 -a 이런 값을 구하는 코드를 우연히 보고는 개인적으로 신박하다는 생각이 들었다. 흐음~ Visual C++의 경우 이건 원래 경고인데, 요즘 버전에서는 더 엄격하게 에러로 처리하는가 보다.
-a는 2의 보수의 특성상 ~a+1과(비트 not보다 1 크게) 완전히 동일한 효과를 내며, 앞에 0을 붙여서 이항 연산자로 만들어도 에러를 회피할 수 있다.

(2) ANSI C에서는 함수의 prototype을 선언할 때 매개변수 리스트에 타입만 써 넣고 이름을 빼먹으면 안 된다는 걸 최근에야 알게 됐다.
아니 도대체 왜..? 거기서 매개변수의 이름은 거의 잉여 옵션에 불과할 텐데.. void func(int);라고만 쓰면 틀리고 void func(int x);라고 아무 이름이라도 붙여야 된다는 것이다.
이건 먼 옛날에 C언어에서 void func(a) int a; 같은 구닥다리 문법이 쓰이던 시절의 잔재인 것 갈다.

Posted by 사무엘

2021/05/15 08:35 2021/05/15 08:35
,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1887

컴퓨터그래픽에서 벡터 그래픽의 반의어로 픽셀과 비트맵을 다루는 체계를 래스터 그래픽이라고 흔히 부른다. 종이가 아니라 해상도가 상대적으로 낮은 모니터 화면이 주 무대이고, 면을 채우는 기본 단위가 scan line(주사선)이라는 관점에서 정립된 용어이다.

그리고 2D 비트맵(더 정확한 명칭은 래스터..?) 그래픽 API를 보면 어떤 플랫폼용 어떤 언어의 라이브러리이든지 점과 직선, 곡선을 그리는 함수가 있고, 사각형과 원을 그리는 함수가 있다. 이게 기본이다.
점이나 사각형이야 그리는 방식이 너무 trivial하니 제끼고, 원이나 곡선을 빠르게 그리는 원리는 기하 알고리즘의 일종으로 다뤄지기도 한다. 그 단순한 직선조차도 굵기가 2픽셀 이상이 되면 중심점을 생각해야 할 것이고, 무거운 부동소수점 연산 없이 anti-aliasing까지 하면서 그린다는 조건이 추가되면 결코 쉽지 않은 일이 된다.

그리기 기능 중에서 특정 픽셀부터 시작하는 flood fill은 무척 독특한 동작이다. 기하 알고리즘이라기보다는 스택 메모리를 동원해서 컴에게 길 찾기 재귀호출 노가다를 시키는 코딩의 영역이다. 빼곡한 미로의 내부에 있는 한 점에서 flood fill을 시켜 보면 이건 본질적으로 길 찾기와 다를 바 없다는 걸 알 수 있을 것이다.

글쎄, flood fill은 그래픽 에디터에서 사용자가 내리는 채우기 명령을 구현하는 형태로나 쓰이지, 직선과 곡선, 사각형과 원처럼 그림을 그리는 구성요소로서 프로그램이 내부적으로 사용할 일은.. 정말 아주 특수한 상황이 아니라면 없을 것이다. 도형 자체를 처음부터 내부가 채워진 형태로 그려야지, 도형의 윤곽만 그린 뒤에 도형 내부의 임의의 점을 따로 주고 채우는 건 몹시 비효율적이기 때문이다.

그래서 그래픽 라이브러리에는 다각형을 그리는 함수가 있다. 다각형의 경계선만 찍찍 그리는 것이야 LineTo만으로 얼마든지 할 수 있으므로, 이런 함수는 내부가 채워진 다각형을 그리는 것이 핵심이다. 그러니 이 함수는 다른 함수와 달리, 반드시 다각형의 꼭지점들이 담긴 배열을 전달받아야 한다.
옛날 도스 시절의 베이식은 타 언어들에 비해 그래픽 모드의 접근성이 좋았지만, 정작 다각형을 그리는 API는 없었다.

그럼 다각형을 채우는 기능은 어떤 방식으로 동작하는 걸까?
이걸 구현하기 위해서는 어떤 점이 다각형의 내부에 속하는지를 판단해야 한다. 더 나아가서 이 점에서 한쪽으로 scan line을 그어 나갈 때 어디까지가 동일하게 다각형의 내부 또는 외부인지를 판단해야 한다.

이걸 판단하는 방법은 의외로 간단하다. 그 점으로부터 아무 방향으로(예: x축 양의 방향) 한없이 직선을 그을 때, 그 선이 다각형을 구성하는 선분과 얼마나 몇 번이나 마주치는지를 판단하면 되며, 이걸 판단하는 방법도 크게 두 갈래로 나뉜다. 바로 (1) 홀짝 아니면 (2) 0여부이다.

홀짝법은 마주친 선분이 짝수 개이면 다각형의 외부이고, 홀수 개이면 내부라고 판단한다. 다시 말하지만 이 가상의 선은 정말 아무 방향으로나 그리면 된다. 다각형이 모든 방향으로 닫혀서 내부에 공간이 존재한다는 사실 자체가 이 판별법의 correctness를 보장해 준다.

0여부는.. 홀짝보다 더 절묘하다. 초기값이 0인 가중치라는 걸 두는데, 마주친 선분이 우리가 그은 가상의 선을 위에서 아래로 교차한다면 가중치에 1을 더한다. 그렇지 않고 아래에서 위로 교차한다면 1을 뺀다.
이렇게 해서 최종적으로 가중치가 양수든 음수든 0이 아닌 값이 나온 점은 다각형의 내부라고 간주하고, 0인 점은 외부라고 간주한다.

0이나 홀짝이나 그 말이 그 말 같은데.. 실제로 자기네 선분끼리 배배 꼬아서 교차하지 않는 일반적인, 평범한 오목/볼록다각형이라면 어느 판별법을 사용하든 결과에는 아무 차이가 없다.
하지만 당장 오각형 별표를 한붓그리기로 그린 궤적을 줘 보면 둘은 서로 차이를 보인다.

사용자 삽입 이미지
Windows API에서는 SetPolyFillMode라는 함수가 있어서 두 방식을 모두 사용해 볼 수 있다. 더 단순한 홀짝법이 ALTERNATE이고 기본값이다. 0여부는 WINDING... Windows 1.x 시절부터 존재해 온 오래된 고전 API여서 그런지, 매크로 상수의 앞에 접두사가 붙어 있지도 않다(PFM_* 같은?? ㅎㅎ).

오각형 별표에서 별의 중앙에 생긴 공간을 보면.. 그 옆으로 다각형 경계를 나타내는 선이 어느 방향이든 두 개가 존재한다(짝수). 그런데 이들은 방향이 둘 다 오르막 아니면 둘 다 내리막이며, 이 때문에 winding value는 nonzero가 된다. 그러니 ALTERNATE일 때는 이 공간이 비워지지만 WINDING일 때는 공간이 채워지는 것이다.

그 위의 더 복잡한 꼬인 사각형도 상황이 비슷하다. 잘 살펴보면 이 궤적도 홀수점이란 게 전혀 존재하지 않으며 한붓그리기가 가능하다.
그런데 WINDING일 때는 궤적이 꼬여서 생긴 내부의 사각형 공간 둘 중에서 좌측 하단 한 곳만 채워져 있다. 그 이유는 역시 저기서만 winding value가 nonzero이기 때문이다.

일반적으로 WINDING(0여부)이 판정하는 다각형 영역은 ALTERNATE(홀짝)의 상위 호환이다. ALTERNATE가 판정하는 영역을 100% 포함하면서 일부 영역을 추가적으로 더 판정한다는 뜻이다. 그렇다고 해서 모든 닫힌 영역을 한 치의 예외 없이 몽땅 내부라고 판정하는 건 아니다.

뭐.. 현실의 벡터 그래픽에서 이 따위 선끼리 교차하는 배배 꼬인 폴리곤을 생성하는 것은 애초부터 권장되지 않는 금지 사항이다. 가령, 속이 빈 오각별을 그리고 싶으면 저렇게 보이는 대로 삼각형 다섯 개로 풀어서 표현하라는 것이다. 윤곽선 폰트 등 벡터 그래픽 편집기들은 그렇게 폴리곤의 모양을 자동으로 수정해 주는 기능도 제공한다.
그러니 이렇게 fill mode의 차이점을 미주알고주알 관찰할 일이 현업에서는 거의 없을 것이고, 이런 건 그냥 학교에서 컴퓨터그래픽스 기초를 공부할 때 이런 방식도 있다는 걸 알기만 하고 넘어가면 될 것 같다.

하지만 그게 전부가 아니다. 다각형 채우기의 기능이 더 확장되면 다음 영역에도 도달하는데, 이때 fill mode의 차이점이 다시 드러나게 된다.

1. 여러 다각형을 한꺼번에 그리기
이건 내부에 구멍이 뚫린 다각형을 그릴 수 있다는 것에 의의가 있다. 구멍은 Polygon 함수를 연달아 호출하는 것으로는 표현할 수 없기 때문이다.

Windows에는 여러 다각형을 한꺼번에 그리는 PolyPolygon이라는 함수가 있다. 그런데 아까처럼 한 다각형에서 변들이 서로 교차하고 꼬였을 때뿐만 아니라, 변은 꼬이지 않았고 여러 다각형들의 영역이 서로 겹칠 때에도 fill mode의 차이는 유의미한 동작의 차이를 만들어 낸다.

사용자 삽입 이미지

위의 그림은.. 뭐 이론적으로는 한붓그리기가 가능하기 때문에 역시 꼬인 단일 다각형으로 궤적을 나타낼 수 있다. 하지만 앞서 예를 들었던 오각별이나 그 사각형 그림과 달리, 일부 점과 점이 겹치는 건 피할 수 없을 것이다. 무슨 말인가 하면, 저 궤적을 꼭지점 좌표의 배열로 기술했을 때, 4개의 선분과 만나는 점은 두 번 등장하는 부분이 생긴다는 것이다.

꼬인 단일 다각형이 아니라 영역이 일부 겹치는 사각형과 삼각형을 서로 떼어서 PolyPolygon으로 그린 경우.. ALTERNATE(홀짝)에서는 짝수 개의 다각형에 속하는 영역은 비우고, 홀수 개에 속하는 영역만 칠한다. 그러고 보니 동작이 뭔가 XOR스러워 보인다. 각 다각형들의 꼭지점이 기술된 방향은 어느 쪽이건 무관하다 (시계 or 반시계 방향)

그러나 WINDING(0여부)일 때는 그 특성상 방향이 같은 다각형들은 겹치더라도 영역을 모두 칠한다. 겉의 껍데기가 시계 방향이라면.. 그 안의 구멍은 반시계 방향으로.. 다른 방향으로 칠해져야 구멍이 비게 된다! 다시 말하자면, WINDING에서도 위의 그림의 왼쪽처럼 중앙이 비어진 그림을 그리고 싶다면 사각형과 삼각형의 좌표 방향이 서로 반대여야 한다.
꼬인 단일 다각형에서 fill mode의 차이점을 설명하는 프로그래밍 서적들이.. 다중 다각형까지 연계해서 동일 개념을 설명하는 경우는 내가 딱히 못 본 것 같다.

2. 직선뿐만 아니라 베지어 곡선까지 포함된 궤적의 내부를 채우기
위와 같은 구멍 감지에다가 곡선 지원까지 포함되면.. 이건 뭐 윤곽선 글꼴 래스터라이저가 번듯하게 완성된다. 물론 본격적인 폰트 엔진은 거기에다 작은 크기에 대비한 정교한 안티앨리어싱과 힌팅, 글꼴 글립 캐시, 더 나아가 복잡한 유니코드 문자 형태 분석까지 추가되는데 이것들 하나하나가 별개의 전문 영역일 정도이다.

FreeType 라이브러리는 그 중에서 제일 저수준인 그리기, 안티앨리어싱, 힌팅까지만 담당한다. 요즘 소프트웨어들은 글자 하나를 찍는 것도 겨우 8*16, 16*16 비트맵 글꼴 찍던 시절과는 차원이 다르게 더 복잡해져 있는 셈이다.
그건 그렇고.. Windows API에는 직선과 곡선이 포함된 도형을 한꺼번에 그리는 것은 윤곽선만으로 한정이다. PolyDraw라는 함수가 있다.

내부를 채우는 것은 한 함수로 지원되지 않으며, path라는 걸 써야 한다. 얘는 Windows GDI가 제공하는 강력한 벡터 그래픽 라이브러리로, 직선, 베지어 곡선, 원과 원호, 심지어 다른 트루타입 글꼴의 글립까지 몽땅 궤적으로 표현해서 한꺼번에 내부를 채울 수 있다. 구멍 처리도 물론 된다.
BeginPath (그리기) CloseFigure (그리기) EndPath 이런 식으로 말이다. 위의 1과 2를 모두 할 수 있다.

내 경험상 트루타입 폰트는 WINDING 방식으로 래스터라이징을 한다. 글꼴 글립을 그릴 때부터 제일 밖의 path는 시계 방향이고, 그 안의 구멍 윤곽을 기술하는 path는 반시계 방향이고, 구멍 안의 칠하는 영역은 또 시계 방향.. 이런 식으로 디자인을 해야 한다.

허나, 예전에 MS Office 2003 이하 버전에서 제공되던 클래식 WordArt는 이 원칙을 지키지 않고 트루타입 글꼴도 홀짝 ALTERNATE 방식으로.. 짝수 회 overlap 영역은 무조건 비웠던 것 같다.
그래서 composite glyph 형태로 표현되는 비완성형 한글 글꼴에서 글립이 겹칠 수 있는 복잡한 글자를 찍어 보면 저렇게 흰 부위 glitch가 발생하곤 했다. (아래 그림에서 ㅆ, ㅠ, ㅔ 부분 참고)

사용자 삽입 이미지

Office 2007 이상부터 제공되는 WordArt는 이 문제가 해결됐다. 그리고 아래아한글의 글맵시도 0여부 WINDING 방식으로 맞게 색칠을 하기 때문에 glitch가 발생하지 않는다.

그러고 보니.. MS Office는 지난 2007때부터 그래픽 엔진이 크게 바뀌었다. 워드아트의 글자 장식 기능도 리뉴얼 됐고 PowerPoint 같은 데서도 직통으로 사용 가능해졌는데, 정작 본가인 Word에서는 2003 이하의 클래식 워드아트가 제공됐다. 다음 버전인 Office 2010부터 Word에서도 동일하게 리뉴얼된 워드아트가 제공되기 시작했다.

Posted by 사무엘

2021/05/12 08:35 2021/05/12 08:35
, , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1885

민통선 안의 마을들

우리나라 영토는 남북으로 분단되어 있다. 휴전선이라고도 불리는 군사분계선이 중앙에 있고, 거기 곁을 비무장지대와 민간인 통제 구역이 감싸고 있다. 여기 주변은 위험하기 때문에 비행 금지 구역임은 물론, 지리 정보가 민간 지도에 표시되지 않는다. 여기서 민간 지도란, 자동차 내비게이션도 포함하는 개념이다.

전자는 원칙적으로 군인과 민간인 그 누구도 들어갈 수 없고 가끔 GP를 지키는 소수의 군인들만이 경찰처럼 둔갑해서 몰래 들어간다. 그 반면, 후자는 민간인만 출입 금지이다. 거기에 조상 대대로 밭이나 묘소를 소유하고 있던 사람이 농사나 성묘 같은 정당한 볼일이 있을 때만 인근 군부대의 허가를 받고 낮 시간대에 한해 드나들 수 있다.

그럼 전국의 모든 민통선 안(= 민통선 이북)은 밤엔 군인을 제외하면 쥐새끼 한 마리 얼씬거리지 않는 암흑 지대인가 하면, 꼭 그렇지는 않다. 거기에 주민이 상주하는 마을도 있기 때문이다.

그 원조 1호는 판문점에서 제일 가까이 있고 휴전 직후부터 조성됐던 대성동 마을이다. 이 마을은 처음부터 이 근처에 존재했던 마을이며, 6· 25 정전(휴전) 협정에 따라 존재를 인정받고 보장받았다.
여기는 휴전 회담이 진행된 판문점의 근처인 덕분에, 1951년 하반기부터는 전쟁의 포화에 휘말릴 일이 없이 안전하게 지낼 수 있었다. 그 대신 여기는 우리나라가 땅을 수복하지도 못하고 오히려 방어하기 불리한 곳을 포기하게 됐음이 주지의 사실이다. 그래서 해주 반도와 개성 시내를 내어주고 북한이 서울과 더 가까워졌다.

사실 대성동 마을 일대는 민통선과 남방한계선의 구분도 아직 없어서 코앞이 군사분계선이며, 강원도 전방에다 비유하자면 아예 비무장지대 안이나 마찬가지이다. GOP도 아니고 GP가 있을 곳에 민간인 마을이 있다는 뜻이다. 그만치 엄청나게 위험하고 거주민들의 행동과 이동에 제약이 크다.

한때 우리나라 대성동과 건너편 북한의 기정동에서 국기 높이 달기 병림픽(?)을 벌인 적이 있었고, 그게 초등인가 중인가 도덕/윤리의 마지막 단원 북한 통일 문제에서 언급되기도 했다. 나중엔 남한이 그냥 gg 치고 손 떼서 북괴의 160m짜리 깃대가 한동안 세계에서 제일 높은 깃대 기록을 수립하기도 했다는데.. 구체적으로 몇 년대에 벌어진 일인지는 아무리 찾아 봐도 정확한 기록이 나오는 게 없다. 팩트 확인이 잘 안 된다.

나중에는 저기 말고도 통일촌, 해마루촌, 횡산리 등 민통선 안 마을들이 몇 곳 더 조성됐다. 아래 그림을 보시라. (☞ 출처)

사용자 삽입 이미지

이들 민통선 마을은 출입이 까다롭긴 하지만, 대성동만치 군사분계선과 북한이 코앞이고 위험하고 유엔군의 통제를 받을 정도로 수위가 높은 곳은 아니다. 그림에서도 대성동은 다른 마을들과는 성격이 다름을 언급하고 있다.

단적인 예로, 통일촌이나 해마루촌은 파주의 도라 전망대 및 제3 땅굴 임진각 안보 관광 패키지에도 포함돼 있어서 일반인이 비교적 쉽게 찾아갈 수 있다. 그러나 대성동을 아무 연고 없는 일반인이 단순 호기심 차원에서 관광..?? 어림도 없는 일이다. 그쪽의 관광 난이도는 판문점의 관광 난이도와 대등하다.

이런 마을들은 전쟁 때 원주민들이 다 피난 가면서 폐허가 되고, 그 상태로 민통선 구역으로 봉인됐다가 뒤늦게 마을로 재건되었다. 사람을 받아들일 거면, 밭은 몰라도 주택이 있는 곳은 그냥 민통선에서 해제해 주지 싶은 생각도 든다만.. 지형상의 한계나 군사 관리의 편의성 때문에 그리 하지 않은 것 같다.

철원에 이런 마을이 유난히 많은 이유는 저기가 넓은 평야를 낀 천혜의 곡창 지대이기 때문이다. 6 25 때 우리나라가 수복해 냈고 김일성이 빼앗긴 걸 통탄했을 정도인 금싸라기 땅이다. 그 유명한 민통선 안 메기 매운탕 식당인 '전선 휴게소'도 이 지대(정연리-유곡리) 사이에 있다.

그 반면, 철원보다 더 동쪽부터는 산세가 더욱 험해지고 지형이 너무 메롱이 되는 관계로, 민통선 마을 같은 게 없으며 거주민도 없다. 가령, 동쪽 끝의 고성군 수동면 같은 곳은 마을이 산과 휴전선으로 완전히 고립되게 생겼으니 주민들이 모두 이주하게 되었다. 그래서 거기는 주민이 전무하여 사문화된 행정구역으로 전락했다.

그림에 표시된 마을들 중에서 마현1리는 혼자 조성 시기가 1959년인 게 이색적이다. 얘는 바로 그 시기에 나라의 동남부 지방을 깡그리 삭제해 버린 태풍 ‘사라’의 피해 이재민들이 이주해서 개척한 마을이기 때문이다.
어느 지역이냐 하면 부산이 아니라 무려 울진이다. 1963년 이전엔 울진이 경북이 아니라 강원도 소속이었던 관계로, 강원도 도지사가 이재민들에게 이 참에 정부 지원금도 받아서 같은 강원도인 철원으로 이주를 주선했다..;;

그렇게 66세대 359명의 주민들이 군용 트럭 23대를 나눠 타고 저 마을로 가는 데만 3박 4일이 걸렸다고 한다. 그 시절에 울진에서 철원까지 가는 경로에 아스팔트로 잘 포장된 도로 따위는 없었으니까..
그리고 그들은 한동안 군용 텐트에서 살면서 근성으로 황무지를 일궈서 밭을 만들었다. 여기가 한때 격전지였던 관계로 땅 조금 파면 탄피들이 무슨 광물처럼 튀어나왔나 보다. 그걸 주워 팔아서 입에 풀칠을 했다.

그랬는데 이듬해 봄엔 이 승만 정권이 갑자기 무너지면서 마을에 파격적인 지원을 약속했던 강원도 도지사와 철원 군수는 모두 교체됐다. 이 사람들이 마현1리에 정착한 때가 1960년 4월 7일이니 4 19 의거로부터 겨우 두 주 전... 말 다 했다. =_=;;
그리고 기껏 고생해서 밭을 일궈 놨더니 여기에 진짜 원래부터 살았던 원주민이 찾아와서 땅 내놓으라면서 소송을 걸기도 했는데.. 이 때문에 자금이 부족한 입주민은 여기서도 소작농 신세로 전락하기도 했다.

이 마현1리 이주민촌은 30년전 경상도지방을 휩쓸고 지나간 태풍 사라호 (59년9월17일)에 가옥과 전담을 모두 떠내려보낸 경북 울진군 일대의 농민 66가구가 정든 고향을 등지고 새 삶을 시작한 곳이다.
(...)
조국강토의 중심에 있으면서도 동족상잔의 흔적만을 안은채 갈가리 찢겨버려져 있던 민통선 안쪽 황무지.
10여 년 전까지만 해도 기름진 철원 평야의 한 부분이었지만 이들이 도착했을 때는 우거진 잡초더미와 6·25가 남겨준 온갖 잔재들만 눈앞에 가득할 뿐이었다.

간간이 들려오는 국군과 인민군의 훈련 포성에 몸을 떨며 군용 천막을 치고 개간의 삽질을 시작했다.
부르튼 손으로 잡목과 온갖 무기 파편·돌등을 제거하고 우거진 싸리숲을 없애기 위해 몸에는 상처가 가실 날이 없었다.

곳곳에 처박혀있는 불발포탄의 위험 속에서도 『이 땅을 일구어야만 살 수 있다』는 생각에 개척의 삽질은 끝없이 이어졌다.
눈앞의 황무지가 옥탑으로 변할 생각을 하며1인당 2·5홉씩의 배급잡곡으로 허기진 배를 달랬다. (☞ 출처)


이때 선조들이 얼마나 고생했으면.. 그로부터 30여 년 뒤인 1989년, 마현리 주민의 세대가 바뀔 즈음에 건립된 입주기념비에는 "그대들은 알아야 한다. 조국강산의 가장 중심된 이 농토가 누구의 피땀으로 가꾸어졌는가를…. 괭이와 호미로 6·25 동란 이후 버려진 황무지를 옥토로 가꾼 개척 정신의 빛나는 업적을 우리는 알아야 한다"라는.. 정말 피를 토하는 듯한 비장하고 처절한 문구가 새겨져 있다.

핵심은 대성동 말고도 민통선 안에 자리잡은 민간인 마을이 있다는 것, 그리고 그 중에서도 마현리 주민들은 실제 이곳 출신이 아니며 오히려 진짜 여기 원주민들과 분쟁을 겪었다는 것이다. 이에 대해서 더 관심 있으신 분은 다음과 같은 다양한 기존 보도 자료들을 참고하시기 바란다. (☞ 링크 1, 링크 2, 링크 3, 링크 4)

그리고 요즘은 마현리는 주변의 밭은 몰라도 마을 자체는 민통선 안이 아닌 것 같다. 국도 5호선에서 멀쩡히 진입할 수 있고 마을 내부도 버젓이 로드뷰가 제공되고 있기 때문이다.
그러나 주변의 이길리에 소재한 마을은 민통선 안이다. 72~73년에 조성된 민통선 마을들, 특히 이름이 대놓고 통일촌이라고 지어진 저 마을은 임진각이 건립되면서 같이 만들어진 거라고 생각하면 되겠다.

해마루촌은 시기가 시기인 만큼 김 대중 대통령의 햇볕 정책 내지 경의선 연결과 같은 맥락에서 조성된 실향민 마을이다. 상공에서 보면 마을 도로가 높은음자리표 모양으로 꼬불꼬불하게 만들어져 있는 걸로 유명하다.

끝으로, 철원도 아니고 서쪽 끝도 아닌 중간(연천)에 마을이 딱 하나 있는 게 연천의 횡산리이다. 시기도 혼자 1977년으로 따로 떨어져 있는데.. 얘는 임진강과 군사분계선의 선형이 굉장히 교묘하게 꼬이는 곳에 있어서 뭔가 섬 같은 느낌이 들며, 제2의 대성동처럼 느껴지기도 한다.
여기는 특별한 사연 없이 원래 여기서 살던 사람들이 나중에 민통선 마을이 조성됐다는 소식을 듣고 되돌아온 경우가 대부분이라고 한다. 정확하게는 1977년, 1985년 두 차례에 걸쳐서이다.

이상이다.
대성동 마을의 주민이 납세와 병역의 의무가 면제된다는 건 이제 다들 알려질 대로 알려져 있다.
그런데 나무위키에는 거기뿐만 아니라 저런 다른 민통선 마을 거주민에게도 같은 혜택이 적용된다고 쓰여 있는데.. 실제로 그러한지 법적 근거를 잘 모르겠다.

병역법이나 병역법 시행령 등 관련 법을 아무리 찾아봐도 장애인이나 탈북자가 면제이지, 저 지역 출신에 대한 언급은 딱히 안 나오기 때문이다.
또한, 육지 말고 바다 쪽 민통선도 생각해 봐야 한다. 교동도는 통제가 아주 느슨하긴 하지만 그래도 민통선에 속한 곳이며, 백령도나 연평도 같은 서해5도도 개념적으로 대성동 및 타 민통선 마을에 준하는 특이한 오지이다. 그러니 면제 혜택을 주려면 그쪽과의 형평성도 생각해야 한다.

물론 저 정도로 특이하게 사는 극소수의 사람들한테, 부정 수급의 가능성도 전무한 혜택을 주는 것 자체야 형평성 불만이 제기될 여지가 없다. 다만, 아무리 생각해도 다른 민통선 마을들과 대성동을 완전히 같은 급에 두는 건 좀 아닌 것 같다.

지난 2019년경엔 대성동 마을 토박이인 어느 친자매(유 수빈· 유 정빈)가 대학 졸업 후에 무려 여군 장교를 같이 나란히 지원해서 매스컴을 탔다. (☞ 관련 링크)
남자였어도 합법적으로 군대를 안 갈 수 있는 신분인데 여자가 그것도 언니와 동생 둘 다 군대 쪽으로 진로를 정했다니 매우 특이한 경우가 아닐 수 없다. 어릴 때부터 맨날 군인들을 보고 살았는데 자기도 그런 군인처럼 남을 돕는 사람이 되고 싶다고 포부를 밝혔다..; 세상엔 이런 일도 있었다.

Posted by 사무엘

2021/05/09 08:33 2021/05/09 08:33
, , , , , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1886

1. 소멸 위기? 제주어

한 1990년대, 한국어에 대해서 우랄 알타이 어족 기원설이 유효했고 학교에서도 가르쳐지던 시절엔..
"바른말 고운말을 씁시다, 한글을 사랑합시다, 한자어와 외래어보다는 가능한 한 순우리말을 살려 씁시다, 특히 일본식 한자어를 순화합시다" 같은 계몽 운동이 많이 벌어지고 있었다.

이런 운동을 하는 사람들 중에는 아마추어뿐만 아니라 국어학 교수 타이틀까지 거머쥔 전문가도 있었다.
심지어 이때는 "미래(21~22세기)엔 세계 언어들의 90% 이상이 사멸할 것이다. 지금부터 정신을 바짝 차리지 않으면 한국어도 외국어에게 잠식 당해 사멸할지 모른다"라고.. 거의

  • 정신을 바짝 차리지 않으면 북괴가 다시 남침해서 적화통일 될지 모른다,
  • 일본에게 나라를 다시 빼앗길지 모른다
  • 지금 이 상태로 문화건 농산물이건 영화건 공산품이건 시장을 확 개방했다간 다 빼앗기고 내수 시장은 망할 것이다
  • 한국은 UN이 지정한 물 부족 국가이다. (...!!)

이런 급의 괴담이 언어 분야에서도 나돌기도 했다.
지금은 교통· 통신의 발달과 함께 영어가 그야말로 넘사벽 급의 세계 공용어가 됐으며, 반대급부로 소수 민족 언어들이 야금야금 사멸하고 있는 건 사실이다.

언어 순수주의에 입각한 계몽 운동에 대해 이해 못 하는 바는 아니다. 언어의 어휘와 문법 구조는 이미 사람의 생각과 정신 세계에 끼치는 영향이 결코 작지 않다. 문법 차원에서 단· 복수를 엄격하게 구분하는 언어, 성별 구분이 있는 언어, 높임법이 존재하는 언어.. 이런 것 말이다.

그러니 말과 글과 얼이 하나라는 말까지 나왔으며, 멀쩡한 자국어 어휘가 외국어에게 잠식 당하는 게 마치 자국 정신 세계의 영토를 침략자에게 빼앗기는 것과 비슷한 급의 위기라고 생각하는 것이다. 더구나 20세기 초중반 우리나라의 너무 처절하고 비극적이었던 역사에 대한 트라우마가 이런 식으로 투영되어 들어가기도 했다.

하지만.. 지금은 100여 년 전처럼 식민지 제국주의 군국주의가 횡행하는 시기가 전혀 아니며, 더구나 우리나라는 세계 10위 안팎의 국력과 지위를 자랑하는 상위권 선진국이다.
극심한 저출산 때문에 미래가 걱정되긴 하지만 지금 대한민국의 인구가 소수 민족 수준인 것도 아니며, 한류다 뭐다 하면서 오히려 한국어를 배우는 외국인도 있다.

그러니 한국어는 듣보잡 소수 민족 언어와는 처지가 다르다. 예측 가능한 짧은 미래에 사멸을 걱정해야 할 처지인 언어는 절대 아니다.
또한 고유어나 외래어, 언어 순수주의에 대해서는 본인은 공감하는 것도 있고, 별 영양가 없으니 그 정도로 민감하게 반응할 필요는 없다고 선을 긋는 사항도 있다.

사실, 멀쩡히 잘 쓰이던 고유어가 외래어에 먹힌다기보다는 애초에 고유어에 전혀 존재하지 않던 새로운 개념 내지 변별이 안 되는 개념 때문에 외래어가 쓰이는 것이 훨씬 더 많다. 내가 좋아하는 분야의 예를 좀 들자면 로켓이나 제트 엔진 같은 건 도대체 무슨 수로 순화할 생각인가?

정말 순우리말을 살려 쓰고 싶으면 멀쩡히 잘 알아들을 수 있는 컴퓨터, 인터넷 이런 말을 셈틀, 누리그물 따위로 바꾸는 것보다.. '장'이 너무 답답하고 변별력이 떨어져서 페이지/챕터라고 바뀌는 것부터 막는 게 '훨씬' 더 시급하다! 이건 뭔 한자 따위 동원한다고 해결 가능한 문제가 아니다.

너무 까다롭고 거추장스러운 호칭과 격식을 파괴하기 위해서 '너님', 심지어 극단적으로 '유님'(you)이라는 말이 생겨서 아무나 간편하게 가리키는 중립적인 2인칭 대명사로 통용된다면.. 그건 오히려 바람직한 현상이다. 이에 대해 누가 국어 파괴니 깐죽거리며 감 놔라 배 놔라 오지랖 부릴 수 없다.

글쎄, 그런 것 말고 붉은피톨· 말본 셈본· 넘보랏살 같은 순우리말 용어를 괜히 천하고 경박스럽다고 생각하고 한자어· 영어 용어만 자연스럽게 받아들이는 것 자체가 나조차 이미 의식 세계가 외국어 외세에 침략(?)을 당하고 세뇌 당하고 더럽혀진 결과인 건지는 모르겠다.
하지만 이런 침략을 당한 덕분에 초록(green)과 파랑(blue)을 언어적으로 구분할 수 있게 됐다면 그건 꼭 나쁜 침략만은 아닐 것 같기도 하다. =_=;;;;

본인은 이 주제에 대해서 저런 것 말고도 오랜 지론과 할 말이 많이 있다. 하지만 시간과 지면의 부족으로 인해 이 자리에서 더 자세히 다루지 않겠다.
그리고 이런 단어 수준이 아니라 언어 정체성 레벨에서 정말로 사멸을 걱정해야 하는 대상은 한국어 자체가 아니라 한국어의 방언 중 하나인 '제주어'인 것 같다.

저런 게 있다는 것, 정확하게 표기하기 위해서 아래아가 쓰인다는 것 정도는 어렴풋이 들어서 알고 있었다. 그런데 제대로 구사하는 걸 들어 보니 이 정도로 이질감이 큰 방언인지는 몰랐다. 차이가 더 벌어졌으면 북경어 vs 광동어 정도로 벌어졌을 수도 있을 것 같은데.. (☞ 푸른거탑 제주어 버전;)

천상천하 유아독존 고립어인 줄로만 알았던 한국어에도 이 정도로 편차가 큰 지역 바리에이션이 있었다니~! 이건 고대/중세 국어의 모습은 어땠을지에 대한 통찰도 제공할 수 있겠다.

예전에(2000년대쯤..) 제주어를 제대로 채록하기 위해서는 컴퓨터에서 아래아를 입력할 수 있는 한글 입력기가 있어야 한다고 '김 익두'라는 분이 인터넷 상으로 활동을 많이 하셨다. 본인에게도 문의를 하신 적이 있었던 걸로 기억하는데 지금은 먼 과거의 일이 되었다. 그분이 지금은 뭘 하고 계시나 모르겠다.

2. 질적 저하? 사이소리

영어에 2음절 이상의 단어마다 악센트라는 게 있다면, 한국어에는 사이소리라는 아주 아주 기괴한 초분절요소가 존재한다.
이건 높임법만큼이나 한국어의 맞춤법과 발음법, 학습 난이도를 크게 끌어올리는 주범이다. 전에도 몇 번 언급한 적이 있지만..

  • 성과는 성꽈이고 결과는 왜 결과인지..?
  • 물고기는 물꼬기인데 불고기는 왜 불고기인지?
  • 비빔밥은 비빔빱인데 볶음밥은 왜 그대로 보끔밥인지?

이건 아주 작은 예일 뿐이다. 정말 도무지 원칙이 없고 답이 없다.
더 골때리는 예를 들자면.. 0, 1, 부터 9(영, 일, ..., 구)까지의 숫자 뒤에 '단, 단계, 반, 점' 같은 단위 접사를 붙여 보자. 6이야 받침이 ㄱ이니까 언제나 된소리화가 발생하겠지만 나머지 숫자들은 도대체 언제 사이소리가 들어갈까?

내 언어 직관에 따르면 ㄹ 받침인 1, 7, 8은 언제나 '딴계, 쩜'으로 바뀐다. 하지만 교실을 나타내는 '반'은 사이소리가 전혀 들어가지 않는다. 도대체 왜? 이러니 한국어를 공부하는 외국인 학습자가 뒷목 잡지 않을 수 없다.
물론 사이소리 정도는 꼬박꼬박 정확하게 넣지 않아도 의사소통에 큰 지장은 없다. 하지만 원어민 화자가 듣기에는 충분히 어색함과 이질감과 부자연스러움을 느끼게 된다.

그런데 과거에는 이렇게 사이소리가 불필요하게(?) 들어가서 된소리가 발생하고 어감이 강해지는 걸 아주 부정적으로 보고 경계하는 시각이 지배적이었던 것 같다. 그러지 말아야 한다고, 국어 교육 제대로 다시 시켜야 된다는 의견이 이미 1970년대에부터 신문에 실리곤 했다. 관심 있으신 분은 네이버 뉴스 라이브러리에서 '된소리'라고 쳐서 검색 한번 해 보시라~~

라떼는 말이야 ‘간단하게’도 그냥 평범하게 ‘간단하게’라고 부드럽게 발음했는데 사람들이 어느 샌가 ‘간딴하게’라고 무슨 북괴가 ‘원수’를 ‘원쑤’라고 발음하는 걸 닮아 가고 있다고.. 이런 걸 방치하면 사람들 정서가 망가지고 심성이 병들고 가정이 무너지고 사회가 무너질 수 있다는 식이다.
저게 도대체 뭔 소리인가 싶지만, 저 때는 선풍기 괴담이나 일제 쇠말뚝 괴담 따위가 진지하게 받아들여지고 있었고, 저질 불량 만화 화형식도 하던 시절이었다.;;; 언어에 대해서도 이 정도의 순수주의로 접근하는 분위기가 주류이긴 했을 것 같다.

바로 이런 생각을 하는 사람들이 방송 같은 데서 반드시 강조하는 게 뭐냐 하면 ‘효과’, ‘김밥’도 절대로 ‘효꽈’, ‘김빱’이라고 둘째 음절을 경음화하지 말라는 것이다. 실제로 이 단어들은 표준 국어 대사전에 발음이 경음화하지 않는 게 맞다고 기재되어 있다. 그리고 방송 기자라는 사람들이 그 업계 입사를 위해서 KBS 한국어 시험 같은 건 머리 싸매고 준비했을 테고..

하지만 개인적으로 저건 굉장히 어색하고 비현실적이고 부자연스럽게 들린다. 본인은 억지스러운 경음화 금지에 반대 소신이다.
‘짜장면’을 자장가 발음하듯이 억지로 자장면~~ 이러고, 영어에서 speak를 ‘스삐이크’ 대신 ‘스피이크’ 이러는 것과 비슷하게 들린다.

마치 다르다/틀리다처럼 뭔가 합리적이고 예측 가능한 구분 원칙이 존재해서 그걸 근거로 이때는 경음화하지 말라고 한다면 따르겠는데..
앞서 얘기했듯이 한국어의 사이소리라는 건 그 어떤 날고 기는 국어학자도 규칙으로 예측과 통제를 해내지 못한 난감한 물건이다. 수학에다 비유하면 거의 '소수(솟수??)의 생성 규칙'만큼이나 말이다!!

어차피 아무렇게나 임의로 정하기 나름이고 익숙해지기 나름일 뿐인 사항이라면 그건 그냥 시장에게 맡기고 자유방임을 허용해야 한다. 인위적이고 부자연스러운 언어 갑질 꼰대질에 난 공감할 수 없다.
심지어 반대 사례도 있다. 나는 ‘교통 체증’도 글자 그대로 ‘체증’이라고 오랫동안 발음해 왔지, 표준 발음이 반대로 ‘체쯩’인 것은 최근에야 알게 됐다. 병을 나타내는 ‘증’과 증명서를 나타내는 ‘증’에서 둘 중 하나는 경음화가 발생하는 건지는 잘 모르겠다. (영수증? 영수쯩?)

사이소리가 참 더럽고 구리게 형성되어 있긴 하지만, 이런 것들이 몽땅 다 ‘원쑤’ 같은 부정적이고 잘못된 현상은 절대 아니다. 대부분의 경우, 사이소리는 형태소 경계(파생어 접사와 어근!!)를 구분하고, 한자 동음이의어를 구분하고, 보통명사와 일반명사를 구분하려는 사람들의 매우 복잡미묘한 심리가 반영되어 들어간다.

한자어에서 사이소리를 최대한 표기하지 않는 쪽으로 찍어누르면서 맞춤법을 정했지만, ‘초점’(focus)의 발음은 지구가 멸망하는 일이 있어도 ‘초쩜’이지 ‘초점’이 될 수 없을 것이다.
‘소수’의 경우도 마찬가지다. 소수점이랑 적은 수는 일말의 유사점이라도 있지만 prime number는 정말 아무 관계 없는 의미인데 표기를 저 따위로 해 놓으면.. 정말 답이 없다. 한자 아니면 영단어로 가야지..

이렇게 애초에 사이소리라는 게 한국어에서 없어질 수 없는 요소일진대, ‘효과’를 결과가 아닌 성과처럼 보고 ‘꽈’라고 주류 발음이 바뀌는 것은 그냥 취향의 변화일 뿐이다. 옳고 그름이라는 가치 판단의 대상이 아니라고 본다.
미래에는 하나님의 발음조차도 '하난님'으로 바뀔 수 있다. 사이소리라는 게 꼭 된소리화만을 의미하는 게 아니다. 개인적으로는 이렇게 rule 기반으로 기술할 수 없는 사이소리야말로 다량의 데이터를 기반으로 패턴을 연구할 필요가 생각한다.

성우 겸 배우 이 종구 씨는(1950년생) “오글거리게 효과효과 그러지 말고 평소대로 소신껏 효꽈라고 발음합시다”라고 이미 옛날부터 글 쓰고 홍보를 많이 해 온 걸로 유명하다. 이분 역시 우리말의 올바른 표현과 표준 발음 쪽으로 관심 많고 소신을 갖추신 분이다.

그런데 ‘간단하다’는 ‘간’과 ‘단’을 쪼개서 생각할 여지가 없고, 비슷한 형태의 다른 단어들을 생각해 봐도 정말로 굳이 ‘간딴’이라고 발음할 필요가 없어 보이긴 한다. 그런데 왜 어쩌다가 경음화된 발음이 주류가 돼 버렸나 모르겠다. 옛날에 처음부터 그러지는 않았는데 진짜로 일제 말기와 6 25를 겪으면서 사람들 심성이 피폐해져서 ‘간딴’으로 바뀐 걸까..??? 이건 정말 의문이라 하겠다.

Posted by 사무엘

2021/05/06 08:34 2021/05/06 08:34
, , ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1884

다음 버전 개발 근황

날개셋 한글 입력기의 다음 버전은 6월 언젠가 정도로 계획하고 있다.
획기적인 새 기능까지는 아니지만 지금까지 자잘하게 개선된 사항들, 그리고 새 버전 정식 공개 전에 미리 알릴 필요가 있는 변화 사항들을 나열하면 다음과 같다.

1. 크롬 브라우저 버그가 이제 크롬 쪽에서 해결된 듯

오~ 크롬 브라우저--요즘은 같은 엔진 기반인 Edge도 포함해서--가 어째 정신을 차렸는지..
지난 4월 하순쯤의 버전 90대 최신 업데이트를 받고 나니, 한글 조합 중에 딴 데를 클릭했을 때 자기 혼자 조합이 덧나는 등의 잡다한 오동작이 싹 없어졌다.
그래서 이제는 내 입력기에서 기본적으로 제공하던 보정 옵션은 "반대로 꺼 줘야" 조합이 사라지는 오동작이 발생하지 않겠다.

지난 9.x 대 후반부터 거의 2년 동안 크롬과 내 입력기와의 악연이 계속돼 왔다.
물론 내 입력기도 마소 기본 IME하고는 다르게 동작하는 게 있긴 했겠지만.. 그래도 내 입력기에 대해서도 지금까지 그렇게 동작한 특이한 프로그램은 역사상 크롬(크로뮴 엔진)밖에 없었다.

IME/TSF 담당 개발자가 수시로 교체되기라도 했는지.. 크롬은 혼자서 여기저기서 갖~가지 자잘하고 기괴한 오동작들을 일으키면서 날 귀찮게 해 왔다.
한때는(1년 전쯤 버전??) 누가 언제 소스의 어디를 건드렸는지, 메트로 앱이 아닌데도 메트로 앱이라고 IME에게 거짓 보고를 하기도 하고, TSF를 제대로 지원하지 않는데 지원한다고 거짓 보고까지 했었다. (지금은 다 고쳐짐)

그럼에도 불구하고 크롬은 날개셋과는 비교가 되지 않는, 그야말로 전세계 전지구 넘사벽급 메이저 프로그램이라는 게 문제.. 내 프로그램이 수동 보정으로 크롬의 동작에 맞춰 주는 수밖에 없었다.
그랬는데 드디어 크롬 쪽에서 문제를 해결한 것으로 보인다.

심지어는 지난 3~4월 사이엔 한글 조합을 종료하면 이전에 입력했던 글자들이 쭈루룩 삽입되는 오동작도 가끔 발생한다고 본인에게 버그 신고를 하신 분이 있었다.
이걸 본인도 잠깐 확인하긴 했다. 하지만 정확한 재연 경로를 파악하지 못했으며, 특히 업데이트를 받은 뒤부터는 그 문제를 다시는 재연하지 못하고 있다. 그래서 이건 일단 '공소권 없음'으로 사건을 내사 종결하고자 한다. 혹시 크롬 최신 버전 + 날개셋 10.2에서 저 문제를 또 재연 가능하신 분은 알려 주시면 좋겠다.

이로써.. 혼자서 독보적인 수동 보정 옵션을 필요로 하는 특이한 프로그램의 끝판왕으로는 사실상 Windows Terminal밖에 남지 않았다. 얘는 버전업도 하지 않는지, 오동작 현상을 처음으로 확인했던 1년 전이나 지금이나 변함없다.

수동 보정 옵션이 갈수록 내용이 적어지고 궁극적으로는 필요 없어지는 날이 왔으면 좋겠다.
그럼에도 불구하고 이번 버전에서는 수동 보정 UI를 이렇게 쇄신했다. 증상, 조건, 주 적용 대상을 일목요연하게 나열하고, 보정 대상인 이상 동작을 심지어 움짤로도 표시하게 했다.

사용자 삽입 이미지

2. 확대 배율(DPI)이 서로 다르게 지정된 다중 모니터 환경에 대한 지원

결론부터 말하자면.. 날개셋 외부 모듈에서 제어판을 꺼냈는데 이 창을 DPI가 다르게 설정된 모니터로 옮겼을 때 각종 컨트롤들 배치가 엉망이 되는 문제를 "일단은" 해결했다. 알고 보니 이건 Windows 10의 대략 2017~18년도 버전 때부터 존재해 온 문제였다.

옛날에 컴퓨터 모니터의 해상도가 낮던 시절에는 확대 배율이라는 건 거의 건드릴 일이 없었으며, 그냥 시각 장애인을 위한 잉여 옵션에 지나지 않았다. 이걸 바꾸려면 운영체제 재부팅/재로그인도 해야 했다.
그랬는데 2000년대 이후로는 이게 재부팅 없이 간편하게 설정 가능한 옵션으로 바뀌었으며, 심지어 모니터별로 서로 다르게 지정도 할 수 있게 됐다. 응용 프로그램에 요구되는 준비 수준도 점점 더 높아졌다.

  • (1) 가변 DPI 자체를 지원할 것: 이를 지원하지 않는 프로그램은 100% 외의 배율에서는 창 크기가 기계적으로 확대되어 뿌연 저화질로 표시된다.
  • (2) 프로그램 실행 중에 DPI 설정이 바뀌는 것을 유동적으로 지원할 것: 이를 지원하지 않으면 DPI 설정 변경 뒤부터는 역시 보정 샌드박스가 발동되어 뿌연 저화질크리.
  • (3) 이 모니터에 있던 창을 저 창으로 옮김으로써 DPI 설정이 바뀌는 것을 유동적으로 지원할 것(창 크기 변경까지 포함!!). 아예 한 프로그램 안에서 윈도우별로 DPI 설정을 따로 관리할 것.

그런데 날개셋 한글 입력기는 주요 UI에서 16 아니면 24픽셀로 크기가 고정된 비트맵 글꼴을 사용한다. 둘 중 하나를 고른 뒤에는 다른 걸로 변경이 전혀 불가능은 아니지만 좀 난감한 형태이다.

그리고 이것보다 더 큰 문제로.. 날개셋 제어판은 창 크기를 사용자가 유동적으로 조절 가능하며 대화상자 안에 또 대화상자가 들어있는 꽤 복잡 정교한 물건이다. 다른 프로그램들은 도대체 어떻게 동작하는지 모르겠지만, 이런 데서 화면 DPI가 바뀔 때마다 내부적인 수치 계산을 정확하게 다시 해 주는 것, 그리고 운영체제가 대화상자에 대해서 내부 컨트롤들을 바뀐 크기와 위치대로 재배치하는 것이 영 정확하게 연계해서 동작하지 않았다.

이 두 가지 난관 때문에 날개셋 편집기 등의 프로그램들은 가변 DPI를 어쩔 수 없이 최소한의 기본인 (1) 수준만 지원하고 있다.
허나, 날개셋 외부 모듈은 메모장, 크롬 등 가변 DPI를 (3) 수준까지 다 지원하는 프로그램에서도 동작해야 하는데.. 대화상자 창 크기가 바뀌었을 때 자체적으로 컨트롤을 재배치하는 기능과 운영체제가 DPI 변화로 인해 컨트롤을 재배치하는 기능이 충돌해서 정말 굉장히 이상한 오동작이 발생하고 있었다.

둘을 조화를 이루는 방법을 아직까지는 못 찾았다. 그냥 운영체제의 기능을 꺼 버리고, 어느 모니터에서나 가변 DPI를 고려하지 않고 동일한 픽셀 크기로 대화상자가 표시되게 함으로써 오동작을 회피했다. (3)은 이제 어떤 경우에도 뿌연 저화질 대화상자가 표시되지 않는 모드이기 때문에 이것 말고 다른 선택의 여지가 없다.

3. 나머지 자잘한 개선 사항

(1) 날개셋 한글 입력기에는 "지정된 데이터에 들어있는 한글"만 입력 가능하게 하는 제약 기능이 있는데.. 그 데이터는 후보 변환 데이터와 마찬가지로 직접 입력해서 내장시킬 수도 있고, 외부의 텍스트 파일을 지정할 수도 있다.
그런데, 텍스트 파일을 지정하고 나면 그 파일의 내용도 설정 대화상자에서 곧장 표시되어서 확인 가능하게 했다. 아래 스크린샷을 참고할 것.

사용자 삽입 이미지

(2) "부수로 한자 입력" 도구가 호환용 한자는 크기를 약간 줄여서 표시하게 했다. 호환용 한자는 대부분 검정색 상용 한자에 있지만, 아주 드물게 그렇지 않은 것도 있다.
그리고 특정 부수에 속하는 한자들이 모두 표시된 경우, BMP 한자 한정으로 이 한자가 부수를 제외한 획수가 몇 획인지도 툴팁에 같이 나오게 했다.

사용자 삽입 이미지

(3) 제어판의 시스템 계층에 있는 "... 자동으로 띄울 입력 도구" 목록은 체크를 하다 보면 선택 막대가 자꾸 진하게 덧칠되는 문제가 있었다. 이건 엄밀히 말하면 오로지 Windows 10만의 버그이다. 그 전의 XP, 7, 8.1 등 그 어떤 버전에서도 이런 현상이 없었다.

사용자 삽입 이미지

그랬는데.. Windows 10에서도 이 현상을 회피하는 방법을 우여곡절 끝에 찾아내서 그걸 내 프로그램에다가 적용했다.
허나.. 그 방법은 이젠 공용 컨트롤 6이 적용되지 않은 옛날 레거시 프로그램에서는 또 다른 화면 잔상 부작용을 일으키는지라, -_-;; 이건 조건부로 제한적으로 적용해야 했다. 살다 살다 이런 지저분한 버그는 참 오랜만에 다시 본다. -_-

(4) 날개셋 편집기에서 따옴표(") 다음에 한 줄의 길이보다 더 긴 영어 알파벳을 늘어놓으면.. 단어 전체가 다음 줄로 밀려나고 원래 줄에는 따옴표 하나만 달랑 남던..-_- 이상한 문단 정렬 방식을 개선했다.
15년도 더 전, 2.x, 3.x 버전 시절부터 이렇게 동작했던 것을 바로잡았다.

사용자 삽입 이미지

Posted by 사무엘

2021/05/03 08:34 2021/05/03 08:34
Response
No Trackback , 3 Comments
RSS :
http://moogi.new21.org/tc/rss/response/1883

1. 함수 명칭만으로 오버로딩 분간하기

C++에는 그 이름도 유명한 함수 오버로딩이라는 게 존재하기 때문에 어떤 함수를 이름만으로 유일하게 식별할 수 없다. 링크를 위한 심벌을 생성할 때는 자신이 받아들이는 인자들의 개수와 타입도 이름에다가 일일이 곁들여 줘야 동명이인(?) 함수들을 구분할 수 있다. 이 절차를 decoration이라고 한다.

그런데 바이너리 차원에서 함수 이름에 대한 구체적인 decoration 방식은 표준으로 정해진 것이 없어서 컴파일러마다 완전히 제각각이다. 이 때문에 동일한 타겟에다 동일한 포맷의 obj/lib(기껏해야 OMF 아니면 COFF..)라도 C++ 클래스 라이브러리는 컴파일러를 넘나드는 이식성이 크게 떨어진다.

C 단독이 거의 쓰이지 않는 오늘날까지도 유명 라이브러리들이 C언어 형태의 단순한 인터페이스를 고집하는 이유 중의 하나가 바로 이것이다. 아니면 그런 C 함수를 아주 얇게 감싸는(생성자, 소멸자, 오버로딩..) C++ wrapper 클래스를 만들더라도 하는 일이 정말 C 함수 호출밖에 없고, C++ 멤버 함수는 몽땅 인라이닝이 되게 만든다. 인라이닝이 됐다면 decoration이고 뭐고 걱정할 필요가 전혀 없어지기 때문이다.

그런데.. C++에서 함수를 (1) 실제로 호출하지 않고, (2) 저렇게 decoration 정보가 있는 link time도 아니면서 소스 코드 차원에서(= compile time) 오버로딩 동명이인 함수를 구분할 수는 없을까?

엥? (1)도 (2)도 아닌 애매한 상황은 C++에서 한동안 고려할 필요가 없었다. 그러나 2010년대부터 modern C++이 등장하고, 명칭만으로 type을 유추할 수 있는 auto와 decltype 키워드가 도입되면서 발생할 수 있게 됐다.

void foo() {}

라는 함수를 정의해 놓았다면

auto ptr = &foo;
decltype(&foo) ptr = ...;

이런 식으로 foo를 얼마든지 써먹을 수 있다. auto와 decltype이 자동으로 void (*)()이라는 타입을 유추해 내기 때문이다. 그런데 문제는..

void foo(int) {}

같은 overload를 더 만들었을 때이다.
그러면 이때부터 auto와 decltype에다가 foo를 언급할 수 없게 된다. 이 이름이 가리키는 함수의 prototype이 하나로 딱 떨어지지 않기 때문이다.

이에 대해 C++ 표준 스펙은 오버로딩된 함수 이름을 저기에다 집어넣는 것은 ill-formed라고만 지적하고 넘어간다. (☞ 링크)
이건 컴파일된 obj가 아니라 소스 코드 레벨이기 때문에 decorate된 저수준 명칭을 사용할 수도 없다. 어느 오버로드인지를 지목하는 문법은 딱히 마련하지 않고 넘어간 듯하다.

글쎄, 생각 같아서는 foo as_in () 내지 foo as_in (int) 같은 오버로딩 식별을 위한 토큰이 필요해 보인다.
파이썬이라면 모를까 C++에서 겨우 이런 용도를 위해 영단어 예약어를 도입하는 건 보기 좋지 않다. 그냥 foo 다음에 -> : []처럼.. 데이터 포인터가 아닌 함수 포인터라면 쓰일 일이 없는 기존 연산자 토큰을 늘어놓아서 이 함수의 인자들의 타입을 기술해 주면 될 것이다.

참고로, 함수의 포인터를 얻는 상황에서는 static_cast가 아주 유용하게 쓰인다.
void *p = static_cast<int (*)(int,int)>( func_ptr );

이렇게 해 주면 이 형변환은 func_ptr이 int 2개를 받고 int를 리턴하는 놈이 실제로 선언이나 정의돼 있을 때에만 성공한다. 그런 게 없으면 에러.. 그러니 안전하다. 흥미롭지 않은가? 형변환 연산자가 함수의 동명 오버로드를 분간할 때도 쓰인다니 말이다.
C-style cast나 reinterpret_cast는 그런 면모가 없고 무조건 될 것이다.

2. 복합 포인터 간의 더 세밀한 형변환 연산자

C/C++에서 void*라는 포인터 타입은 잘 알다시피 다른 아무 자료형을 가리키는 포인터를 받아서 대입될 수 있다. 공집합은 다른 모든 집합들의 부분집합이며, 1은 다른 모든 자연수의 약수인 것과 같은 이치이다.
malloc을 비롯해 메모리를 할당하는 함수들은 특정 자료형에 구애받지 않는 void*를 되돌린다. 그런데 이 포인터값을 함수의 리턴값이 아니라 함수 인자로 전달된 포인터가 가리키는 주소에다 받게 하려면 어떡해야 할까?

그럴 때는 별 수 없이 이중 포인터가 쓰이게 된다. 자주 보는 물건은 아니지만 Windows에서 COM 객체를 다루다 보면 QueryInterface 메소드, CoCreateInstance 함수 때문에 접하게 된다. COM에서는 함수 리턴값은 에러코드(정수값)를 되돌리고, 포인터는 인자로 전달된 주소를 통해 받기 때문이다.

여기서 우리는 문법 차원에서 약간의 어색함을 경험하게 된다.
void*는 int*, char* 등 다른 포인터 타입과 호환되지만 이중 포인터끼리는 그렇지 않다. 가령, void**와 int**, char** 따위는 호환되지 않는다.
상속 관계도 마찬가지이다. IUnknown**에다가 IUnknown의 파생 클래스의 포인터의 주소를 바로 넘겨줄 수는 없다.

단순 포인터는 한쪽은 호환되고, 역변환은 static_cast만 해 주면 된다. 그러나 이중 이상의 포인터는 가리키는 타입도 타입 그 자체가 아니라 그 타입의 포인터이다. 그렇다 보니 타입간의 아무런 계층 관계가 인정되지 않는다. 어느 방향으로든 얄짤없이 무식하게 reinterpret_cast만 써야 한다.

글쎄, 이런 일이 자주 발생하고 구분해 줄 필요가 꼭 있다면 pointer_cast 내지 reference_cast라고 해서.. 다중 포인터라도 참조 깊이가 동일하고 최종적으로 도달하는 타입이 서로 static_cast급으로 호환된다면 변환을 허용하는 형변환 연산자를 둘 법도 해 보인다. 저건 굳이 reinterpret_cast까지 사용해야 할 정도로 과격하고 위험해 보이지는 않기 때문이다.

하지만 저 상황만을 위해서 별도의 키워드까지 추가하는 건 좀 overkill 낭비로 보이니 그렇게 되지 않은 것 같다. 배열이야 필요에 따라 3차원 이상의 다차원 배열이 쓰일 수 있지만, 포인터는 본인도 20여 년에 달하는 프로그래밍 인생 이래로 3중 이상 깊이의 포인터를 사용할 일은 전혀 없었다. 즉, void ***p라든가, 이중 포인터에 대한 주소값 같은 것 말이다.

포인터라는 게 크게.. (1) 타 자료형에 대한 포인터, (2) 함수에 대한 포인터, (3) 구조체 및 클래스의 멤버에 대한 포인터라는 세 갈래로 나뉘는 것 같다. 물론, (1)~(3) 종류 불문하고 포인터를 가리키는 포인터는 자동으로 (1)에 속하게 된다. (2)와 (3)은 void*로 싸잡아 일컫는 것이 권장되지 않거나 원천적으로 가능하지 않다.

멤버 포인터의 포인터 내지 배열 같은 것은.. 잠깐 테스트를 해 보니 그래도 문법적인 한계나 typedef 땜빵 없이 이렇게 바로 선언해서 쓸 수 있긴 하다. 물론 멤버 포인터 자체도  쓰일 일이 극도로 드문데 하물며 그걸 또 가리키는 포인터는.. 삼중 이상의 포인터만큼이나 정말 레어템이다. 아래처럼 말이다.

class A {
public:
    void func(int x);
};

void (A::*pfn)(int) = &A::func;
void (A::**ppfn)(int) = &pfn;
void (A::*apfn[1])(int) = { &A::func };

A obj;
(obj.*pfn)(1);
(obj.**ppfn)(2);
(obj.*apfn[0])(3);

복잡한 포인터에서 세부 속성 간의 형변환은 비단 다중 포인터에만 존재하는 게 아니다. 함수 포인터에다가 인자의 개수와 calling convention 같은 건 완전히 일치하고, 일부 인자나 리턴값만이 void*와 char*처럼 미묘하게 다른 함수를 집어넣는 상황을 생각해 보자. 일반 함수뿐만 아니라 C++ 멤버 함수의 포인터도 해당된다.

이때도 지금 문법에서는 닥치고 C-style 또는 reinterpret_cast를 쓰는 수밖에 없다. 하지만 static_cast와 reinter_*의 중간 완충 역할을 해서 저럴 때만 유도리를 허용하는 연산자가 있다면 문법 차원에서 실수가 더 줄어들 수 있고 더 깔끔한 코드를 작성할 수 있다. 프로그래밍 언어에서 type theory의 심오함이 문득 느껴진다.

3. 복수 인터페이스의 구현체에서 IUnknown 베이스 얻기

C++로 COM 인터페이스를 지원하는 클래스를 구현하다 보면.. 다중 상속 기능을 이용하여 한 클래스에다가 2개 이상의 인터페이스를 한꺼번에 집어넣는 경우가 있다.
예를 들어 한 윈도우가 drag & drop을 양방향으로 지원해서 데이터를 밖으로 날릴 수도 있고 받을 수도 있다면, 그 윈도우를 나타내는 클래스(가령, CMyWnd)에다가 IDataObject, IDropSource와 IDropTarget를 몽땅 때려박는 게 편하다.

이렇게 하고 나면, 그 CMyWnd를 상대로 인터페이스들의 베이스인 IUnknown의 QueryInterface, AddRef, Release 메소드를 호출하는 것이야 아무 문제 없이 된다.
다중 상속의 특성상, CMyWnd를 IDataObject, IDropSource, IDropTarget 등으로 캐스트한 포인터 값은 제각각 달라질 수 있다. 왜냐하면 멤버 변수가 없는 인터페이스이더라도 상속을 하나 할 때마다 vtable 포인터의 크기 하나씩은 클래스에다가 차지하게 되기 때문이다.

하지만 이들의 vtable에서 IUnknown 파트는 모두 공통으로 CMyWnd가 구현한 동일한 QueryInterface, AddRef, Release 함수를 가리키게 된다. 이게 바로 마법의 비결이다.
단, 둘째, 셋째, n째 인터페이스들은 this 포인터 값을 살짝 보정한 뒤에 원래 함수를 호출하는 thunk가 추가된다. 마법이 공짜는 아닌 셈이다. 그래서 다중 상속에서는 내가 함수를 호출한 객체의 주소와, 해당 멤버 함수가 받은 this 포인터의 값이 일치하지 않을 수 있다.

그렇게 다중 상속에서 함수 호출과 this 보정 문제가 해결되었는데.. 정작 CMyWnd 오브젝트의 포인터를 IUnknown* 자체로 cast 하는 것은..??? 뜻밖에도 되지 않고 컴파일 에러가 난다. 암시적 자동 형변환은 물론이고, static_cast와 C-style cast도 통하지 않는다.
왜냐하면 얘는 2개 이상 여러 인터페이스를 구현했는데 어느 놈을 기준으로 삼아서 IUnknown으로 cast 해야 할지 알 수 없기 때문이다. 모호성이 존재한다는 것이다. 뜨악~

현실에서 어지간해서는 이런 일을 겪을 일이 거의 없다. 그냥 파생 클래스 구현체가 베이스 인터페이스의 완벽한 상위 호환이니, 어지간한 상황에서는 그냥 그 클래스를 쓰면 되지 굳이 베이스로 형변환을 할 일 자체가 없기 때문이다.

하지만 아무 인터페이스 오브젝트나 받아들여서 레퍼런스 카운트 관리만 한답시고 IUnknown을 인자로 받는 함수가 드물게 있을 수 있다. 그 함수에다가 이런 오브젝트를 덥석 넘겨주면 어느 베이스의 IUnknown을 골라야 할지 모르겠다는 태클에 걸린다. 저 인터페이스들이 IUnknown을 가상(virtual) 상속을 한 게 아니기 때문에 이 문제를 피해 갈 수 없다. 어차피 인터페이스에는 데이터 멤버도 없으니 아무거나 골라도 됨에도 불구하고 말이다.

그 클래스가 상속한 베이스들 중 가상 함수가 존재하는 제일 첫 놈이 IUnknown 기반의 인터페이스라면.. 그 클래스의 인스턴스의 포인터는 그대로 직통으로 IUnknown으로 형변환해도 된다. 하지만 이건 이게 C++의 문법 차원에서 안전이 보장될 수 없는 동작이기 때문에 컴파일 에러가 발생하는 것이다.

C-style cast는 static_*과 reinterpret_*의 중간 정도 위상을 차지하는 물건이며, 포인터 간의 형변환에서는 오히려 후자에 더 가까운 위치에 있다. 하지만 다중 상속에 대해서는 의외로 선 넘지 않는 안전 장치가 걸려 있는가 보다.
저 때 자기 자신을 베이스인 IUnknown으로 강제로 둔갑시키는 수단은 reinterpret_cast밖에 없다.
아니면!! 자신을 void*로 먼저 전환한 뒤에 그걸 IUnknown으로.. static_cast를 두 번 적용하면 된다. 물론 이것들은 다 at your own risk를 감수하고 해야 한다.

이 문제를 해결한답시고 CMyWnd에 대해서 무식하게 QueryInteface(IID_IUnknown, &obj)를 하는 건 너무 오버 같다.
뭐, 어느 베이스를 선택할지 static_cast<IDataObject*>(&obj) 이렇게 명시적으로 지정을 해 주면 모호성이 해소되어 C++ 차원에서 IUnknown으로 cast도 가능해진다.
하지만 이것도 언어 차원에서 더 깔끔하게 해결할 방법이 없는지, const 객체뿐만 아니라 베이스 인터페이스에 대해서도 select_any 같은 속성을 지정해 줄 수는 없을지 궁금하다.

참고로 이런 형변환이 일어나는 곳은 해당 객체 자체가 아니라 십중팔구 그 객체의 포인터들이다. 그러니 그 클래스에서 operator IUnknown*() { return static_cast<****>(this); } 이렇게 전용 형변환 연산자를 구비하는 것은.. 성능 오버헤드는 없지만 언어 문법 차원에서의 아주 깔끔한 해결책으로 보기는 어려워 보인다.;;;

Posted by 사무엘

2021/04/30 08:33 2021/04/30 08:33
,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/1882

« Previous : 1 : ... 4 : 5 : 6 : 7 : 8 : 9 : 10 : 11 : 12 : ... 183 : Next »

블로그 이미지

철도를 명절 때에나 떠오르는 4대 교통수단 중 하나로만 아는 것은, 예수님을 사대성인· 성인군자 중 하나로만 아는 것과 같다.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2021/12   »
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

Site Stats

Total hits:
1699445
Today:
566
Yesterday:
537