여러 기호(또는 문장 부호)들 중에서 따옴표는 컴퓨터로 입력할 때 좀 유별나게 처리되고 다뤄지는 면모가 있는 문자이다.
일단 따옴표는 기호가 쌍으로 붙은 큰따옴표와, 하나만 있는 작은따옴표로 나뉜다. 전자는 어떤 발언을 직접 인용할 때, 그리고 후자는 발성이 타인에게 실제로 들리지는 않는 혼잣말이나 생각을 인용할 때 통상 쓰인다.

그러나 이런 물리적인 구분이 명확하지 않은 경우도 있다. 재미있는 것은, 따옴표로 둘러싸인 인용문의 내부에 또 인용문이 또 등장할 때는 물리적인 구분과는 무관하게 맞은편 따옴표가 작은→큰→작은..의 순으로 번갈아가며 쓰인다는 점이다. 또한 따옴표들은 완전한 문장이 아니라, 문장 내부의 특정 단어를 단순히 강조하는 용도로도 쓰인다.

따옴표는 괄호와 마찬가지로 열고 닫는 구분이 있다. 그러나 타자기나 컴퓨터의 글자판에는 괄호와는 달리 여닫는 따옴표가 따로 배당되어 있지 않다. 방향 구분이 없는 "와 '가 각각 큰따옴표와 작은따옴표의 역할을 대신한다.

텍스트 에디터는 코딩용으로도 쓰이고 키보드에 배당된 아스키 문자가 그대로 입력되는 게 중요한 경우가 많기 때문에, 따옴표도 있는 그대로만 입력받는다. 그러나 워드 프로세서 정도 되면, 지금 입력하는 문맥에 따라 해당 문자를 여닫는 따옴표로 알아서 치환해서 입력해 준다. 여기서 아주 재미있는 차이가 존재하는데, 아래아한글은 전통적으로 이런 구분을 한글 글자판을 쓸 때만 하는 반면 MS 워드는 글자판 구분 없이 언제나 그렇게 동작한다.

글쎄, 한글 입력 방식에서는 세벌식 최종 글자판이 여는 큰따옴표와 닫는 큰따옴표가 따로 배당되어 있고 그걸로도 모자라 "까지도 있다. 이것은 컴퓨터에서는 다소 잉여스러운 설계인지도 모르겠다. 그 대신, 영미 문화권의 텍스트 문서에서는 tilde 글쇠의 아래에 있는 `가 종종 여는 작은따옴표로 쓰이고 기존 '(어퍼스트로피)는 닫는 작은따옴표로만 쓰이는 경우가 있다. 한국에서는 보기 힘든 관행인 듯.

얼마 전에 본인은 여닫이 구분이 없는 따옴표만 쓰인 빽빽한 영어 성경 텍스트의 따옴표들을 여닫이 구분이 있는 형태로 일괄 변환할 수 있겠느냐는 부탁을 주변으로부터 받은 적이 있었다. 그냥 "만 달랑 들어있으면 왠지 아마추어스러운 티가 팍 날 테니, 인쇄해서 책으로 낼 텍스트라면 그 정도 배려는 해 주는 게 좋을 것이다.

"를 계속 찾으면서 “와 ”로 번갈아가며 대치만 하는 걸로 일이 끝이면 얼마나 좋았겠냐만, 이거 패턴이 의외로 간단하지만은 않음을 알 수 있었다.
작은따옴표는 어퍼스트로피가 존재하기 때문에 닫는 따옴표의 개수가 더 많아진다. 더구나 s로 끝나는 단어의 뒤에 붙은 어퍼스트로피는 닫는 작은따옴표와 형태적으로 구분할 방법이 없다.

그리고 큰따옴표와 작은따옴표 모두, 인용문이 여러 문단에 걸쳐서 길게 반복되는 경우라면, 이전 문단에서는 닫는 따옴표로 마무리가 되지 않은 채 다음 문단에서 또다시 여는 따옴표가 나온다. 물론, 그렇지 않고 앞 문단에서는 여는 따옴표로 시작해서, 다음 문단에서는 닫는 따옴표로 곱게 끝나는 인용도 따로 있고 말이다.

그리고 아까 얘기했던 중첩 인용도 문제가 될 수 있다. 열큰(여는 큰따옴표)와 작큰(작은 큰따옴표) 다음에 입력되는 큰따옴표는 여는 큰따옴표가 되어야 하는데, 이런 점을 고려하지 않고 기계적으로 따옴표를 치환하면 “(열큰) “(열큰) ”(닫큰) ”(닫큰)의 순으로 등장해야 할 따옴표가 “(열큰) ”(닫큰) “(열큰) ”(닫큰)으로 잘못 짝지어질 위험이 있다.

텍스트에는 최대 3단계의 중첩 인용이 존재하더라. 이거 생각보다 꽤 복잡하지 않은가?
텍스트 매크로, 찾기/바꾸기 등 여러 방법 중 과연 어느 것이 가장 적합할지 고민했는데 결국은 여러 차례의 바꾸기 기능을 사용하기로 결정을 내렸다. 여는 따옴표가 확실한 조건을 지정해 준 뒤, 나머지 따옴표는 모두 닫는 것으로 간주하는 게 가장 속 시원하다. 구체적인 절차는 다음과 같다.

1. 줄의 맨 첫 칸에 등장하는 따옴표는 반드시 여는 따옴표이다. 상식적으로 문단이 닫는 따옴표로 시작하지는 않을 테니 말이다. 그래서 줄의 처음을 의미하는 정규 표현식 ^를 사용하여, 첫 칸의 따옴표부터 다 여는 걸로 모두 바꾼다.

2. 그리고 공백(whitespace) 다음에 등장하는 따옴표는 반드시 여는 따옴표이므로 그렇게 바꿈.

3. 끝으로, 여는 따옴표의 다음에 등장하는 따옴표도 반드시 여는 따옴표이다. (여는 큰따음표 다음의 작은따옴표. 그리고 vice versa)

4. 위의 조건들을 만족하지 않고 아직도 방향이 결정되지 않은 따옴표들은 모두 닫는 따옴표이다. 치환.

이 작업을 큰따옴표/작은따옴표별로 다 해야 하기 때문에 '모두 바꾸기'를 무려 8번이나 해 줘야 한다.
그러나 <날개셋> 편집기에서는 '일괄 치환' 텍스트 필터에다가 다음과 같은 조건을 주면 일격에 상황 종료. 굉장히 유용하다.

"\n\"","\n“"
"\n'","\n‘"
" \""," “"
" '"," ‘"
“',“‘
"‘\"",‘“
',’
"\"",”

따옴표가 특별한 의미로 쓰이는 곳에서 따옴표 자체를 지정해야 하다 보니, 글자를 알아보기가 몹시 힘들다. 게다가 코딩용 폰트가 아닌 폰트는 여는 따옴표와 닫는 따옴표도 형태를 분간하기가 쉽지 않은 경우가 태반.
타자기 내지 컴퓨터 키보드에서 따옴표의 방향 구분이 별 의미 없다고 간주하여 괜히 없앤 게 아닌 듯하다.

아울러, 데이터베이스 같은 곳에서는 문자열 내부에 또 큰따옴표가 들어있을 때, 문자열의 시작을 '큰따옴표 두 개'로 표현하는 경우가 있다. 다음은 그런 문자열을 원래대로 복원하는 일괄 치환 조건이다.

"\"\"","\""
"\"",

그러고 보니 방향 구분이 없는 큰따옴표는 "위와 같음"(상등)을 의미하는 기호로도 쓰이며, 심지어 작은/큰따옴표가 각각 분과 초를 의미하는 단위로도 쓰인다. 신기하다. 본인은 이 경우까지 고려하지는 않았다.

Posted by 사무엘

2013/02/18 08:28 2013/02/18 08:28
,
Response
No Trackback , 10 Comments
RSS :
http://moogi.new21.org/tc/rss/response/797

Trackback URL : http://moogi.new21.org/tc/trackback/797

Comments List

  1. 김 기윤 2013/02/19 15:49 # M/D Reply Permalink

    일정 규칙이 있는 변환을 해야 할 경우, 짧으면 2~3시간에서 길면 일주일만에 코드를 작성해서 자동으로 돌리면 매우 쉽게 해결되는 문제임에도 불구하고, 프로그래밍이나 관련 지식을 잘 모르기 때문에 그걸 직접 반년에서 일년에 걸쳐서 직접 하시는 분들도 있습니다. 프로그래머의 입장에서는 왠지 안타깝습니다.. 그런 분들을 본다면 도와드리고 싶기도 하고..

    1. 사무엘 2013/02/20 09:45 # M/D Permalink

      그걸 다 손으로 한다니.. 정말 ㅎㄷㄷㄷ
      그래서 컴퓨터 프로그래밍은 사람의 능력을 극대화해 주는 위대한 스킬임이 틀림없어 보입니다.
      또한, 텍스트 에디터는 겉보기로는 간단해 보여도 메모장 같은 진짜 간단한 물건과, 프로그래머용의 덕후스러운 전문적인 물건 사이의 수준 차이가 넘사벽급인 분야 중 하나입니다. 전문가용은 당연히 자동화, 매크로 같은 기능이 엄청나게 발달해 있지요.

  2. 박철현 2013/02/20 21:24 # M/D Reply Permalink

    프로그래머의 중요한 역할을 다시금 알게 되었습니다.
    좋은 정보 고맙습니다. ^^

    1. 사무엘 2013/02/21 16:10 # M/D Permalink

      사실, 컴공 비전공자라도 파이썬 정도 언어로 파일 여닫기, 문자열 다루기, 간단한 반복과 조건 같은 것만 학교에서 배워 놓으면 앞으로의 인생이 아주 편리해지지 않을까 싶습니다.
      아니, 요즘은 파이썬까지 갈 것도 없고 웹브라우저만 있으면 바로 돌릴 수 있는 자바스크립트가 있죠.

  3. 십삼각 2013/12/03 22:04 # M/D Reply Permalink

    1. 사실 (여닫이 구분이 있는) 따옴표, (여닫이 구분이 없는) 따옴표, 아포스트로피, 같음 기호(〃), 프라임 기호(분·초, 피트·인치)는 각각 별개 기호죠. 유니코드에서도 전부 구분하고 있는 걸로 압니다. 다만 편의상 혼용하는 것이긴 한데... 저는 개인적으로 다른 건 구분 안 하더라도 같음 기호의 경우에는 "보다 〃가 더 모양이 좋아서 이쪽을 씁니다.

    어떻게 보면 말줄임표 대신 온점 세 개를 쓰는 현상, 가운뎃점 대신 아래아를 쓰는 현상과 연관지어볼 수도 있지 않을까 싶네요.

    2. 원래 ` 기호는 발음 구분 기호인 '악상 그라브(영어로 grave accent)'죠. 이걸 따옴표 대용으로 쓰는 건 개인적으로 부적당하고 보는데, 의외로 이런 경우가 많은 것 같습니다. 외국뿐만 아니라 한국 사이트에서도(뉴스 기사라든지) 자주 보이더군요. 그런데 이 경우 작은따옴표는 `와 '로 짝을 이루는데 큰따옴표는 짝을 이루지 못하기 때문에 일관성이 떨어지는 구분법이 아닌가 싶습니다.

    개인적 추측으로 타자기 시절에 악상그라브는 `로, 악상테귀는 '(´)로 쓰던 것이 현재의 키보드에까지 남아있는 것이 아닌가 싶긴 한데 확인할 길은 없네요.

    3. 세벌식은 큰따옴표는 여는 것과 닫는 것이 각각 있는데, 작은따옴표는 여닫이 구분이 없는 걸 보고 의아했던 적이 있습니다. 혹시 그렇게 된 유래를 아시는지요?

    1. 사무엘 2013/12/04 21:26 # M/D Permalink

      유익한 설명을 보충해 주셔서 고맙습니다.
      〃(ditto mark)는 모양이 좋은 정도가 아니라 아예 정말로 '상등'이라는 용도로 쓰라고 만든 글자이군요. 이걸 즐겨 써야겠습니다. ^^
      가로 줄표만 해도 길이와 용도별로 종류가 한두 가지가 아니지요.
      기호의 혼동, 그리고 관련 지식의 부족으로 인해 글꼴 자체가 잘못 만들어지는 경우도 적지 않아서 문제라고 들었습니다. 서체 디자이너 내부에서도 각성의 움직임이 있구요.

      세벌식 최종 글자판의 따옴표 배당 내력에 대해서는 저도 자세히 알지 못합니다. 그저 그러려니 하고 받아들였지요.

  4. ㅇㅅㅇ 2014/08/16 11:18 # M/D Reply Permalink

    3. 끝으로, 여는 따옴표의 다음에 등장하는 따옴표도 반드시 여는 따옴표이다. (여는 큰따음표 다음의 작은따옴표. 그리고 vice versa)

    이걸 위해서
    “',“‘
    "‘\"",‘“
    이걸 넣으셨는데, 실제로 해 보면 제대로 동작하지 않습니다.

  5. ㅇㅅㅇ 2014/08/16 11:26 # M/D Reply Permalink

    좀 연구해 봤는데, 처음에는 일단 일괄 치환에다가 다음 여섯 줄을 넣고 돌리고,
    "\n\"","\n“"
    "\n'","\n‘"
    " \""," “"
    " '"," ‘"
    ',’
    "\"",”

    그 다음에는 일괄 치환에 다음 네 줄을 넣고 반복 적용에 체크하고 돌리는 수밖에 없을 것 같습니다.
    “”,““
    “’,“‘
    ‘”,‘“
    ‘’,‘‘

  6. ㅇㅅㅇ 2014/08/16 15:32 # M/D Reply Permalink

    이 글에서는 여는 괄호 뒤의 따옴표를 고려하지 않고 있기도 해서, 보충해서 새 글을 썼습니다.
    http://chojogensho.tistory.com/2

    1. 사무엘 2014/08/16 18:53 # M/D Permalink

      음, 이 글은 올린 지 오래 돼서 저 규칙들의 세부 메커니즘이 기억이 나지는 않습니다만.. ^^
      보충 설명을 해 주셔서 고맙습니다.

Leave a comment
« Previous : 1 : ... 1510 : 1511 : 1512 : 1513 : 1514 : 1515 : 1516 : 1517 : 1518 : ... 2204 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/11   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Site Stats

Total hits:
2989648
Today:
1208
Yesterday:
1477