Search Results for '국어정보처리시스템경진대회'


1 POSTS

  1. 2012/10/26 국어 정보 처리 시스템 경진대회 참관기 (2012/10/12) by 사무엘

문화 체육 관광부와 국립 국어원에서 2009년부터 해마다 <국어 정보 처리 시스템 경진대회>라는 걸 개최하여 올해로 4회째를 맞이했는데, 올해는 예전의 인서울 관행을 깨고 부산 영도에 있는 한국 해양 대학교에서 개최되었다. 개최 일자는 지난 10월 12일. 공교롭게도 한글 운동 단체들에서 열심히 밀고 있는 조선어 학회 수난 70주년 추모 행사와 겹치는 날짜였다. 그건 서울 경복궁에서 열렸고 저 경진대회는 부산에서 열렸다.

말은 경진대회이지만 사실 참가자들이 동일한 조건에서 시험을 치면서 기량을 겨룬다거나 하는 건 아니기 때문에 사실은 '공모전'이 더 정확한 명칭이다. 일차적인 개최 목적은 21세기 세종 계획(1998~2007) 때 구축된 세종 말뭉치를 이용하여 한국어 분석과 관련된 의미 있는 데이터 처리를 하는 싸제 프로그램의 개발을 독려하는 것이다. 하지만 그 외에도 한국어와 한글의 기계화 및 교육과 관련된 유용한 소프트웨어라면 무엇이든 괜찮다. 본인은 독자 여러분도 잘 알다시피 작년(3회) 대회 때 <날개셋> 한글 입력기 6.3을 출품하여 은상을 받았다.

주최 측에서는 이 대회를 꽤 의욕 있게 밀고 있다. 내년에도 내후년에도 끊임없이 계속해서 대회를 주최할 것이라는 의지를 밝힌 바 있으며, 작년부턴가 기존의 <한글/한국어 정보 처리 학술대회>와 이 경진대회를 아예 병행해서 개최하기 시작했다. 그리고 올해에는 심사에 앞서 오전에 부스를 만들어서 일반인과 심사위원이 모두 참관 가능한 작품 전시(데모) 세션을 추가했으며, 게다가 작년 대회 입상자 중에도 원하는 분은 올해 대회의 데모 세션에 같이 참여해 달라고 초청장을 보냈다.

내 프로그램을 홍보할 기회가 왔으니 나는 초청을 거절할 이유가 없었고, 지난 10월 12일엔 회사에 휴가까지 내어 오랜만에 부산에 좀 갔다 왔다.
경부선 막차인 밤차를 타고 부산에 도착한 건 새벽 4시 반이 덜 돼서였다. 미리 봐 놓은 지하철과 시내버스 경로로 대회 장소엔 예정보다 훨씬 일찍 도착했다. 다만, 세월이 세월인지 밤샘은 이미 엄두를 못 내는 지경이 됐고 밤차도 더는 피곤해서 못 탈 것 같다. 피곤이 밀려오기 시작한지라 책상에 엎드려서 자면서 시간을 보냈다. 밤차는 교통비(굳이 비싼 고속 교통수단을 쓸 필요 없음)와 숙박비(차에서 잠을...)를 아낄 수 있는 저렴한 방법이지만, 제일 피곤한 방법이기도 하다.

부스 개방 시각이 다가오자 대회 주최 측에서 직원이 와서 각종 장비들을 세팅해 줬다. 나는 간단히 준비해 온 유인물과 프레젠테이션 슬라이드로 부스를 꾸몄다. 작년 대회 입상자가 나 포함 3명이 온다고 했는데 역시나 내가 예상했던 대로 대상, 금상, 은상 수상자가 나란히 왔다. 울산대 팀은 그렇잖아도 최고 등급인 대상을 받은 데다 부산은 지리적으로 거리도 별로 안 멀고, 이 대회만 작정을 하고 미는 연구실이 있으니 이런 자리엔 거의 확실히 오리라고 예상했다.

한편, 작년에 금상을 받은 최 시영 선생님은 1인 기업 사장이랄까 프리랜서랄까, 어쨌든 조직에 매여 있지 않은 분이기 때문에 이런 데에 가는 데 제도적인 제약이 없는 분이다. 최근엔 data-p라는 프로그래밍 언어도 하나 고안해서 대외적으로 뭔가 알려야 할 게 많은 처지이기도 하다(실제로 나중에 컴퓨터공학 교수들 앞에서 data-p 얘기 많이를 늘어놓으셨다). 그러니 올 거라 생각했는데 역시 오셔서 나하고 반갑게 인사를 나눴다. 말동무가 하나 늘었다.

저분은 프로필을 보아하니 서울대 법대 출신의 엄청난 엄친아인데 독특한 웹 기반 세종 말뭉치 검색 도구를 만들어서 이런 대회의 상위권에 입상하고, 최근에는 전산학에까지 관심을 뻗치고 계신다. 뭘 하시는 분인지가 궁금해지지 않을 수 없다.
그에 반해, 대학원이나 일반이 아닌 학부생들은 아무래도 이런 좁고 전문적인 분야의 대회에서 상위권에 입상하는 작품을 만들기가 현실적으로 어려울 것이며, 입상하더라도 또 중간고사를 앞두고 먼 길을 가서 이런 대회의 데모 세션에 참여할 처지는 못 될 것이다. 이런 나의 모든 예상은 적중했다.. ^^

공식적인 데모 세션은 2시간이었다. 나야 ISEF에 참가하던 고딩 시절 이래로 이런 건 한두 번 하는 게 아니긴 하지만, 여전히 다른 사람들에게 내 프로그램의 본질에 대해서 설명해 주기란 참 쉽지 않았다. 세벌식, 무한 낱자 수정, 오토마타, Bksp 없이 오타 고치기, 텍스트 필터, 에디터와 IME 등등등... 무슨 얘기부터 할까? 이런 것들이 어느 하나만 알아서는 context를 이해할 수 없는 유기체를 구성하고 있다. C밖에 모르는 사람에게 어느 세월에 C++의 클래스, 상속, 오버로딩, 가상 함수 개념에 대해서 설명해 주고 그것도 모자라서 템플릿이라든가 람다 함수에 이르기까지 그 필요성과 장점을 가르쳐 줄 수 있겠는가?

확실히 한국어 공학에 비해서 “한글 공학”은 인지도가 미미한 것 같다. 우리나라의 사회 문화 분위기가 한국어와 한글의 구분이 상당히 모호하고 오락가락 하는 건 사실이지만, 결국 어차피 그 말이 그 말이고 반드시 구분해야 할 필요가 없는 상황에서 병적으로 둘은 완전히 독립적이고 무관한 개념이라고 집작하고 몰고 가는 것도 또한 보기 좋지 않은 모습인 듯.
비록 내 프로그램은 올해의 대회 출품작이 아니기 때문에 심사 대상도 아니지만, 심사위원 중 한 분은 “님 프로그램은 우리 대회보다 규모가 더 큰 일반적인 소프트웨어 공모전에도 출품해 보셈”이라고도 말씀하셨다.

데모 세션이 끝날 무렵에 웬 반가운 손님이 한 명 왔다. 올해에 본인의 석사 졸업 대학원 학과에 석사로 새로 입학한 파릇파릇한 석사 후배. 학교에서 내 얘기를 이미 들었는지 나에 대해서 어느 정도 이미 알고 있었다. 나는 대학원 재학 시절에 석사 신입생이라고는 좀체 구경을 못 했다(한두 명 합격한 지원자는 있었으나, 등록을 안 하고 그걸로 끝). 그러다 겨우 논문 학기가 다 돼서야 여학생 후배 두 명을 본 게 전부인데, 남자 후배라니 반갑지 않을 수 없었다. 말동무가 셋으로 늘었다.

부스 전시는 정오 무렵까지 그럭저럭 잘 했다. 이제 느긋하게 앉아서 올해 입상작들의 발표와 심사 장면 구경만 하면 된다.
주최 측에서는 데모에 참여한 작년 입상자들을 예우 차원에서 경진대회 관객으로 자동 등록을 시켜 줬으며, 점심과 저녁 식사는 물론, 생각도 안 했던 여비까지 챙겨 줬다.

출품된 프로그램들은 로컬, 웹, 앱을 골고루 커버하는 다양한 형태였다. 로컬 프로그램 중엔 정통 MFC 기반 프로그램은 없었고, 모두 닷넷 프레임워크 기반이었던지라 세대 차이를 실감했다. 하긴, 업무용 프로그램이야 어떤 형태로든 RAD가 지원되는 툴로 만드는 게 능률과 생산성 면에서 나을 테니 말이다.
말뭉치가 어떻고 태깅이 어떻고 하는 구체적인 내용은 나도 그것만 전문적으로 판 게 아니니 잘 모르겠다. 발표 중간엔 다시 몰려오는 잠의 쓰나미를 주체할 수 없어서 잠시 졸았다.

올해는 KAIST 전산학과에서 NLP 연구의 선두주자이신 최 기선 교수님 연구실에서 작품을 출품하여 대상을 받았다. 그러고 보니 나는 나름 한글 입력기를 연구한다면서 학부 시절에 '한국어'와 관계가 있는 연구를 하는 교수님은 한 번도 안 마주치고 졸업을 해 버렸으니 이것도 기이한 일이다. 저분을 포함해 박 종철 교수, 시 정곤 교수(이분은 전산학과가 아닌 인문사회과학부 소속) 같은 분들 말이다. 박 교수님은 이번 대회 행사에서 개회사를 하셨는데, 국어의 위상을 화폐 단위의 위상에다 빗대어 말씀하시는 걸 들어 보니 생각보다 국어 사랑 정신이 투철한 전산학자이시라는 게 느껴졌다.

서울을 벗어난 장소에서 올해는 작년 입상작 개발자까지 초청하여 데모 세션을 연 것은 바람직한 시도라고 느껴져서 기분이 좋다. 사실, 옛날에 정보 올림피아드도 그런 식으로 공모 부문 입상자끼리의 교류와 전시 행사가 좀 있으면 좋겠다고 난 예전부터 생각해 왔었다. 참가 작품수가 늘어나고 대회의 권위와 위상이 더 올라가면, 심사와 시상 기준을 다음과 같이 더욱 세분화도 해야 할 텐데 이런 욕심까지 부리는 건 아직은 좀 이른지도 모르겠다.

- 분야: 말뭉치 도구, 교육용 소프트웨어, 또는 기타 유틸
- 부문: 대학 학부, 대학원, 개인 인디 개발자, 또는 기업
- 내력: 첫 개발인가, 아니면 동일 아이디어 하에서 예전 출품/입상작의 꾸준한 개선 내지 리메이크인가

그런데 이 대회를 앞으로 적극 육성하겠다면서 올해는 뽑는 입상작 수가 더 줄었다. 작년에 9명이던 것이 올해는 7명. 게다가 이미 작년도 재작년에 비해서는 지급되는 상금의 총액이 좀 줄어든 것이었다. 이것부터 좀 개선해야 할 문제가 아닌가 싶다. ^^;;

작년과 마찬가지로 올해도 주최 측에서 참석자 전원에게 저녁까지 쏘는 대인배 대접을 했다. 나도 늦게까지 얘기를 나누면서 교제할 사람이 주변에 여럿 있었지만 나는 선약을 잡은 상태였던지라 눈물을 머금고 먼저 자리를 떴다. 완전히 풀코스를 뛰었으면 영도를 완전히 빠져나가는 시각은 밤 8~9시 사이가 됐을 것이고, 남의 차를 얻어 타고 부전이나 부산 역까지 도착하는 시각은 그보다 더 늦어졌을 터이니, 진짜 부산에서 진한 하루를 보내게 됐을 것이다.

자가용을 가져갔으면 시간과 장소 제약이 없이 인근의 태종대 같은 부산 구경을 더욱 자유롭게 하고 돌아갈 수 있었을지 모르나 이 경우 주차나 유류비 같은 다른 문제 때문에 골치가 아프게 됐을 수도 있다. 게다가 난 그렇잖아도 대중교통만 이용하고도 피곤해서 이 고생을 했는데, 운전까지 해야 했으면 어찌 됐겠는가?

어쨌든 부산에서 기억에 남는 즐겁고 유익한 추억을 남겼다.  이 글에서 다 못 한 주변 이야기는 다음에 올라올 부록에서 이어질 예정이다.

Posted by 사무엘

2012/10/26 19:33 2012/10/26 19:33
, ,
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/748


블로그 이미지

철도를 명절 때에나 떠오르는 4대 교통수단 중 하나로만 아는 것은, 예수님을 사대성인· 성인군자 중 하나로만 아는 것과 같다.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2020/09   »
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      

Site Stats

Total hits:
1441858
Today:
152
Yesterday:
490