Microsoft Office는 Windows와 더불어 지금까지도 마소를 먹여 살리고 있는 주요 밥줄이다. 출시된 지 어언 30년이 돼 가는데.. 가만히 생각해 보면 2000년을 전후한 97부터 XP 사이의 시기에 유독 자연어 처리 기술이 들어간 기능이 많이 도입됐었다. 그게 그 시절에 잠시 유행이었던 것 같다.

1. Office 길잡이

지금으로부터 20여 년 전엔 워드나 엑셀 같은 제품을 다루다 보면, 이런 강아지 내지 클립 귀요미들을 볼 수 있었다.
바로, MS Office 97에서 처음 도입돼서 2000과 XP 시절까지 명맥을 유지했던 Office 길잡이이다..;;

사용자 삽입 이미지

마소에서는 진작부터 HCI (사람-컴퓨터 간 인터페이스)에 굉장한 관심을 갖고 있었고, 컴퓨터를 어린이와 노인까지 누구나 겁먹지 않고 쉽게 다룰 수 있는 '친숙한' 물건으로 만들려고 애썼다. 그래야 자기들 장사도 되니까 말이다.

그래서 프로그램의 성능이나 기능과 직접적인 관계가 없음에도 불구하고, 많은 자금을 들여서 강아지나 클립 등의 캐릭터 애니메이션이 들어간 Office 길잡이라는 걸 만들고 집어넣었다.

얘들은 귀요미 애니메이션만 있는 게 아니라, 프로그램 사용 중에 잘 모르는 게 있으면 "질문을 직접 입력하세요"라는 파격적인 기능까지 제공했다. 이게 일종의 자연어 처리 기능인 셈이다.
워드에서 Dear XXX, 이라고 첫 줄을 입력하면 길잡이가 "편지를 쓰시는 것 같네요. 뭐 좀 도와드릴까요?" 이러기도 했던 건 유명한 일화이다.

1990년대 중반에 마소에서 Microsoft Bob이라든가 저런 Clippy 길잡이 같은 물건을 만들었던 걸 생각해 보면.. 그 시절에 빌 아저씨는 컴퓨터를 대중화시키기 위해서 귀요미 캐릭터가 필요하다고 생각했던 것 같다.
그러나 들인 노력에 비해 이런 UI들에 대한 사용자의 반응은 냉담했다.

괜히 문서 화면을 차지하고 걸기적거리면서 컴터의 성능과 메모리만 잡아먹고, 결정적으로 자연어 처리 AI가 그리 똑똑하지 못해서 사람 말귀를 잘 알아들으면서 도움을 잘 주는 것도 아니었다. 색인 기반으로 도움말 본문 검색 정도에나 적합한 엔진이 무슨 사람의 질문을 정확히 이해할 수 있었겠는가?

이러니 Office 길잡이는 2003에서는 기본적으로 설치되지 않는 물건이 됐다가 2007에서부터 완전히 삭제됐다. 메뉴에서 일부 항목이 생략되던 2000년대 초의 personalized menu와 비슷한 격으로 한때의 반짝 유행으로 끝나고 역사 속으로 사라졌다. 그래도 그 열악하던 옛날에 마소의 Office 제품이 '챗봇' 비슷한 걸 시도한 적이 있었다는 건 AI 역사의 관점에서는 의미심장한 사건이었던 것 같다~!

2. Word에 자동 요약(Auto Summarize)

0부터 100까지 백분율을 지정하면, 이 문서에서 분량 대비 중요도가 상위 그 비율에 든다고 여겨지는 문장을 프로그램이 자동으로 따로 강조해서 표시해 주는 대단히 획기적인 기능이다.
길고 빽빽한 문서를 빨리 읽을 일이 있을 때 엄청난 도움이 될 것이다. Word에 이런 기능도 있었다는 걸 기억하는 분이 계시려나..??

사용자 삽입 이미지

하지만 1990년대 겨우 펜티엄 급의 PC에다 1990년대의 NLP 기술만으로 문서 자동 요약이 정말로 똑똑하게 정확하게 수행되는 건 아니었다. 그저 표면적으로 자주 등장하는 단어만을 고려해서 밑줄을 칠 뿐, 글의 의미를 실제로 파악하고서 핵심 요점을 추려내지는 못했다.

이 기능은 한번 도입된 뒤에 이렇다 할 성능 개선이 없이 잉여로 전락했다. 그래서 Word 2007에서는 리본의 아무 탭에도 소속되지 못하고 누락됐다. 즉, 리본을 통해서 접근할 수 없고, Undo나 Save 같은 기능만 있는 quick access 툴바에다가 버튼을 추가하는 수고를 해야만 이 명령을 실행할 수 있다.
그러다 2010부터는 이 기능이 완전히 삭제되어 버리고 없어졌다. 그러니 지금도 구글에서 Microsoft Word Auto Summarize라고 검색해 보면 XP 내지 2003, 2007 시절의 스크린샷밖에 없다.

다음은 더글러스 맥아더 원수의 퇴역 연설문을 25%로 자동 요약시킨 결과 화면의 일부이다.
"저는 이제 52년 만에 군문을 떠납니다"라는 문장은 분량 비율을 10%로 줄여도 계속해서 포함된다. 이건 글의 핵심을 제대로 파악한 것 같다. 하지만 곁의 "노병은 죽지 않고 그저 사라질 뿐입니다"는 비율을 35% 정도로 올려야 포함되더라.

사용자 삽입 이미지사용자 삽입 이미지
사용자 삽입 이미지사용자 삽입 이미지

1950년대의 얘기이다 보니 북괴 얘기도 나오고 중공 얘기도 나오는데.. 문장들이 많이 수집된 곳과 듬성듬성 수집된 곳의 차이를 난 잘 모르겠다. 이런 요약은 그냥 없는 것보다 나은 정도의 참고용으로만 사용하면 될 듯하다.

3. 필기· 음성 인식 기능

2001년 말에는 Windows와 Office 모두 XP라는 브랜드를 달고 새 버전이 출시됐다.
IE 웹브라우저가 세기말(1997)에 버전 4~5이던 시절엔 운영체제 셸을 멋대로 마개조 했었는데.. 신세기(2001)에 출시됐던 Office XP는 운영체제의 IME 계층을 마개조 해서 TSF라는 문자 입력 인터페이스를 도입했다.

이건 정말 파격적인 새로운 기능이었다. 한중일은 문자의 구조가 복잡해서 처음부터 별도의 입력기가 필요하지만, 영문도 키보드가 아닌 필기· 음성 인식 방식으로 입력하기 위해서는 보조 도구 명목으로 IME 비스무리한 서비스가 필요하다.
거기에다 마침 자국어가 아닌 임의의 외국어 다국어를 입력하기 위해 Global IME니 하는 중간 과도기 제품이 돌아다니기도 했었으니.. TSF는 이 모든 것들을 기술적으로 통합하는 솔루션 역할을 했던 것이다.

사용자 삽입 이미지

Windows XP에다 Office XP 영문판의 모든 기능을 설치하면 영문의 필기· 음성 인식 기능을 사용할 수 있었다.
한글· 한자는 한 글자씩 인식을 하지만 영문은 단어 단위로 획을 끊지 않고 한붓그리기 필기체를 날려 쓰면 아주 잘 인식된다. 사실, 영문 필기체는 압도적인 수요 덕분에 세계에서 제일 많이 연구됐고 제일 기막히게 잘 인식되는 글자이기도 하다..;; 한자 따위와는 급이 다르다.

게다가 태블릿 PC를 의식해서인지, 비좁은 사각형 안이 아니라 화면 전체에다가 글자를 쓱쓱 그려서 인식시켜 넣을 수도 있다. Write anywhere를 고르면 된다. 아래의 드로잉쯤은 당연히 kill이라고 바로 인식된다.

사용자 삽입 이미지

그리고 음성도 본문에다가 받아쓰기를 할지, 명령 수행을 시킬지 선택할 수 있으며, 정확도 향상을 위해 미리 정해진 예문을 쭉 읽으면서 나름 학습을 시키는 절차도 있다. 학습을 시킬 때 단어들을 어색하게 딱딱 끊지 말고 반드시 평소처럼 자연스럽게 이어서 읽으라고 부탁하는 메시지가 뜬다.

무려 20여 년 전의 Office 제품에 벌써 이런 기능이 있었다는 게 놀랍지 않은가?
그랬는데 후대 버전의 Windows와 Office는 영문판을 찾아봐도 그런 필기· 음성 인식 기능이 오히려 없어진 것 같다. 성능이 시원찮고 시대에 뒤떨어지니 도로 없앤 건가 싶다.
고급 필기 인식 기능은 IME보다는 메모 전문 앱인 OneNote에 몰빵돼 들어갔다. 처음엔 Office 2003의 제품군 소속으로 개발됐었지만 지금은 독립한 물건이다.

Office 제품들은 운영체제의 공용 대화상자들을 생까고 자체 구현한 대화상자로 문서 열기/저장 기능을 제공해 왔는데, 지난 2007 버전부터는 그 전통을 깨고 운영체제 대화상자로 돌아왔다.

운영체제의 IME와 Office의 IME가 따로 놀던 관행도 2007? 2010?쯤부터 없어져서 현재에 이르고 있다.

입력과 직접적인 관계는 없는 기능이다만, Word의 경우 한국어로 텍스트를 입력하다 보면 인명 고유명사를 얼추 인식해서 파란 점선을 쳐 주고 주소록에 추가한다거나 다른 부가작업을 선택하는 게 있었다.
내 기억이 맞다면 smart tag라는 기능인데, 이게 최초로 추가된 것도 XP였다. 허나, 이 역시 오히려 후대 버전에서는 이게 없어지거나 기본적으로 꺼진 것 같다.

NLP 기능이 과거에 있었다가 나중에 도로 없어진 건.. 마치 21세기에 초음속 여객기나 우주왕복선이 오히려 없어진 것과 비슷한 맥락의 현상으로 느껴진다.
컴퓨팅 성능과 AI 기술이 훨씬 더 향상된 2020년대엔 오피스 제품에 더 똑똑해진 필기· 음성 인식과 문서 자동 요약과 번역, 도움말 안내 기능이 다시 부활해 들어가지 않으려나 기대를 해 본다.

Posted by 사무엘

2022/06/19 08:35 2022/06/19 08:35
Response
No Trackback , No Comment
RSS :
http://moogi.new21.org/tc/rss/response/2033

Trackback URL : http://moogi.new21.org/tc/trackback/2033

Leave a comment
« Previous : 1 : ... 321 : 322 : 323 : 324 : 325 : 326 : 327 : 328 : 329 : ... 2204 : Next »

블로그 이미지

그런즉 이제 애호박, 단호박, 늙은호박 이 셋은 항상 있으나, 그 중에 제일은 늙은호박이니라.

- 사무엘

Archives

Authors

  1. 사무엘

Calendar

«   2024/11   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Site Stats

Total hits:
2967036
Today:
1022
Yesterday:
1514