미래가 궁금하신가요? 점쟁이를 찾아가지 말고 '구글신'에게 물어보세요. 점쟁이보다는 '신'이 더 정확하게 예측할 뿐만 아니라 구글신은 복채가 없어도 만날 수 있답니다. 그냥 인터넷에 연결된 컴퓨터 앞에 앉아 구글신에게 제대로만 물어보면 정확(?)한 답을 알려주기 때문입니다.
미국에서 탄생한 구글신은 서울시장 선거에서 박원순 시장이 당선될 것을 알고 있었고, 대선에서는 박근혜 후보가 당선될 것을 다 알고 있었다는 겁니다. 미국 태생(?)인 구글신은 한국의 선거 결과뿐만 아니라 2007년과 2011년 미국 대통령 선거 결과도 마치 예언자처럼 딱 맞췄습니다.
그 정도 결과는 더 독자 여러분도 이미 다 알고 있었다구요? 그런데 구글신은 여러분처럼 박근혜가 이긴다, 박원순이 이긴다 혹은 오바마가 이긴다는 결과만 감으로 때려 맞춘 것이 아닙니다. 후보들간의 예상 득표율까지 여론조사나 출구조사보다 더 정확하게 예측했습니다.
정말 놀랍지 않습니까? 처음에는 잘 믿어지지 않았습니다. 하지만 지난 달 카이스트 정하웅 교수의 강연에서 선거결과를 예측한 구글 검색 결과 자료를 보니 입이 다물어지지 않더군요.
그날 다음세대재단이 주최한 비영리단체 미디어 컨퍼런스에서 강연을 했던 정하웅 교수가 청중들에게 추천한 책이 바로 <구글 신은 모든 것을 알고 있다>입니다.
박근혜 당선, 박원순 당선, 오바마 당선...구글은 다 맞췄다
대통령 선거결과 구글 검색으로 미리 알 수 있었다는데...
제목만 보고는 구글의 검색의 정확성이나 구글의 놀라운 성공을 다룬 책일지도 모른다는 생각을 하였습니다. 하지만, 막상 책을 읽기 시작하니 카이스트 교수로 일하고 있는 물리학자·생물학자의 명강연을 담은 책이었습니다.
카이스트 교수들이 '정보'를 주제로 대중 강연을 진행한 '카이스트 명강' 시리즈 첫 번째 책이 <구글 신은 모든 것을 알고 있다>였습니다. 구글을 다룬 책이 아니라 '양자적인 스케일에서 정보는 어떻게 다루어지는가?'하는 이른바 양자 정보학 그리고 생명 현상을 만들어 내는 정보는 어떻게 기능되고 탐구되는가?, 복잡계 네트워크 안에서 정보는 어떻게 퍼지고 흘러가는가? 하는 쉽지 않은 주제들을 다루고 있습니다.
솔직히 고백하자면 이 책을 다 이해하지 못했습니다. 하지만 다 이해하지 못해도 흥미롭게 읽은 책은 분명합니다. 복잡한 이론과 수식을 완벽하게 이해하지 못했지만 일반인도 알아들을 수 있는 언어로 들려주는 최신 연구 결과들은 흥미를 끌기에 충분했습니다.
예컨대 공상과학 소설이나 만화에서나 가능한 줄 알았던 공간이동이 현실에서 가능하다는 이야기와 (비록 다 알아 듣지는 못하였지만) 그것이 과학적으로 어떻게 가능한지를 설명하는 이야기들은 아주 신기하고 재미있었다는 것입니다.
실제로 태어나서 한 번도 본일이 없는(물리학자들이나 다루는) 복잡한 수식도 나오고 '측정과 파동함수의 붕괴' 같은 알아들을 수 없는 제목들도 등장합니다. 그나마 복잡계 네트워크 안에서 정보의 흐름을 다룬 정하웅 교수의 강연이 가장 쉽고 흥미로운 축에 속했습니다.
정하웅 교수의 강연을 직접 듣고 강연에서 들었던 내용들을 책으로 다시 읽었기 때문이기도 할 것이고, 그가 복잡한 물리학 이론과 수식을 가장 적게 인용하였기 때문이기도 할 것입니다.
자, 그럼 '복잡계 네트워크와 데이터 과학'을 주제로 한 정하웅 교수 강연부터 제가 알아듣고 이해한 만큼만 간략하게 소개해 보겠습니다.
그는 네트워크를 크게 두 가지로 구분합니다. 고속도로처럼 생긴 네트워크와 항공망처럼 생긴 네트워크입니다. 고속도로는 균일한 연결망을 가지고 있고 항공만은 허브 공항이 있기 때문에 복잡하면서 한 곳에 집중되어 있습니다.
1990년대 말을 기준으로 약 8억개 정도의 웹 페이지가 존해하였고, 이 웹페이지를 모두 선으로 연결 시켜 보았더니 항공망처럼 연결되어 있다는 것을 확인할 수 있었다는 것입니다. 그리고 전 세계를 연결하는 인터넷 기간망의 연결도 확인해 보았더니 항공망 연결과 같은 모양이었다고 합니다.
복잡한 세상은 고속도로가 아니라 항공망처럼 연결되어 있다
그뿐만 아니라 세계에서 가장 저명한 과학저널이라는 <네이처>에 실린 섹스네트워크 연구나 영화 스타 네트워크 연구, 학술논문네트워크 그리고 최근에 널리 확산되고 있는 SNS 네트워크를 살펴봐도 모두 항공망처럼 생겼다는 것입니다. 저자의 관심은 왜 이런 일이 생기는가 하는데 있습니다.
첫 번째는 자원의 효율적 분배, 두 번째는 항공망 네트워크의 견고함이 원인일 것이라고 추론합니다. 아울러 이런 항공망 네트워크를 잘 활요하면 전염성 질환의 치료 효과를 높인다든지 하는 매우 실질적인 활용이 가능하다는 것이지요.
그리고 현재까지 이런 항공망 네트워크를 가장 잘 활용하여 성공을 거두고 있는 기업이 바로 '구글'이라는 이야기로 이어갑니다. '페이지랭크'라고 하는 구글이 특허 받은 검색 기술이 바로 항공망 네트워크라는 사실(연결의 중요성)에 착안해 만들어졌다는 것이지요.
세상이 항공망 네트워크로 연결되어 있다는 것에 착안한 구글은 사람들의 검색 결과를 모아 독감환자의 발생을 정확히 예측했고, 생물학계에서는 신약 개발과 질병치료에 항공망 네트워크를 활용하고 있다는 것입니다.
저자는 우리 일생 생활과 아주 밀접한 '교통체증'의 해소에도 네트워크 이론이 활용될 수 있다는 것을 아주 재미있게 설명해 줍니다. 예컨대 네트워크 연구를 해보면 어떤 경우에는 도로를 막거나 다리를 없애야 교통흐름이 더 좋아지는 일이 생긴다는 것입니다.
데이터 과학과 복잡계 네트워크를 활용하면 주식 네트워크를 구성하여 활용할 수도 있고, 사회 네트워크 분석에도 활용될 수 있으며, 심지어 앞서 소개한 것처럼 대통령 선거 결과도 예측할 수 있다는 것입니다.
또 직원들의 네트워크를 잘 분석하면 적절한 인사 배치를 통해 업무 효율성과 시너지를 높일 수 있다는 것입니다. 저자는 이런 분석은 모두 정보와 네트워크의 결합 위에서 이루어진다는 점을 특별히 강조합니다.
"정보와 네트워크가 결합해야 복잡계에 대한 모형화가 가능하고 그것을 통해 우리가 여태껏 손도 대지 못했던 복잡계를 예측하고 조절까지 할 수 있습니다." (본문 중에서)
생명의 본질은 정보다
두 번째 강연자는 카이스트 바이오및뇌공학과 김동섭 교수입니다. 저자의 공연을 한 마디로 요약하면 '생명의 본질은 바로 정보다'하는 이야기입니다. 생명의 본질을 정의하는 여러 견해가 있을 수 있지만 생물학자의 입장에서 본 생명의 본질은 우리 몸에 저장된 유전체로 쓰여진 정보가 생명의 본질이라는 이야기입니다.
"우리 몸에는 46개의 염색체가 있고, 각각의 염색체는 네 가지 종류의 핵산인 ATGC(아데닌, 티민, 구아닌, 시토신) 이루어져 있습니다. 그중 일부분이 유전자이고 그것들이 단백질을 만들어 내서 모든 일을 합니다." (본문 중에서)
예컨대 생명에 대한 모든 정보는 DNA 이중 나선 속에 담겨 있다는 것입니다.
"인간의 세포 하나에 들어 있는 DNA를 다 펴면 길이가 2미터 정도 되는데, 이 이중 나선 구조 속에는 염기쌍들의 배열이 30억 개, 전체 염색체를 통틀어 3만 개 정도의 유전자가 존재합니다." (본문 중에서)
저자는 오늘날처럼 DNA 정보를 밝혀내기까지 여러 천재들의 고민과 피땀 어린 연구과정을 요약해서 독자들에게 들려줍니다. 조지 가모브, 왓슨과 크릭 같은 학자들 크릭과 브래너의 실험, 니런버그의 실험 같은 연구 과정들을 소개하는 데 다 이해하지는 못하였습니다만 맥락은 쫓아갈 수 있겠더군요.
아울러 유전정보를 어떻게 해석하는지, 유전정보 해석을 통해서 어떤 연구로 확장되고 있는지 하는 좀 지루한 이야기도 있습니다만, 금세 인간 유전체 계획이 어떻게 발전하고 있는지, 유전은 어떻게 이루어지는지 하는 흥미로운 이야기로 이어집니다. 개인맞춤 의학과 유전 정보를 활용한 진단, 예방 및 치료 등에 관한 희망적인 전망도 보여줍니다.
일반 사람들이 관심을 가지는 주제들도 자주 언급하는데요. 예컨대 '부모의 지능이 자녀에게 유전되는가 하는 질문들입니다. 자, 그럼 머리 나쁜 부모에게서 머리 좋은 자녀가 태어날 확률은 얼마나 될까요?
"DNA 서열 하나가 한 세대에서 다른 DNA로 바뀔 확률이 10⁻⁸ 이라는 결과가 나왔습니다. 우리 몸속에 DNA가 3억 개, 곱하기 10⁹개가 있으니까 확률적으로 부모님과 나 사이에 돌연변이가 500개나 1000개 정도 생긴다고 합니다."(본문 중에서)
말하자면 부모보다 유독 머리가 좋은 경우도 이런 돌연변이를 통해 생길 수 있다는 것입니다. 또 한 가지 더 흥미로운 이야기가 있는데요. 사람을 구성하는 원자들에 관한 모든 정보를 알면 그 정보대로 원자를 연결해서 사람을 만들 수 있을 텐데 이 둘은 같은 사람인가 하는 흥미로운 질문이었습니다.
머리 나쁜 부모에게 머리 좋은 아이가 태어날 확률
이 질문에 김동섭 교수는 "똑같은 사람이기는 하지만 1분 후에 당신과 지금의 당신이 똑같은 사람이 아닌 것처럼 시간이 지났을 때 똑같이 생각하고 똑같이 행동할지는 알 수 없는 일"이라고 이야기합니다.
세 번째 강의인 양자암호와 양자정보학 강의가 가장 어려웠습니다. 물리학자인 카이스트 이해웅 교수의 강의인데 암호학의 발전 과정을 들려주는 도입부는 흥미로웠습니다만 복잡한 암호학에 관한 소개부터 어려워지기 시작했지요.
더군다나 빛의 편광을 활용한다는 양자 암호학에 관한 이야기에 나오는 편광이론과 양자역할 같은 복잡한 이야기들은 따라가기 어려웠습니다. 좀 자존심이 상하는 이야기도 있더군요. 저명한 물리학자인 머리 겔만이라는 학자는 다음과 같은 말을 하였답니다.
"양자 역할을 아는 사람과 모르는 사람의 차이는 양자 역학을 모르는 사람과 원숭이의 차이보다도 크다. 양자 역학을 모르는 사람은 금붕어와 다를 바가 없다." (본문 중에서)
그렇지만 양자역학이라는 학문이 무지하게 어려운 것은 분명한 것 같더군요. 양자역학도 모르는 금붕어와 다를 바 없는 존재가 되었지만 양자 역학의 대가라는 닐스 보어는 "양자 역할을 접하고 충격을 받지 않은 사람은 양자 역학을 이해하지 못한 것이다"라고 말했습니다. 또 리처드 파인만이 "양자역학을 이해한 사람은 아무도 없다"고 말했다는 것에서 위안을 삼았습니다.
아무튼 '선형 중첩과 확률', '측정과 파동함수 붕괴'. '양자 얽힘' 같은 복잡한 이야기들은 분명히 읽었지만 무슨 말인지 이해할 수 없었습니다. 다만 양자컴퓨터가 만들어지면 지금 컴퓨터와는 비교할 수 없는 막강한 성능을 발휘 할 것이라는 것과 양자상태의 공간이동이 현실로 가능하다는 것과 같은 결과적인 이야기들은 흥미를 끌더군요.
아무튼 입자물리학에서 배우는 양자 역학은 물리학자들에게도 쉬운 학문이 아니라고 하니 '금붕어' 취급 받아도 그리 마음 아프지는 않았습니다. 세 학자의 강연 중에서 가장 어려운 이해웅 교수의 강연도 이론적 배경을 설명하는 내용이 어려웠지만 그래도 최신 연구의 흐름 같은 것은 재미있게 읽을 수 있었기 때문입니다.
천재들이 모인다는 카이스트에서도 이해웅 교수의 강연은 '졸리는 것'으로 유명한 명강의라고 합니다. 부모에게서 물려받은 DNA 중에 카이스트 천재들 같은 지능 '돌연변이'가 일어나지 않은 저 같은 평범한 사람들은 듬성듬성 이해하는 것으로도 즐거운 일이었습니다.
카이스트 명강의 시리즈 1권 <구글 신은 모든 것을 알고 있다>는 제목보다는 좀 어려운 책입니다. 하지만 우리가 살아가는 정보화 시대를 떠받치고 있는 과학계의 흐름을 엿볼 수 있는 흥미롭고 유익한 책 임에 틀림없습니다. 아울러 제목처럼 '구글신'의 예언자적 능력을 경험하게 되는 것만으로도 재미나는 책입니다.
구글 신은 모든 것을 알고 있다 - 정하웅.김동섭.이해웅 지음/사이언스북스 |