본문 바로가기
책/IT과학

수학이 만만해지는 책, 스테판바위스만

by Caferoman 2022. 5. 18.

일상속 스며들어 있는 수학 이야기 : 수학이 만만해지는 책, 스테판바우만

넷플릭스, 아마존의 추천 알고리즘

〈아이언맨〉을 본 뒤 〈아이언맨 2〉까지 본 사람의 수가 매우 많다면 그 둘의 매칭 수준은 아주 높은 편이다. 따라서 원작을 본 뒤 후속작을 아직 감상하지 않은 이용자들에게 〈아이언맨 2〉는 제법 괜찮은 추천작이 된다. ... 문제는 그 데이터를 실제로 적용하는 과정에서 다양한 돌발 상황이 벌어질 수 있다는 점이다. 예를 들어 나와 똑같은 공포영화를 본 이용자들에 관한 정보를 수집했다고 치자. 그런데 만약 내가 공포영화만큼이나 다큐멘터리도 좋아한다면? 앞서 수집한 집단 중 나와 취향이 일치하는 사람의 수는 확 줄어든다. 나와 똑같은 공포영화를 봤을 뿐 아니라 똑같은 다큐멘터리까지 감상한 이들의 수는 상식적으로 생각해봐도 적을 수밖에 없다. 게다가 특정 작품을 시청한 회원의 수가 적을수록 추천 목록의 정확도는 떨어지기 마련이다. 얼핏 단순해 보였던 추천 목록 작성도 실제로 적용하는 과정에서는 이렇듯 문제가 발생할 수 있다.

 

이 책은 일반적인 수학책이라기 보다 공학에서 응용되는 공학수학, 알고리즘과 관련된 이야기들이 주를 이룹니다. 

첫번째로 소개하는 넷플릭스의 추천 알고리즘은 단순히 A와 B를 모두 시청한 사람이 많다면 A를 시청한 사람에게 B를 추천하는 수준을 넘어서는 것을 그 속에는 그래프 알고리즘이 존재함을 소개하고 있습니다.

 

이럴 때는 게시된 작품 전체를 일종의 지도로 전환하는 것이 좋다. 앞선 도시고속철도 노선도처럼 일종의 ‘작품 지도’을 만드는 것이다. 이때 모든 게시물은 하나의 점으로 간주된다. 넷플릭스 노선도를 분석하려면 여기에도 숫자를 표시해줘야 한다. 물론 지도상의 숫자는 한 역에서 다음 역까지 걸리는 시간이 아니라 이 역에서 다음 역으로 이동한 사람들의 수, 다시 말해 서로 연결된 두 작품을 시청한 회원의 수다.

 

저자는 넷플릭스, 구글 그리고 내비게이션 등 다방면에 걸쳐 그래프이론이 응용되고 있으며 우리 일상의 수많은 영역에서 수학의 혜택을 받고 있음을 강조하고 있습니다. 

 

만약 우리에게 숫자가 없다면 : 아마존 파라항족 이야기

아마존 밀림 한가운데에 위치한 피라항족은 200년째 브라질 상인들과 물물교환을 통해 상거래를 하고 있지만, 지금도 할 줄 아는 포르투갈어는 단 몇 마디뿐이다. 몇 마디 주고받지 않아도 다른 곳에서는 감히 엄두를 내지 못할 만큼 싼 가격에 값비싼 브라질너트와 고무를 손에 넣을 수 있다. 흥정 과정은 단순한 편이다. 피라항족은 손가락으로 배 위에 실린 물건을 계속 가리키고, 물건을 싣고 간 상인은 “에이, 그래도 그건 너무하잖아요?”라고 항의하며 가격을 조율하는 식이다.
브라질 상인들은 자신이 가져온 담배와 위스키로 이번에는 얼마만큼의 너트와 고무를 받아낼 수 있을지 몰라 가슴 졸이지만, 피라항족은 ‘얼마’를 고민하지 않는다. 숫자가 없기 때문이다! 숫자도 없는 판에 정해진 가격 따위가 있을 리는 더더욱 만무하다. 자신들의 물건에 일정한 가격을 매길 필요성도 느끼지 못한다. 눈앞에 현물이 있는데 가격이 왜 필요하냐는 식이다. 둘 중 누가 더 양심적이고 공정할까? 물건의 실제 가치보다 조금이라도 대가를 덜 지불하려고 안달이 난 쪽은 피라항족일까, 브라질 상인들일까? 답은 모두들 짐작하는 그대로다.

 

아마존 밀림속에서 살고 있는 파라항족에게는 특이하게도 숫자라는 개념이 없습니다. 그래서 물물교환을 할 때에도 정량적인 기준없이 흥정이 오고가는 기이한 상황에 처하게 됩니다.

 

피라항어에는 숫자를 가리키는 말이 없다. 어쩌다 ‘아주 많은 양’이라는 말을 할 때는 있지만 ‘하나’라는 단어는 없다. ‘빨갛다’라는 표현도 없고 과거완료형 같은 문법도 존재하지 않는다. 피라항족은 숫자 없이 살아가는 지구상의 몇 안 되는 부족 중 하나인 것이다. 피라항어에는 선이나 각도 등 기하학적 형태를 묘사하는 단어도 없는데, 이 또한 극소수의 희귀어에서만 발견되는 특징이다.

 

파라항족을 통해서 살펴볼 수 있는 사실은 숫자의 개념은 타고나는 것이 아니라 후천적으로 학습된다는 점입니다. (인류에게 수학이 등장한 것은 5000년 정도 밖에 되지 않았다고 합니다.) 그래서 아기들 역시 22개월 이전에는 3개보다 많은 개수를 구분하지 못하며 22개월이 지나서야 4개의 사물을 동시에 인지할 수 있게 되어 이보다 큰 숫자의 개념이 생긴다고 합니다.

 

뉴턴과 라이프니츠의 진흙탕 싸움

1660년~1690년 즈음, 서로의 존재조차 모르던 뉴턴과 라이프니츠는 미분과 적분이라는 개념을 거의 동시에 발견하게 됩니다.

 

1684년에 라이프니츠는 자신이 발견한 이론, 즉 변화하는 무언가를 계산하는 방법에 관한 책을 출간했다. 수학계는 곧 술렁였다. 긍정적 의미의 술렁임이었다. 라이프니츠를 따르던 수학자들은 스승이 발표한 이론을 집중적으로 파고들었다. 1693년에는 일반인을 위해 설명을 덧붙인 미적분 책도 발간했다. 반면 뉴턴 쪽은 잠잠했다. 아무것도 발표하지 않았다. 뉴턴의 주변인 몇몇이 그가 완전히 새로운 수학 이론을 개발 중이라는 정보를 입수하긴 했지만, 구체적으로 무엇에 관한 이론인지 아는 사람은 아무도 없었다. 자신이 개발한 새로운 연산법을 독점하고 싶은 마음에 뉴턴이 모든 과정을 극비에 부쳤기 때문이다.

 

세상에 미분과 적분의 개념을 먼저 소개한 것은 뉴턴이 아닌 라이프니츠였습니다. 실제로 누가 먼저 이 개념을 발견했는지 정확한 순서는 알 수 없지만 이는 자신이 발견한 지식을 먼저 적극적으로 알리려던 라이프니츠의 태도가 새로운 지식을 자신만 독점하려던 뉴턴의 폐쇄적인 태도보다 긍정적으로 작용했음이 분명해 보입니다.

 

라이프니츠는 뉴턴이 심취해 있던 수학적 가설을 먼저 세상에 터뜨렸다. 뉴턴으로서는 아주 당혹스러웠을 테지만 공식적으로는 아무 대응도 하지 않았다. 그 대신 1676년에 라이프니츠에게 편지 한 통을 보냈다. 자신 또한 라이프니츠와 비슷한 이론을 연구 중임을 알리는 편지였다. 뉴턴이 편지 내용을 일부러 알쏭달쏭하게 적은 이유는 편지를 보낸 목적이 자신의 이론을 상세히 피력하기 위함이 아니었기 때문이다. 훗날 뉴턴이 한 말을 참고하면, 그는 돌아가는 상황을 지켜보다가 여차하면 라이프니츠가 자신의 이론을 훔쳤다고 주장하려던 것으로 보인다. 뉴턴은 그 작업을 직접 하는 대신 제자들을 시켜 소문을 퍼뜨리려고 했다. 라이프니츠가 미적분 이론을 대중에게 널리 알릴 계획임을 알고는 라이프니츠를 비방하고 폄하하라며 제자들을 들볶은 것이다.

 

그리고 그 뒷 이야기는, 예상대로 과학사에 길이 남을 진흙탕 싸움이 이어졌습니다. 뉴턴과 라이프니츠의 추종자들은 몇 년에 걸쳐 서로를 비방하는 글을 쏟아내며 대립각을 세웠으며. 라이프니츠는 당시 과학계에서 가장 권위 있던 조직인 영국왕립자연과학학회(Royal Society)에 지지를 호소하는 편지를 보내고 학회는 두 수학자 중 누가 먼저인지를 판가름하기 위해 조사에 착수하게 됩니다. 허나 아쉽게도 영국왕립자연과학학회의 회장은 다름 아닌 뉴턴이었기에 조사의 중립성은 거의 지켜지지 않았고 뉴턴은 모든 이론이 자신의 것이라 주장했고, 라이프니츠를 패배를 시인하지 않는 표절자에 불과하다고 폄하했습니다.

 

뉴턴이 자신의 학술적 우위를 입증하기 위해 얼마나 많은 억지와 고집을 부렸는지는 그 뒤로 133년이 지나서야 밝혀졌다. 1716년, 라이프니츠가 세상을 떠나고도 한참 뒤에야 둘 사이의 논쟁은 종지부를 찍었다. 그래서 누가 먼저였냐고? 지금은 뉴턴이 미적분학의 개척자라고 알려져 있다. 당시 라이프니츠는 수학에 관해 두터운 지식을 쌓기에는 너무도 새파란 스무 살 청년에 지나지 않았다. 그렇지만 라이프니츠가 뉴턴의 이론을 훔친 것은 아니었다. 뉴턴보다 몇 년 늦은 시기에 똑같은 이론을 개발한 불운아였을 뿐.

 

아무튼 1600년대 후반에 알려진 미분과 적분의 개념은 오늘날 삶의 상당한 영역에서 그 중요성과 존재감을 뽐내고 있습니다.

 

날씨가 워낙 어디로 튈지 모르는 변덕쟁이인 탓에 100% 들어맞는 일기예보란 없다. 초대형 슈퍼컴퓨터를 동원해도 모든 변수를 정해진 시간 내에 계산하기 어렵다. 이에 기상학자들은 ‘포기할 건 포기하자!’라는 슬로건을 내걸고 중도의 길을 택했다. 10제곱킬로미터 이내의 기상은 동일하다는 가정 아래 슈퍼컴퓨터를 가동하는 방법을 따른 것이다. 그 탓에 일기예보가 조금씩 엇나갈 때도 있지만, 역설적으로 그런 양보와 타협 덕분에 일기예보의 전반적 신뢰도가 높아졌다.

슈퍼컴퓨터는 관측 지역을 좌표평면으로 전환해 각 사분면의 기상 변화 상황을 끊임없이 계산한다. 미분을 이용해 대기의 이동속도를 측정하고, 적분을 이용해 일정 시간 뒤의 변화량을 측정한다. 이렇듯 수학 덕분에 일기예보의 정확도가 점차적으로 개선되었다. 지금은 내일의 날씨 정도는 거의 들어맞는 수준에 이르렀고, 주간 일기예보도 80% 수준의 정확도를 자랑한다. 어떤가? 미분과 적분이 꽤 쓸 만한 녀석들 같지 않은가?

 

도박에서 시작된 확률과 통계의 개념

블레즈 파스칼(Blaise Pascal)과 피에르 드 페르마(Pierre de Fermat)는 놀랍게도 수학을 취미로 했다고 합니다. 어느 날 파스칼은 어느 프랑스 귀족에게서 아주 특별한 고민 하나를 해결해달라는 부탁을 받았는데 이는 도박에서 승자가 정해지기 전 게임을 중단할 경우 판돈 분배에 관한 문제였다고 합니다. 당시에는 국왕의 갑작스러운 부름을 받으면 귀족들은 하던 게임도 즉시 중단해야 했기에 들어온 의뢰인데 파스칼은 페르마에게 게임을 계속했을 때 승자가 될 확률이 더 높은 쪽을 판단할 수 있는 수학적 근거를 찾고자 했는데 이것이 바로 확률 또는 통계라 불리는 새로운 수학 분야의 시발점이었습니다.

 

파스칼과 페르마가 남긴 업적은 뭘까? 아무리 봐도 아주 중요한 문제를 해결한 것 같진 않은데? 카드놀이를 갑자기 중단하는 게 뭐 그리 대단한 일이라고? 나중에 다시 이어가면 그만 아닌가? 오늘날 정말 중요해진 수학 분야의 시초라기에는 시시해 보인다. 그런데 파스칼과 페르마가 편지를 주고받은 뒤 얼마 지나지 않아 수많은 수학자들이 이 분야를 파고들었고, 그 연구 결과들을 점점 더 복잡한 상황과 분야에 적용해나갔다.

 

확증편향 : SNS 단정하는 나의 성향을 기준으로 보고싶은것만 보게 만드는

 

구글이나 페이스북은 이용자들이 필터 버블(filter bubble), 즉 확증편향에 빠지게끔 설계되어 있음을 저자는 책의 말미에 언급하고 있습니다. 그래프이론과 이를 활용한 추천 알고리즘은 자신의 관심사와 일치하는 맞춤형 정보, 필터링된 정보를 손쉽게 얻을 수 있도록 해주지만 이로인해 편향된 정보만을 받아들이게 되어 버블에 갇힐 수 있는 이면이 존재함을 경고합니다.

 

가짜 뉴스나 개인정보 보호, 인공지능이 초래할 미래에 대한 우려는 이제 사회적 담론이 되었다. 그 모든 주제는 그래프이론의 능력 범위 또는 한계와 관련이 있다. 그렇기 때문에 그래프이론을 알아야 할 필요성이 커졌다. 사회적으로 공론화한 주제에 대해 자신의 의견을 갖고 싶다면, 자타 공인 전문가들이 내놓는 해법 중 어떤 것이 실천 가능하고 어떤 것이 불가능한지 조금이라도 판단하고 싶다면 그래프이론이 당신에게 큰 힘이 되어줄 것이다.

 

우리가 수학을 통해 받고 있는 삶의 편의와 혜택의 이면에는 우리가 경계하고 주의해야 할 시스템의 알고리즘이 있음을 저자는 끝으로 강조하고 있습니다. 수학, 몰라도 사는데 문제 없지만 알지 않으면 눈뜨고 코베일 수 있는 존재 또한 수학이 아닐까요?

반응형

댓글