티스토리 뷰


여러분이 현재 말하고 글 쓰는 방식으로 미래의 정신상태나 미래의 정신병 발병가능성을 예측할 수 있을까요? 이 매력적인 강연에서 신경과학자인 마리아노 시그만은 우리가 쓰는 단어들이 우리의 내면 세계에 대해 어떻게 힌트를 주는지 알아내기 위해 고대 그리스와 성찰의 기원을 돌아보고, 정신분열증의 발달을 예측할 수 있는, 단어로 지도를 만드는 알고리즘에 대해 자세히 설명합니다. 시그만은 말합니다. "우리는 미래에 매우 다른 형태의 정신 건강을 보게 될 지도 모릅니다. 우리가 말하고 쓰는 단어를 객관적, 양적으로 자동화하여 분석한 내용에 기반해서 말이죠."



게시일: 2016. 6. 16.


역사적인 기록을 통해 고대 그리스인들이 어떤 옷을 입었고

어떻게 살았고, 어떻게 싸웠는지 알죠.


하지만 그들은 어떻게 생각했을 까요?


한 가지 자연스런 생각은 인간 사고의 가장 심오한 면인

상상하는 능력

의식하는 것

꿈 꾸는 능력이

늘 동일했다고 합니다.


다른 가능성도 있습니다.

문화를 만든 사회적 변화가 인간 사고의 구조적 기둥도

변화시켰을 수도 있다는거죠.


이것에 대한 견해는 각자 다를 수 있습니다.

사실 이건 오랫동안 이어져온 철학적 논쟁입니다.


하지만 이 질문이 과학과 상통하기는 할까요?


저는 이런 얘기를 하고 싶습니다.

벽돌 몇 개로 그리스 도시 모습을 재구성하는 것과

같은 방법으로

어떤 문화의 문서들은 인간 사고의 고고학적 기록이자

화석이라고요.


사실

인간 문화에 대한 가장 오래된 서적에

몇 가지 심리학적 분석을 해봄으로써

줄리안 제인스는 70년대에 매우 무모하고 급진적인 가설을 냈습니다.

불과 3,000년 전만 해도

사람들은 모두 정신분열증 환자였다는 겁니다.


줄리안의 주장의 근거는

이 고서들에 묘사된 첫 인류가

다른 전통에서나

다른 지역에서 신이나 뮤즈의 목소리로

여겨졌던 목소리를

듣고 복종하는 것처럼 항상 행동했다는 겁니다.

오늘날 환각이라고 하는 거죠.


그리고 시간이 흐르면서

사람들은 자신이 창조자이자 내면의 소리의 주인이라는 걸 인식하기 시작한겁니다.

이걸 인식하면서 사람들은 자아 성찰을 할 수 있게 됩니다.

자신의 생각에 대해 생각할 수 있는 능력이죠.


그러니까 제인스의 이론이 주장하는 건

적어도 오늘날 우리가

존재의 주도권을 자신이 갖고 있다는 느낌이라고 여기는 의식에 한해서는

의식은 최근에 일어난 문화적 발전이라는 겁니다.

꽤 멋있는 이론입니다.

하지만 명백히 보이는 문제도 있죠.

몇 개의 매우 특수한 예시에 근거한다는 겁니다.


그러니까 문제는

인간 역사에서 3,000년 전에서부터 자아 성찰이 시작됐다는 이론이

양적이고 객관적인 방법으로 검토될 수 있는가 입니다.

이렇게 하기 힘든 이유는 뻔합니다.


플라톤이 어느날 아침에 일어나서 이렇게 적은 건 아니잖아요.

"안녕. 난 플라톤이야.

오늘부터 난 완전한 자아 성찰을 할 수 있는 의식이 있어."

(웃음)


이게 사실은 문제의 본질을 보여줍니다.

기록된 적 없는 관념의 출현을 찾아내야 합니다.

문자를 통한 성찰은 우리가 분석하려는 서적에

여러 번 나옵니다.


이것에 대한 우리의 해결방법은 단어로 된 공간을 만드는 겁니다.

이 커다란 공간에는 온갖 단어가 다 들어있는데

어떤 두 단어 사이의 거리는

그 둘이 얼마나 밀접한 관계를 갖는지 알려줍니다.


예를 들어

"개"와 "고양이"는 가까이 있어야겠지만

"자몽"과 "로그"는 매우 멀리 떨어져 있어야겠죠.

공간 안에 있는 어느 두 단어에나 해당되는 일입니다.


단어 공간을 만드는 데는 여러 방법이 있습니다.

하나는 전문가의 자문을 구하는 것입니다.

사전으로 하는 것처럼요.

다른 방법은

두 단어가 연관이 있으면, 확률상으로보다 더 자주

같은 문장이나, 같은 단락, 같은 문서에

등장하는 경향이 있다는 단순한 추정을 따르는 것입니다.


이 단순한 가설은 이 단순한 방식은

이게 굉장히 복잡하고

고차원적인 공간이라는 사실과

관련된 계산 요령 몇 가지와 함께

굉장히 효과가 있습니다.

이게 얼마나 효과있는지 조금 보여드릴게요.



이 단어들을 익숙한 단어로 분석했을 때의 결과입니다.

먼저 단어들이 자동적으로

의미론적 집합으로 구성되는 걸 보실 수 있을 겁니다.



과일이 있고, 신체부위가 있고

컴퓨터 부품, 과학 용어 등등이요.

이 알고리즘은 우리가 개념을 계층적으로 체계화한다는 것도 보여줍니다.


예를 들어

과학 용어가 두 개의 하위 범주로 나눠지는 걸 볼 수 있습니다.


천문학 용어와 물리 용어로요.

그리고 세세한 부분들이 있습니다.



예를 들어, 천문학이라는 단어는

저기 있는 게 이상해 보이지만

사실은 있어야 할 곳에 있습니다.

천문학의 본질인

실제 과학과

천문학이 나타내는

천문학적 용어 사이에 있어요.


더 얘기할 수도 있습니다.

사실, 이걸 오랫동안 쳐다보면서

임의의 궤적을 그려나가면

시를 쓰는 것과 같다는 느낌을 받을 수 있을 겁니다.


그 이유는, 공간 안에서 걷는 것이

마음 속에서 걷는 것과 한편으로 유사하기 때문입니다.



마지막 방법은 이 알고리즘인데

어떤 단어들이 성찰의 이웃에 속하는지와

우리의 직감이 무엇인지를 밝혀주는 것입니다.

예를 들어

자신, 죄책감, 이성, 감성같은 단어들은

"성찰"과 매우 가깝습니다.

하지만 다른 단어들은

빨강, 축구, 양초, 바나나는

매우 멀어요.


공간을 세우고 나면

이전에는 추상적이고

모호해 보였던

성찰이나 다른 관념들의 역사에 관한 질문이

구체화됩니다.

정량과학에 부합될 수 있습니다.

우리가 해야하는 일은 책을 가지고

디지털화 시켜서

일련의 단어들을 궤적에 만들고

공간에 투영시켜서

이 궤적이 많은 시간동안 성찰이라는 개념에 근접하게

선회하는지 묻는 것이 전부입니다.


이걸 통해서

우리에게 가장 잘 명문화되어있는

고대 그리스 전통 속의

성찰의 역사를 분석할 수 있습니다.

그래서 우리는 모든 서적들을 가져다가

시간에 따라 나열하고

각각의 서적에서 단어를 가져다가

공간에 투영시켜서

각 단어가 성찰과 얼마나 가까운지 묻고

그것으로 평균을 냈습니다.


그리고 시간이 흐르면서 이 고서들이 점점 더

성찰의 개념에 근접하게 다가가는지를 물었습니다.



바로 이게 고대 그리스의 전통에서 일어나는 일입니다.

호메로스의 전통의 가장 오래된 고서들에서 볼 수 있듯

성찰에 가까워지는 책이 약간 증가합니다.

하지만 서력 기원전 약 4세기 쯤에

성찰에 더 가까워지는 고서의 양이

거의 5배 가까이

급격히 증가하기 시작합니다.


이것의 좋은 점 중 하나는

우리가 이제

다른, 독립적인 관습에도 똑같이 해당되는지 물을 수 있다는 겁니다.

그래서 유대교와 기독교의 공통적인 관습에 대해서도

똑같은 분석을 하여 사실상 똑같은 패턴을 얻었습니다.


똑같이, 구약성서의 가장 오래된 서적에서 약간의 증가를 볼 수 있고

신약성서의 새 책에서

더 급격히 증가합니다.


그리고 성찰의 정점을 "성 어거스틴의 참회록"에서 볼 수 있습니다.

서력 기원전 4세기 쯤에요.

이게 굉장히 중요한 이유는 성 어거스틴이 학자들이나, 문헌학자, 사학자들에게 성찰의 창설자 중 한 사람으로 인정받기 때문입니다.

사실 일부는 성 어거스틴이 근대 심리학의 아버지라고 생각합니다.

그래서 정량적이고

객관적인 미덕을 지닌

그리고 찰나에 계산이 가능해서

매우 빠르기도 한 우리의 알고리즘은

이 기나긴 역사를 가진 수사에 가장 중요한 결론들을

잡아내 줄 수 있습니다.


이게 사실 과학의 아름다운 이유 중의 하나라고 볼 수 있습니다.

이 아이디어가 수많은 다른 영역들로

번역되고 일반화될 수 있다는 것 말이죠.

그래서 인간의 의식이 과거에 어땠는지 물었던 것과 같은 방식으로

어쩌면 우리가 물을 수 있는 것 중 가장 어려운 질문을 물었습니다.

이것이 우리의 정신의 미래에 대해 무언가를 말해줄 수 있는지를요.


더 정확히 말하자면

우리가 오늘날 쓰는 단어가

며칠 뒤나, 몇 달 뒤, 혹은 몇 년 뒤에 우리의 정신 상태가

어떨지를 알려줄 수 있을지 말입니다.


많은 사람들이 병을 예방하기 위해

심박수나 호흡

유전 인자를 측정하는 센서를

오늘날 착용하는 것처럼

우리가 말하고, 트위터에 올리고, 메일로 보내고, 쓰는 단어들을

관찰하고 분석하는 것이

우리의 정신에 문제가 생길지를 미리 알려줄 수 있을지를 물을 수 있습니다.


저에게 이 연구를 하는 데 있어

형제와도 같았던 기예르모 체키와 함께

우리는 이 작업에 착수했습니다.

정신분열증에 걸릴 위험이 높은 34명의 젊은이들의 녹음된 발화 내용을 분석했습니다.


우리는 첫째날에 녹음된 말을 측정하고

앞으로 3년 이내의 시간 동안 정신병에 걸릴지를

그들이 한 말의 특징들로

예측할 수 있는지 물었습니다.


하지만 안타깝게도 계속 실패했습니다.


미래의 정신 구조를 예측하기엔

의미론에 있는 정보가 충분하지 않았습니다.

고대 문서로 했던 것처럼

정신분열증 환자 집단과

통제 집단을 구분짓기에는 충분했지만

미래의 정신병 발달 가능성을 예측하기엔 부족했습니다.


그런데 우리는 깨달았습니다.

가장 중요한 것은 그들의 말의 내용이 아니라

말하는 방법일지도 모른다고요.


더 자세히 말하자면

의미론적으로 어느 단어 집단에 근접하느냐가 아니라

한 의미론적 집단에서 다른 집단으로

얼마나 멀리, 그리고 빠르게 건너뛰느냐는 것이죠.


그래서 우리는 의미론적 일관성이라고 명명한

이 측정법을 고안해냈습니다.

하나의 의미론적 범주 안에 있는 하나의 의미론적 주제의 지속성을

측정하는 방법이죠.

그리고 결과적으로 의미론적 일관성에 기반한 알고리즘은

이 34명으로 이루어진 집단을

누가 정신병에 걸리고 안 걸릴지 100%의 정확도로 예측할 수 있었습니다.

이건 현존하는 그 어떤 임상 측정도

근접하게조차 해낼 수 없었던 일입니다.


저는 생생하게 기억납니다. 

이 연구를 하는 동안 저는 컴퓨터 앞에 앉아서 제가 부에노스 아이레스에 있을 당시

제 첫 제자였던, 그리고 연구 당시에는 뉴욕에 살고 있던 폴로가 쓴 트윗을 잔뜩 읽었습니다.


명시적으로 드러난 건 없었기에

무엇인지 정확히 말은 못하지만 트윗에는 뭔가가 있었습니다.

저는 뭔가 잘못되고 있다는 걸

직감적으로 강하게 느꼈습니다.


그래서 폴로에게 전화를 했는데 그는 실제로 아픈 상태였습니다.

그리고 이 단순한 사실을 통해서

글 속의 의미를 찾아내서

그의 감정을 느낄 수 있는 것이 간단하지만 매우 효과적으로 도울 수 있는 방법임을 알 수 있었습니다.


오늘 말씀드리는 것은 우리 모두가 가지고 있고, 공유하는 직감을 알고리즘으로 변환시키는 방법을 이해하는 데 점점 더 가까워지고 있다는 것입니다.

그럼으로써 정신 건강의 전혀 다른 형태를 미래에 보게 될 수도 있습니다.

우리가 쓰고, 말하는 단어의 객관적, 양적, 자동적 분석에 기반해서요.

감사합니다.

(박수)


번역: Ju Hye Lim 

검토: Jihyeon J. Kim


댓글