2025-11-24
Insights
게임, 앱, 웹소설 등등 모두 내가 제공하고자 하는 서비스다. 나의 목적은 내 서비스를 사람들이 원하고, 계속 찾고자 하는 욕망을 만드는 것이다.
사람은 단순하여 본인에게 손해가 되는 일은 피하려 하고, 이득이 되는 일은 더 하고싶어 한다. 그렇다면, 서비스를 제공하는 제공자의 입장에서 사용자에게 계속 ‘이득’이란 것을 제공해야 한다.
그 이득이란 무엇일까? 실질적인 외재적 보상을 통한 이득이 있을 수 있겠지만, 짜릿함, 쾌감, 도파민, 행복감, 세로토닌, 즐거움, 편리함 등의 내재적 가치다. 내가 하고자 하는 모든 일은 내재적 가치를 제공하여, 이를 내재적 보상 + 외재적 보상을 얻는 행위와 같다.
그런 내재적 가치는 언제 만들어질까? 인간의 행동 동기를 생존과 번식을 위한다는 이론을 사용한다. 인간의 모든 감정, 행동, 유전적 성질은 생존과 번식을 위해 진화한다.
결핍이 있어야 행동한다. 만약 내가 따뜻한 밥 나오고, 잠잘 공간 있는 본가에서 계속 머무른다면, 내가 행동할 이유가 있을까? 없다. 그곳에서 적응하면 된다. 이는 자연스러운 행위다. 만약 자취를 하며 무언가 부족하다고 생각되는 결핍이 있다면, 나는 그 결핍을 채우기 위해 행동한다.
여자친구와 현재 관계가 좋고 앞으로 이 관계가 끊어지지 않을 것 같다는 확신이 있다면, 나는 더 노력할까? 결핍이 있어야 행동한다. 여자친구가 없어 여자친구를 만들기 위해 내외면을 가꾸고 이성과 만나기 위한 유리한 행위들을 하기 위한 동기가 된다. 여자친구가 생긴다면 이 결핍이 해소되어 소홀해지는 것은 자연스러운 결과일 수 있다.
결핍 이론
그렇다면, 인간의 모든 행동 동기는 결핍에서 비롯되는 것일까? 이 가정을 참이라고 가정하자. 결핍 이론을 굳이 인간이란 범주 내에서만 적용할 이유가 있는가? 더 일반적으로, ‘모든 생명체의 행동 동기는 결핍에서 비롯된다’ 라는 가정을 참이라고 하자. 그렇다면, 결핍이란 무엇인가?
결핍을 현재 상태와 바라는 상태의 차이\(\Delta\)로 정의한다. 성장 욕구 또한 현재 상태에 대한 불만족(결핍)으로 해석할 수 있다.
바라는 상태라는 것이 뭘까? 바라는상태란 것을 ‘상상한 미래’라고 정의한다면, 과연 배고픔 또는 추위를 피하기 위한 결핍이 과연 ‘바라는 상태’일까? 우리가 배고프면 본능적으로 음식을 찾고, 추우면 본능적으로 그것을 피하기 위해 따뜻한 곳으로 들어가는 것 뿐이지, 우리가 그 행위를 하기 전 ‘배부른 상태를 바란다’를 상상하고 행동하지는 않지 않은가?
생각이 바뀌었다. 연인관계에서 가장 중요한 것은, 서로의 결핍을 채워줄 수 있는가? 이다.
자유에너지 원칙Free Energy Principle은 ‘존재하는 모든 것은 놀람(surprisal)을 최소화한다.’
지금까지 얻은 논의를 정리하여 하나의 인사이트를 도출해보자.
- 생명체는 엔트로피를 최소화하려 한다.
- 왜냐하면, ‘죽음’이란 상태는 생명체의 무질서도가 가장 높은 상태와 같다. 죽으면, 자연으로 흩어진다. 따라서 생존이란 죽음을 피하기 위한, 엔트로피를 낮추기 위한 투쟁이다.
- 여기서 말하는 엔트로피란 불확실성Uncertainty 또는 평균적인 놀라움Average Surprisal을 뜻하는 Shannon entropy이다.
1
2
3
- 베이지안 뇌 이론에서 $$P(x)$$는 믿음의 정도와 같다. $$-\log P(x)$$는 **정보량, 놀라움Surprisal**과 같다. 믿음의 정도 $$P(x)$$가 크면 $$-\log 1 \simeq 0$$ 놀라움의 정도가 작아진다. 믿음의 정도 $$P(x)$$가 작아지면, 놀라움의 정도 $$- \log 0 \simeq \infty$$ 놀라움의 정도가 커진다.
- 엔트로피를 최소화한다는 것은, 믿음의 정도를 키우는 것과 같다. 뇌는 이를 '**예측과 학습**'으로 믿음의 정도를 키운다.
- 예측이란 지금까지 학습된 결과를 바탕으로 미래를 예측하고, 그 예측이 맞아 떨어지면 항상성을 유지한다. 예측 오류가 발생하면, 멘탈 모델을 수정한다. 예측 오류 방향이 긍정적이라면, 그 행동을 더 하도록 보상`도파민`을 제공한다. 예측 오류 방향이 부정적이라면, 도파민 뉴런을 억압함으로써 행동을 하지 못하도록 억제한다. - 따라서 **인간의 뇌는 놀람을 최소화하는 예측 엔진이다.** - **도파민은 '긍정적인 예측 오류'를 만났을 때 분비된다.**
[!question] 그렇다면, 생명체를 닫힌 계로 만든다면 어떻게 될까?{title} 산소를 호흡하지 못하고, 이산화탄소를 배출하지 못한다. 이 과정이 엔트로피를 증가시켜, 죽음이라는 평형 상태가 된다.
[!question] 그렇다면 인간은 정리되지 않은 무질서한 방을 항상 청소하고 싶어져야 하지 않나? {title} 예측 가능한 무질서는 질서와 같다. 깔끔하게 정리된 낯선 호텔 방은 아직 학습되지 않았고, 예측하기 어려운 상태이다. 즉, 고엔트로피 상태와 같다. 예측 가능한 익숙해진 지저분한 방은 충분히 학습되었고, 어디에 무엇이 있을지 모두 예측 가능하다. 즉 저엔트로피 상태와 같다.
[!question] 긍정적인 예측 오류와, 부정적인 예측 오류는 무엇인가? 뇌는 이를 어떻게 구분하는가?{title} Predicition Error, PE는 다음과 같다고 가정하자.
\[PE = \text{결과값(Outcome)} - \text{예측값(Expectation)}\]예측한 것보다 결과값이 더 좋다면, 이는 긍정적인 예측 오류다. 100원을 기대했는데, 1000원을 제공받은 것과 같다. 예측한 것보다 결과값이 더 나쁘다면, 이는 부정적인 예측 오류다. 월급날에 월급을 기대했는데, 월급을 못 받은 것과 같다.
즉 \(PE > 0\)일 때 그 행동을 더 하도록 도파민을 분비한다.
그렇다면, 생명체는 엔트로피를 최소화하려 하고, 인간의 뇌는 예측을 통해 믿음의 정도를 학습을 통해 키움으로써 엔트로피를 최소화한다. \(PE = 0\)이라면 이미 엔트로피가 최소화되어 있는 것과 같다.
그럼 부정적인 예측 오류는 엔트로피를 높이는 것이고, 긍정적인 예측 오류는 엔트로피를 낮추는 것인가? 긍정적인 예측 오류라도 예측 오류를 만났다는 것 자체는 놀라움이 극대화된 사건이고, 이는 엔트로피가 높아진 사건이 아닌가? 그렇다면 긍정적인 예측 오류 또한 생명체에 있어 엔트로피를 낮추기 위해 피해야 할 사건이 아닌가?
그렇지 않다. Shannon Entropy는 “평균적인 놀라움(average surprisal)”이라, 개별 사건의 놀라움이 아니라 장기 평균을 말한다.
그러네. 엔트로피의 역설, 놀라움을 최소화하는게 목적이라면, 인간은 아무것도 하지 않고 어두운 방 구석에 가만히 있어야 한다. 그런데 왜 굳이 긍정적 예측 오류(놀라움)을 찾아다니는가?
애초에 ‘최소’라는 의미에 많은 의미가 내포되어 있다. Complex System에는 Local Minimum과 Global Minimum이 존재한다. 위에서 말하는 방 구석에 가만히 있는 행위는 Local Minimum 최적화와 같다. 생명체는 엔트로피의 Global Minimum을 찾는 알고리즘과 같다.
따라서 긍정적 예측 오류를 찾은 것은 일시적으로 놀라움이 높아지는 상태와 같지만, 궁극적으로 Global Minimum에 다가가는 것과 같다. 담금질 기법Simulated Annealing과 같네. 시스템을 일부로 무질서하게 만들어서 Local Minimum을 탈출한다.
[!question] 도파민은 보상을 얻었을 때 나오지 않는다. 보상을 얻을 것이라고 기대할 때 나온다. 그 이유는 무엇인가?{title}
원숭이 실험을 해석해보자. 원숭이에게 빛을 보여준 뒤 주스를 주는 행위를 반복한다. 초기에는 주스를 먹을 때 도파민이 폭발한다. 충분히 학습 후, 빛이 켜졌을 때 도파민이 폭발하고, 정작 주스를 마실 땐 나오지 않았다. 빛을 보여주고 주스를 주지 않자, 주스가 나올 타이밍에 도파민이 뚝 끊겼다.
초기에 빛이란 감각정보가 들어온 뒤 주스가 주어진 것은, 긍정적인 예측 오류이다. 따라서 도파민을 분비한다.
이후 빛이 없는 방은 앞으로도 계속 빛이 없을 것이란 예측을 하고있다. 즉, 도파민이 잠잠하다. 빛이 갑자기 켜진다면, 어두워야 할 방에 빛이 켜진다. 즉, 예측 오류가 발생했다. 그러나 빛은 학습을 통해 ‘긍정적’이라는 가치를 가지고 있다. 때문에 ‘빛’이 나왔을 때가 ‘긍정적인 예측 오류’로 인지되어 도파민을 분비한다. 빛이 나온 후 주스가 제공되는 것은 예측 가능하고, 별로 놀라운 일이 아니다. 따라서 막상 주스를 마실 땐 도파민이 분비되지 않는다.
[!question] 인간이 행복과 안정을 원하면서도, 그것이 달성되는 순간 지루함을 느껴 다시 모험(도박, 새로운 사랑, 도전)을 찾아 나서는 이유가 무엇인가? {title} 행복과 안정이 반복되면, 뇌는 이를 예측한다. 예측하는 순간 도파민은 멈춘다. 지루함을 느낀다. 뇌는 오랫동안 안정된 상태를 좋아하지 않는다. ‘검은 방 문제’를 해결할 수 없기 때문이다. 따라서 Local Minimum에 같혀있지 않고, Global Minimum을 찾으러 의도적으로 엔트로피를 높인다. 이 과정에서 ‘긍정적 예측 오류’를 맛본다. 이 긍정적 예측 오류를 계속 맛보기를 원한다. 또 그 행복감에 적응되면 지루함을 느낀다. 이것의 반복이다. 영원한 행복은 없다.
[!question] 그렇다면, 너무 어려운 일은 포기하는 이유가 무엇인가? 극도로 무질서한 일이라면, 더욱이 질서정연하게 맞춰야 하는 것 아닌가?{title} 너무 어려운 일을 하는 행위는 오히려 무질서도를 증가시키는 행위와 같다는 거잖아. 왜 그런걸까?
긍정적 예측 오류는 도파민을 분비한다. 이후 뇌는 이 예측 오류를 최소화하려 한다. 이 예측 오류를 최소화하기 위해 멘탈 모델을 수정하는 과정이 학습이다.
즉, 시도할 수록 오류가 줄어드는 일은 뇌를 ‘시도할만 한 일’로 간주하고 학습한다. 학습이 끝나면, 예측 가능한 일로 변한다.
그러나, 학습 과정에서 예측 오류가 줄어들지 않거나, 오히려 늘어나버리면 어떻게 될까? 뇌는 이것을 Noise로 간주한다. Noise는 학습하지 않고 그만둔다. 이 과정이 포기다.
Noise를 끝까지 학습하지 않고 중간에 포기하는 이유는 무엇인가? 에너지를 10 투자해서 예측 오류를 50 줄인 것은 좋다. 그러나 에너지를 100 투자해서 예측 오류가 전혀 잡히지 않았다면? 이 상태를 지속되게 냅두면 에너지가 모두 고갈되게 된다. 따라서 이를 똑똑하게 처리하는 행위와 같다.
[!question] 모든 생명체의 행동 동기는 결핍으로부터 비롯된다. 이를 엔트로피로 해석하면 어떻게 될까? {title} 결핍이란 무엇인가? 결핍을 고엔트로피 상태와 뇌가 바라는 저엔트로피 상태의 차이\(\Delta\)로 정의한다. 아 차이가 마치 전위차처럼 인간이 행동하도록 만든다. 이 행동하도록 하는 Force를 욕망이라고 정의한다.
그렇다면, 배고픈 상태는 고엔트로피 상태이고, 밥을 먹는 행위는 엔트로피를 감소시키는 행위인가? 에르빈 슈뢰딩거에 따르면, 생명체는 스스로 엔트로피를 줄일 수 없다. 외부의 질서를 주입해야만 한다. 밥이란 탄수화물, 단백질 등의 원자 배열이 고도로 정돈된 저엔트로피 물질이다. 이를 주입함으로써 생명체의 엔트로피가 최소화된다.
즉 배고픔과 같은 감정은 예측 오류와 같다. 예측은 혈당과 에너지는 항상 일정해야 하지만, 현재 혈당과 에너지가 떨어진 예측 오류를 겪는다. 이는 부정적 예측 오류이며, 이를 해결하고자 욕망이 발생한다.
[!question] 그렇다면, 왜 생명체는 저엔트로피 물질을 무한으로 주입하지 않는가? 계속 주입하면 엔트로피가 계속 낮아져서 좋은 것 아닌가?{title} 생명 시스템은 외부의 저엔트로피 물질을 내 몸의 질서로 변환해야 한다. 이 변환 과정에서, 열역학 제 2법칙에 따라 폐열이 발생한다. 입력된 질서가 발생한 폐열과 찌꺼기보다 크다면 이득이다. 그러나 폐열과 찌꺼기가 더 커지는 순간, 더이상 이를 처리하지 않는다.
그렇다면, 가변 보상이 불변 보상보다 더 높은 도파민을 제공하는 이유가 무엇인가? 매번 몬스터를 잡을 때마다 100원이라는 고정 보상을 주면, 몬스터 사냥 -> 100원 획득이라는 과정이 예측 가능해진다. 따라서 도파민이 분비되지 않는다.
그러다 가끔 10,000원을 주도록 한다. 100원만 받다 10,000원을 받은 것은 긍정적 예측 오류이고, 많은 도파민을 분비한다. 이후 사용자는 또 10,000원이 나올지 모른다는 기대감을 갖는다.
그런데 기대한 것과 달리 계속 100원만 뜨면, 부정적 예측 오류를 경험하게 되고, 이는 도파민 단절로 이어진다. 그러면 행동 회피로 이어지지 않을까?
[!question] 그렇다면, 대리 만족은 왜 도파민을 분비하는가?{title} 뇌가 현실과 상상을 구분하지 않기 때문이다. 상상, 가상 현실에서 벌어진 일은 현실과 구분하지 않는다.
그렇다면, 우주가 아름다운 하나의 통합 이론으로 설명 가능할 것이란 믿음은 생명체의 특징, 인간의 뇌가 만든 환상일 수 있겠네. 우주는 총 엔트로피가 증가하고있고, 생명체는 엔트로피를 감소시키려고 하니까. 엔트로피가 증가하는 우주의 법칙을 엔트로피를 감소하려는 이론으로 설명하는 것은 모순이 아닐까?
어쩌면 우주는 실제로 \(E=mc^2\)처럼 단순하지 않을지도 모릅니다. 단지 우리 뇌가 ‘단순하지 않으면 처리할 수 없어서’ 단순한 패턴만 골라내어 보고 있는 것(편향, Bias) 일 수도 있습니다.
“오컴의 면도날(단순한 설명이 진리다)은 우주의 법칙이 아니라, 뇌의 ‘에너지 절약 지침’일 뿐이다.”
결국 님이 말씀하신 “우주의 아름다운 통합 이론”은, 실재(Reality)라기보다는 인간이라는 종이 거친 우주에서 살아남기 위해 발명한 ‘최고의 인터페이스(Interface)’ 일 가능성이 높습니다.
삶의 의미 따윈 없다. 왜냐하면 인간을 포함한 생명체는 그저 엔트로피를 감소하기 위해 행동하도록 되어있기 때문이다.
그렇다면 사람들이 삶의 의미를 찾으니, 꿈이니, 사랑이니, 자아실현과 같은 허상을 만들어 내는 이유 무엇일까? 한마디로 설명 가능하다. 그 허상을 찾는 것 자체가 명확한 목표를 제공하고, 행동이 정렬되고, 미래가 예측되는 ‘엔트로피를 최소화하는’ 행위이기 때문이다.
활용
그렇다면 내가 제공하는 서비스는 긍정적인 예측 오류를 제공해야 한다. 긍정적인 예측 오류를 제공해서 내 서비스를 사용하도록 학습시켜야 한다.
웹소설에서 제공할 수 있는 ‘긍정적인 예측 오류’ 요소들은 무엇이 있을까? 웹소설 시장에서 모두를 만족할 수 있는 것은 불가능하다. 개인마다 학습된 멘탈 모델이 제각각 다르기 때문이다.
웹소설 시장에서 핵심은 이것이다. 사용자는 웹소설을 통해 대리만족을 할 것이라는 ‘기대감’을 가지고 온다. 이는 이미 다른 웹소설을 읽으며 학습된 부분이다. 이미 학습된 사람들은 웹소설을 읽기 전 도파민이 분비된다.
그러나 막상 이미 알던 내용의 웹소설을 읽는 행위에는 도파민이 분비되지 않는다. 때문에 쉽게 지루함을 느껴 금방 이탈한다.
그러나 사용자가 기대한 것보다 더 큰 보상, ‘긍정적 예측 오류’를 제공하면 도파민이 분비된다. 이것이 ‘재미를 느끼는 과정’이다.
여기까지 왔으면, 사용자는 내 소설을 계속 읽을 것이다. 그러나 흔히 말하는 ‘고구마’는 부정적 예측 오류와 같다. 도파민이 단절되는 행위다. ‘고구마’가 지속되면 웹소설 읽는 행위를 지속하지 않는다. 적당한 타이밍에 다시 커다란 ‘긍정적 예측 오류’를 제공해야 한다. 웹소설 서비스를 제공하는 것은 이런 것이다.
그럼 부정적 예측오류를 계속 겪다 독자가 이탈하는 지점이 어디인가? 이 이탈 지점을 찾고, 그 이탈지점을 넘기지 않고 계속해서 긍정적 예측 오류를 제공하는 것이 이탈을 막는 핵심이다.
그렇다면 전략은 다음과 같다. 소재, 배경은 이미 아는 ‘뻔한 것’으로 기대치를 낮춘다. 그러나 소설을 읽고 들어올 만큼의 ‘호기심’은 자극해야 한다. 소재는 호기심정도만 자극해서 눌러볼 수 있는 정도면 충분하다. 그러나 그 내용은 ‘긍정적 예측 오류’를 만들어야 한다. 고구마를 줄 땐 반드시 ‘해결 될 수 있는 기대감, 단서’를 같이 제공하여 포기하지 않도록 한다. 완벽한 만족감을 준 뒤에 바로 결핍 또는 기대감을 쥐어준다.
무엇이 예측 오류를 만들어낼까? 현실적인 내용은 예측 가능하기 때문에 예측 오류를 만들어내지 못한다. 현실에서 할 수 없는 억압된 욕망을 해소하는 과정이 바로 긍정적 예측 오류다.
그렇다면 현실에서 할 수 없는 억압된 욕망들이 무엇이 있을까?
- 규범에 의한 욕망: 복수, 폭력적 지배, 성적 욕망, 오만/자만 (겸손 X), 게으름, 무시
- 제약에 의한 욕망: 영생/젊음, 초월적 힘, 시간 조작, 완벽한 외모, 무한한 자원
- 어려운 것: 인정/주목, 이상적 파트너, 성공/부, 사명 있는 삶
그렇다면 이 이론을 근거로 재미있는 소설은 도파민이 나오는 이유를, 재미 없는 소설은 도파민이 단절되는 이유를 분석해보자.
게임에서 제공할 수 있는 ‘긍정적인 예측 오류’ 요소들은 무엇이 있을까?
앱에서 제공할 수 있는 ‘긍정적인 예측 오류’ 요소들은 무엇이 있을까?