일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- computational social science
- 산불 모형
- 인터넷
- mathematical model
- 매체환경
- 바라바시
- 학제간 연구
- 데이터 사이언스
- data-driven social science
- 도올
- 복잡계
- 모듈성
- opinion dynamics
- 빅데이터
- 나는 꼼수다
- 수학적 모델링
- 알갱이성
- 학문
- 사회운동
- TEDMED
- 사회적원자
- 집단행동
- 액설로드
- 네트워크
- data science
- 소셜 시뮬레이션
- 평형상태
- 적응적 행위자
- 우석훈
- 행위자 기반 모형
- Today
- Total
단순한 인간, 복잡한 사회
1-2. 명제와 모델 본문
모델을 만드는 궁극적인 목적이 과학적 지식의 획득이라고 했을 때, 과연 그 지식이란 것이 어떻게 생겼는지를 생각해 볼 필요가 있다. 지식이란게 거창해 보이지만, 사실은 인간의 언어 활동의 일부이다. 즉 지식도 곧 말, 구체적으로 말해 '명제'라는 것이다. 거의 대부분의 명제는 "무엇이 어떻다"의 형식을 갖는다. 즉 어떤 상태나 행위의 주체인 주어와, 그 주어가 갖는 상태 또는 주어의 행위를 나타내는 서술어의 조합으로 명제는 이루어진다. 여기에 부사, 형용사 등 주어와 서술어를 꾸며주는 수식어가 첨가되거나, 두 개 이상의 명제가 연결되거나, 주어와 서술어 중 하나가 생략되거나 할 수는 있지만, 기본적인 명제의 형식은 변하지 않는다.
그럼 특정한 내용을 갖는 명제가 어떤 과정을 거쳐 탄생하는지를 살펴보자. '지식'이라고 불리워질 수 있는 최소한의 자격 요건을 갖춘 명제가 탄생하는 과정은 크게 연역과 귀납의 두 가지로 나눌 수 있다. 모두들 아는 내용이다.
연역 : 논리적으로 필연적인 원리에 따라 혹은 진리 보존적 추리 규칙에 따라 주어진 전제로부터 결론을 이끌어 내는 일
귀납 : 하나하나의 구체적이고 특수한 사실을 종합하여 그것으로부터 일반적인 원리를 이끌어내는 추론 방식
(출처 : Daum 국어사전)
누구나 다 아는 쉬운 내용이지만, 사실 이것이 과학적 탐구 활동의 전부라고 해도 과언이 아니라고 생각한다. 저 활동을 하기 위해서 그리도 많은 과학자들이 그리도 많은 논문들을 써대는 것이고, 반대로 저것이 되지 않기 때문에 우리 사회에 그 수많은 말도 안되는 진술들이 활개를 치는 것이다.
모델을 분류하는 데에도 여러 기준이 있겠지만, 가장 크게는 위의 두 가지 기준에 따라 나눌 수 있다고 생각한다. 즉 주어진 전제로부터 결론을 이끌어내는 식으로 만들어지는 모델과, 구체적인 개별 사실들로부터 일반적인 원리를 이끌어내는 식으로 만들어지는 모델인 것이다. 전자는 보통 mathematical model 이라 불리고, 후자는 보통 statistical model 이라 불린다.
수학적 모델의 출발은 전제(assumption)이다. 대상 현상을 구성하는 요소가 무엇인가, 그 요소들을 어떤 변인으로 만들수 있으며 몇 개의 변인이 사용될 수 있는가, 변인들 사이의 관계는 어떤 형식의 방정식이 되는가, parameter 가 가질 수 있는 값의 범주는 어떠한가, 초기 조건(initial condition)은 어떤 값을 가질 수 있는가 등등... 수학적 모델은 온통 명시적(explicit), 또는 암묵적(implicit)인 전제들의 총합이다. 같은 현상을 놓고도 모델러에 따라 수없이 많은 모델이 만들어 질 수 있다. 다시 말해 모델러에 따라 다른 전제에 입각해 있는 것이다. 이 모델을 가지고 방정식을 풀어 해를 구하거나, stability analysis, sensitivity analysis 등 각종 analysis 기법을 동원하여 모델이 특정 조건에서는 어떤 행동을 보이는지를 살피게 된다.
연역을 이야기할 때 빠지지 않고 등장하는 것이 3단 논법이다.
(1) 모든 사람은 죽는다.
(2) 소크라테스는 사람이다.
(3) 그러므로 소크라테스는 죽는다.
보통 (1)을 대전제, (2)를 소전제, (3)을 결론이라고 부른다. 수학적 모델과의 연결을 생각하면서 말하자면, (1)이 전제이고, (3)이 결론, 그리고 (2)가 바로 전제와 결론을 연결시켜주는 analysis 에 해당한다. 즉 전제에서 출발하여 결론에 이르기까지, 논리적 비약없이 무사히 도달하게 해주는 기술인 것이다(당연히 수학적 테크닉이 요구된다). 모든 사람이 죽는지 아닌지 어떻게 아는가? 지금까지 존재했던 모든 사람이 반드시 사망했다는 것을 확인했는가, 또는 확인할 수 있는가? 또 이후 존재할 모든 사람이 반드시 죽을 것이라고 100% 장담할 수 있는가? 없다. 단지 모델 안에서 그렇게 전제(assume)할 뿐이다. 전제(1)로부터 결론(3)까지 논리적 비약없이, 수학적 기법 상의 오류없이(2) 도달했다면, 전제와 결론은 반드시 동시에 수용하거나 기각해야 한다. 즉, 논리적 오류가 없는 수학적 모델의 결론을 반박하려면, 반드시 전제를 무너뜨려야 하는 것이다.
이에 반해, 귀납적인 모델은 구체적인 사례로부터 시작한다. 보통 이 사례를 데이터(data)라고 부른다. 데이터가 없는 통계는 없다. 통계는 데이터들 사이에서 의미있는 규칙성을 찾아내는 기법이라 해도 과언이 아니다. 따라서 통계적 모델의 출발은 데이터이다. 연구 대상 현상을 이루는 구체적인 사례로서의 데이터이다.
귀납은 백조 이야기가 가장 유명하다.
(4) 이 백조는 흰 색이다.
(5) 저 백조도 흰 색이다.
......
(6) 따라서 (모든) 백조는 흰 색이다.
쉽게 알 수 있듯이 (4)와 (5)는 데이터이다. 여기서 관찰된 백조들은 전체 백조라는 모집단을 구성하는 샘플들이다. 이 샘플들의 특성을 통해서 전체 모집단의 특성을 추측하는 것이 추론 통계(inferential statistics)의 테크닉이다. 하지만 (4)와 (5)에서 관찰된 백조들이 우연히 흰 색이었을 뿐, 다른 백조들은 검은색, 회색 등 다른 색깔일 수도 있다. 이런 우연의 가능성을 배제하고, 결론(6)이 우연의 산물이 아니라는 것을 밝혀내는 것이 통계 기법이다. 어떤 새의 종류(독립변인)가 백조라면, 그 색깔(종속변인)은 흰색이라는 명제가 우연히 얻어진 결론이 아니라, 뭔가 (통계적으로) 유의미한 공변관계의 산물이라는 것을 밝혀내는 것이다. 새의 종류가 백조일 수도 있고 다른 새일 수도 있고(독립변인의 변화), 색깔이 흰색일 수도 있고 다른 색일 수도 있는데(종속변인의 변화), 유독 새의 종류가 백조일 때 색깔이 흰색이다(변인들의 공변)는 이야기이다. 이러한 공변관계로부터 인과관계를 추론(infer)하는 것이 통계적 (인과) 모형의 핵심이다. 여기에서의 '모델'은 데이터에서 보여지는 규칙성을 수학적(통계적)으로 표현한 것이다.
계량적 사회과학에서는 보통 통계적 모델링이 많이 쓰인다. mathematical sociologist 등 소수의 학자들을 제외하고는 대부분 통계적 모델링을 많이 하는 것 같다. 당연히 어떤 모델링 방법이 절대적으로 옳다고 할 수는 없다. 하지만 특정한 방식이 많이 쓰인다는 얘기는, 특정한 사고 방식이 많이 사용된다는 얘기고, 제기될 수 있는 연구 문제의 종류가 한정된다는 얘기이다. 사회과학에서는 통계적 모델링이 많이 쓰이기 때문에, 풀려는 연구문제들 역시 데이터의 규칙성을 찾는 연구문제들이다. 좀 더 그럴듯하게 말하면, 변인들 사이의 공변 관계를 찾아내어 그것을 바탕으로 인과관계를 추론하여 제시하는 것이다. 이렇기 때문에, 논문에서 보여지는 연구문제들이 "XXX에 영향을 미치는 요인에 관한 연구"의 형식이 많은 것이다.
하지만 너무도 명백한 약점이 있다. 누구나 쉽게 알 수 있듯이, 검은 백조가 나타나면 기존에 도출된 '모든 백조는 희다'는 결론 자체가 무너져 버리는 것이다. 만약 무너지지 않는다면, 결론이 적용될 수 있는 시간적, 공간적 범위가 줄어들게 된다. 물론 mathematical modeling 도 전제의 타당성을 어떻게 확보할 것인가 하는 본질적인 문제점이 있다. 하지만 statistical modeling 이 너무 과도하게 압도하는 것은, 생산될 수 있는 명제의 성격이 한 쪽으로 과도하게 치우친다는 점에서 분명히 바람직하지 않은 것이다.
아 참, 우리의 목적은 ABM 이다. 다음 포스팅에서는 ABM과 위의 두 가지 모델링 기법, 즉 mathematical modeling 과 statistical modeling 의 관계에 대해 얘기할까 한다. 결론은 이거다. ABM은 양자 모두의 성격을 갖고 있다... (너무 허무한 결론인가...) 어쨌든 난 그렇다고 본다. 자세한 얘기는 다음 포스팅에서...
'[연재] 사회과학도가 본 ABM' 카테고리의 다른 글
1-3. 시스템, 친숙하면서도 어색한... (0) | 2013.03.12 |
---|---|
1-1. 모델: 누구나 자신만의 세계에서 산다. (0) | 2012.12.21 |