내 공부

데이터 주도 과학은 상상의 실패?

下學上達 2013. 1. 7. 14:01

Data-driven science is a failure of imagination


제목이 아주 도발적이다. 요새 '빅데이터'가 유행인데, 그런 흐름을 전혀 과학과는 상관없다고 단언해버린다. '큰' 규모의 데이터를 원하는 것은, 아이들이 큰 장난감을 원하는 것과 근본적으로 같은 심리라는 것이다. 데이터의 규모를 늘린다고 해서 과학적 성과가 더 잘 나오는 것도 아니며, 과학의 발전은 데이터와 이론, 양쪽 모두의 발달을 통해 이루어진다는 것이다.


말 자체는 전혀 틀린 말이 아니다. 데이터도 결국 관찰의 결과일 뿐인데, 관찰의 수를 늘린다고 해서 보다 강력한 법칙이 도출되는 것은 아니기 때문이다. 제한된 인간의 인지능력이 더 많은 관찰로 보충되는 것은 한계가 있게 마련이다. 따라서 데이터의 통계적 규칙성을 뛰어넘는 스토리, 즉 이론이 필요하다. 


결국엔 당연한 얘기로 귀결... 이론과 데이터 처리 테크닉을 다 잘 해야 함... ㅠ