Everyday hunches, quietly corrected by math.
비 올 때 뛸까 걸을까, 버스는 왜 늘 늦게 오나, 내 친구는 왜 다 나보다 인기가 많나. 사소한 일상의 직관이 의외로 자주 틀리는데 — 그 어긋남을 바로잡아 주는 건 대개 "극단을 따져 보기"와 "큰 쪽이 과대표된다"는 두 가지 수학적 감각입니다.
소나기를 맞으며 목적지까지 갑니다. 뛰면 그만큼 앞으로 받는 비가 늘 것 같아 손해처럼 느껴지죠. 그런데 답은 — 뛰어라입니다. 극단성의 원리로 어림하면 분명합니다. 속도를 \(0\)에 가깝게 하면? 무한히 오랜 시간 비를 맞으니 최악이죠. 그러니 느릴수록 손해, 빠를수록 이득입니다.
받는 비는 두 몫으로 갈립니다. 앞면으로 받는 비는 지나간 거리에만 비례해 — 빠르든 느리든 똑같습니다(같은 빗줄기 기둥을 통과하니까). 반면 윗면으로 받는 비는 걸린 시간에 비례해, 느릴수록 늘죠. 그러니 총량은 \(a+\dfrac{b}{v}\) 꼴 — 속도 \(v\)가 클수록 작아져, 끝내 "앞면 몫" \(a\)에 수렴합니다.
"평균 \(10\)분마다 온다"는 버스를 아무 때나 가서 기다리면, 평균 대기시간은 \(5\)분일 것 같죠. 그런데 실제로는 \(5\)분보다 깁니다. 이름하여 대기시간 패러독스(또는 검사 패러독스).
같은 함정이 이런 데서도 보입니다 — 어느 학년의 반 평균 인원을 구하려고, 모든 학생에게 "네 반은 몇 명?"을 물어 그 답들을 평균냈다고 합시다. 이렇게 얻은 값은 실제 반 평균보다 항상 큽니다. 학생을 무작위로 한 명 뽑으면 그가 큰 반에 속할 확률이 높아, 큰 값을 말하는 사람이 더 많이 집계되는 표본 편향이 생기기 때문이죠. 값 자체가 뽑힐 확률에 반영되는 겁니다.
수학으로는 이렇습니다. 간격의 길이를 \(X\)라 할 때, 아무 때나 도착한 당신이 길이 \(x\)인 간격에 들어갈 확률은 \(x\)에 비례합니다(긴 간격일수록 더 자주 걸림). 그래서 당신이 실제로 겪는 간격의 평균은
$$ \frac{\displaystyle\int x\cdot x\,f(x)\,dx}{\displaystyle\int x\,f(x)\,dx}=\frac{\mathbb{E}[X^2]}{\mathbb{E}[X]}\;\ge\;\mathbb{E}[X], $$마지막 부등호는 코시–슈바르츠(\(\mathbb{E}[X^2]\ge\mathbb{E}[X]^2\), 곧 분산이 \(0\) 이상)에서 나옵니다. 대기시간 \(W\)는 그 간격의 절반이니
$$ \mathbb{E}[W]=\frac{\mathbb{E}[X^2]}{2\,\mathbb{E}[X]}\;\ge\;\frac{\mathbb{E}[X]}{2}, $$등호는 간격이 완벽히 일정할 때만. 들쭉날쭉할수록 더 오래 기다립니다. 버스가 푸아송(완전 무작위)이면 \(\mathbb{E}[X^2]=2\,\mathbb{E}[X]^2\)라 대기시간이 평균 간격 그대로 — \(10\)분마다 오는 버스를 평균 \(10\)분 기다리는 셈이죠.
SNS를 보면 내 친구들은 하나같이 나보다 인맥이 넓어 보입니다. 기분 탓이 아닙니다 — 평균적으로, 당신 친구들의 친구 수는 당신의 친구 수보다 많습니다. 사회학자 스콧 펠드가 1991년 정리한 친구 패러독스(friendship paradox)죠.
이유는 버스·반 인원과 똑같습니다. 친구가 많은 사람은 그만큼 많은 사람의 친구 목록에 등장하니, "친구의 친구"를 셀 때 과대표됩니다. 큰 쪽이 더 자주 집계되는 그 표본 편향이죠. 친구 관계를 그래프로 놓고 \(d_i\)를 각자의 친구 수라 하면:
$$ \underbrace{\frac{1}{N}\sum_i d_i}_{\text{내 친구 수 평균}}\;\le\;\underbrace{\frac{\sum_i d_i^2}{\sum_i d_i}}_{\text{친구의 친구 수 평균}}, $$이 부등식은 코시–슈바르츠 \(\big(\sum_i d_i\big)^2\le N\sum_i d_i^2\)를 정리하면 바로 나옵니다. 등호는 모두의 친구 수가 똑같을 때뿐 — 한 명이라도 인맥에 차이가 있으면, 평균적으로 "내 친구가 나보다 친구가 많다"가 성립합니다. (백신·소문 확산을 빨리 잡으려면 무작위가 아니라 "누군가의 친구"를 노리라는 전략도 여기서 나옵니다.)
진흙에 남은 자전거 바퀴 자국만 보고 "어느 쪽으로 갔나"를 알 수 있을까요? 셜록 홈즈도 《프라이어리 학교》에서 이 문제와 마주칩니다.
열쇠는 두 가지 사실입니다.
그래서 방향을 가립니다 — 두 자국 중 뒷자국은, 그 접선을 그었을 때 다른 자국과 늘 같은 거리 \(r\)에서 만나는 쪽입니다(앞자국은 그렇지 않죠). 그리고 그 접선이 가리키는 쪽 — 앞바퀴 접지점이 있는 방향 — 이 바로 진행 방향입니다.
방향을 알아냈으니 넓이까지 따져 봅시다. 한 바퀴 돌아 제자리로 온 자전거의 앞·뒤 자국이 서로 겹치지 않는 두 단순폐곡선을 이룬다고 합시다(뒷자국은 볼록이라 접선이 늘 그어진다고 가정). 그러면 두 곡선 사이의 넓이는 — 곡선 모양과 무관하게 — 정확히 \(\pi r^2\)입니다. 프레임(길이 \(r\))이 뒷자국에 늘 접하고 그 끝이 앞자국에 닿는다는 사실에, 피타고라스의 정리(\(R^2=\rho^2+r^2\))와 극좌표 적분을 쓰면 나오죠. 축거가 도중에 변한다면 더 일반적으로 넓이는
$$ \frac12\int_0^{2\pi} r(\theta)^2\,d\theta. $$이는 홀디치 정리(Holditch's theorem)의 사촌입니다 — 길이가 일정한 현이 닫힌 곡선 안을 한 바퀴 미끄러질 때, 현을 \(p:q\)로 나누는 점이 그리는 곡선은 원래보다 넓이가 \(\pi p q\)만큼 작아진다는 정리죠.
높은 층에서 내려가려 엘리베이터를 부르면, 야속하게도 먼저 오는 건 자꾸 올라가는 엘리베이터입니다. 우연이 아니라 기하의 결과예요 — 가모프와 스턴이 분석한 엘리베이터 역설.
엘리베이터가 어느 층에든 고루 있을 수 있다면, 그것이 내 층보다 위에 있을 확률은 곧 "내 위층의 비율" 입니다. 꼭대기 근처라면 엘리베이터는 거의 늘 내 아래에 있으니, 다음에 도착할 땐 대개 올라오는 중 — 내려가려는 나에겐 반대 방향이죠. 1층 근처면 정반대고요.
시험을 유난히 잘 본 학생을 칭찬하면 다음엔 보통 못하고, 크게 망친 학생을 혼내면 다음엔 대개 낫습니다. 그래서 "벌은 효과 있고 칭찬은 역효과"처럼 보이죠 — 하지만 착각입니다. 점수가 실력 + 운(잡음)이라면, 유난히 높은 점수엔 운이 크게 따랐을 뿐이라 다음엔 자연히 평균 쪽으로 돌아옵니다(평균으로의 회귀). 칭찬·벌과는 무관하게요.
《스포츠 일러스트레이티드》 표지에 실리면 다음 시즌 부진하다는 "저주", 신인왕의 2년차 징크스도 같은 이유입니다. 골턴이 부모–자식 키에서 처음 알아챘죠.
집을 구하거나, 면접으로 한 명을 뽑거나, 평생의 짝을 고를 때 — 후보를 하나씩 보고 그 자리에서 거절/수락해야 하며 한 번 거절하면 되돌릴 수 없다고 합시다. 어떻게 해야 최고를 고를 확률이 가장 높을까요?
답은 우아합니다. 처음 약 37%(정확히는 \(1/e\))는 무조건 보내며 기준만 잡고, 그 뒤로 지금까지 본 누구보다 나은 첫 후보를 잡으세요. 이러면 최고를 고를 확률이 약 \(37\%\)로 최대가 됩니다(비서 문제, 최적 정지). 너무 일찍 정하면 더 나은 사람을 놓치고, 너무 오래 재면 최고는 이미 지나가 버리니까요.
\(n\)이 클 때 \(k=xn\)으로 두면 그 합은 적분으로 바뀌어
$$ P(x)\;\approx\; x\int_{x}^{1}\frac{dt}{t}\;=\;-\,x\ln x. $$이를 최대로 만드는 \(x\)는 \(\dfrac{d}{dx}(-x\ln x)=-\ln x-1=0\), 즉 \(x=\tfrac1e\approx0.37\). 그때 성공 확률도 \(P\!\left(\tfrac1e\right)=\tfrac1e\approx0.37\)로, 버리는 비율과 성공 확률이 똑같이 \(1/e\)가 됩니다.
연 이율 \(r\%\)로 복리가 붙으면, 원금이 두 배가 되는 데 걸리는 시간은 — 놀랍도록 간단하게 — 약 \(72/r\) 년입니다. 연 \(6\%\)면 \(12\)년, \(8\%\)면 \(9\)년, \(9\%\)면 \(8\)년. 정확한 값 \(\ln 2/\ln(1+r)\)과 거의 똑같죠(게다가 \(72\)는 \(2,3,4,6,8,9\)로 잘 나눠져 암산도 편합니다). 물가상승률에 대면 "물가가 두 배 되는 기간"이 바로 나오고요.
신용카드 번호 \(16\)자리의 마지막 한 자리는 그냥 번호가 아니라 검사용 숫자(체크 디짓)입니다. 룬(Luhn) 알고리즘 — 오른쪽부터 한 칸 걸러 \(2\)배(값이 \(9\)를 넘으면 \(9\)를 뺌) 한 뒤 모두 더해 \(10\)으로 나눠떨어지면 유효 — 으로, 한 자리 오타나 흔한 이웃 자리 바꿈을 즉시 걸러냅니다. 바코드·ISBN·주민등록번호도 같은 원리의 검사 자리를 달고 있죠.
뜨거운 커피를 잠시 두었다 마실 건데, 차가운 우유를 넣어야 한다면 — 지금 넣을까, 마시기 직전에 넣을까? 직관은 "마실 때 넣어야 식는 걸 늦춘다"지만 답은 반대입니다. 뉴턴의 냉각 법칙에 따르면 식는 속도는 (커피 온도 − 실온)에 비례 — 즉 뜨거울수록 빨리 식습니다. 우유를 일찍 넣어 온도를 미리 낮춰 두면, 기다리는 동안 더 천천히 식어 결국 더 따뜻하게 마시게 됩니다.
여럿이 어울려 각자 다른 금액을 결제했습니다. 똑같이 나눠 내려면 누가 누구에게 얼마를 보내야 할까요? 모두가 모두에게 보내면 송금이 수두룩하지만 — 먼저 각자의 순잔액(낸 돈 \(-\) 1인당 몫)을 구하고, 가장 많이 낼 사람과 가장 많이 받을 사람을 차례로 맞붙이면 송금 횟수가 확 줄어 \(n-1\)번 이하면 끝납니다.
비 올 때 뛰는 게 이득인 것도, 버스가 늘 늦게 느껴지는 것도, 친구가 다 나보다 인기 많아 보이는 것도 — 알고 보면 한두 줄의 수학이 깔끔히 설명합니다. 극단을 상상해 보고, 큰 쪽이 과대표됨을 의심하는 것. 이 두 감각만 챙겨도, 일상의 직관이 우리를 속이는 순간을 꽤 자주 알아챌 수 있습니다. 수학은 생각보다 자주, 길모퉁이에서 우리를 기다립니다.