바라바시 알버트 모델 (연속체 근사)

2026-06-11 → 2026-06-15

Barabási–Albert 모델의 degree distribution 유도: Continuum approximation#

1. 문제 설정#

Barabási–Albert, 즉 BA 모델은 preferential attachment를 통해 scale-free network가 어떻게 생기는지를 설명하는 대표적인 네트워크 성장 모델이다.

핵심 아이디어는 간단하다.

이미 연결이 많은 노드는 새 노드로부터 더 많은 연결을 받을 가능성이 높다.

즉, “부익부” 구조가 네트워크 성장 과정 안에 들어 있다.

2. BA 모델의 성장 규칙#

BA 모델은 보통 다음과 같이 정의된다.

초기에는 작은 네트워크가 있다.
매 시간마다 새로운 노드 하나가 네트워크에 추가된다.
새 노드는 기존 노드들 중 m개와 연결된다.
기존 노드 i가 새 링크를 받을 확률은 그 노드의 degree k_i에 비례한다.

즉,

$$ \Pi_i = \frac{k_i}{\sum_j k_j} $$

여기서

$\Pi_i$: 새 노드가 기존 노드 $i$에 연결될 확률
$k_i$: 노드 $i$의 degree
$\sum_j k_j$: 전체 네트워크의 degree 합

3. 전체 degree 합#

무방향 네트워크에서 전체 degree 합은 edge 수의 두 배이다.

BA 모델에서는 매 시간마다 새 노드가 m개의 edge를 추가한다.

따라서 시간 $t$가 충분히 크면 edge 수는 대략

$$ mt $$

이고, 전체 degree 합은

$$ \sum_j k_j \approx 2mt $$

이 된다.

따라서 preferential attachment 확률은

$$ \Pi_i = \frac{k_i}{2mt} $$

로 쓸 수 있다.

4. 한 노드의 degree가 시간에 따라 어떻게 증가하는가?#

이제 특정 노드 $i$를 보자.

노드 $i$가 시간 $t_i$에 네트워크에 들어왔다고 하자.

BA 모델에서는 새 노드가 들어올 때 처음부터 m개의 링크를 가지므로,

$$ k_i(t_i) = m $$

이다.

시간이 지나면서 이 노드는 새로 들어오는 노드들로부터 링크를 받을 수 있다.

한 시간 step마다 새 노드는 m개의 링크를 만든다. 그중 하나가 노드 $i$에 연결될 확률은 $\Pi_i$이다.

따라서 노드 $i$의 degree 증가율은

$$ \frac{dk_i}{dt} = m \Pi_i $$

이다.

앞에서 구한 $\Pi_i = k_i / 2mt$를 대입하면,

$$ \frac{dk_i}{dt} = m \frac{k_i}{2mt} $$

m이 약분되어

$$ \frac{dk_i}{dt} = \frac{k_i}{2t} $$

이 된다.

이 식이 continuum approximation의 핵심이다.

5. 미분방정식 풀기#

우리는 다음 미분방정식을 풀면 된다.

$$ \frac{dk_i}{dt} = \frac{k_i}{2t} $$

양변을 분리하면,

$$ \frac{dk_i}{k_i} = \frac{dt}{2t} $$

양변을 적분하면,

$$ \ln k_i = \frac{1}{2}\ln t + C $$

따라서

$$ k_i(t) = C’ t^{1/2} $$

이다.

이제 초기조건을 사용한다.

노드 $i$는 시간 $t_i$에 들어왔고, 그때 degree는 $m$이다.

$$ k_i(t_i) = m $$

그러므로

$$ m = C’ t_i^{1/2} $$

따라서

$$ C’ = m t_i^{-1/2} $$

이를 다시 대입하면,

$$ k_i(t) = m \left(\frac{t}{t_i}\right)^{1/2} $$

즉, 노드 $i$의 degree는 시간이 지남에 따라 다음처럼 증가한다.

$$ k_i(t) = m \sqrt{\frac{t}{t_i}} $$

6. 이 식의 직관#

$$ k_i(t) = m \sqrt{\frac{t}{t_i}} $$

이 식은 중요한 직관을 준다.

$t_i$가 작을수록, 즉 일찍 들어온 노드일수록 degree가 크다.
늦게 들어온 노드는 성장할 시간이 적기 때문에 degree가 작다.
하지만 degree는 $t/t_i$에 비례해서 선형으로 증가하는 것이 아니라 제곱근으로 증가한다.

즉, early mover advantage가 있지만 무한히 압도적인 방식은 아니다.

7. Degree distribution으로 바꾸기#

우리가 원하는 것은 개별 노드의 degree 성장식이 아니라 전체 네트워크의 degree distribution이다.

즉,

$$ P(k) $$

를 구하고 싶다.

앞에서 얻은 식은

$$ k_i(t) = m \left(\frac{t}{t_i}\right)^{1/2} $$

이다.

이 식을 $t_i$에 대해 풀면,

$$ k_i(t) > k $$

라는 조건은 다음과 같다.

$$ m \left(\frac{t}{t_i}\right)^{1/2} > k $$

양변을 정리하면,

$$ \left(\frac{t}{t_i}\right)^{1/2} > \frac{k}{m} $$

양변을 제곱하면,

$$ \frac{t}{t_i} > \frac{k^2}{m^2} $$

따라서

$$ t_i < \frac{m^2 t}{k^2} $$

이 된다.

즉, degree가 $k$보다 큰 노드들은 충분히 일찍 들어온 노드들이다.

8. $t_i$의 분포#

BA 모델에서는 매 시간마다 노드가 하나씩 들어온다.

따라서 노드의 등장 시간 $t_i$는 대략 $[0,t]$ 구간에 균등하게 분포한다고 볼 수 있다.

그러므로

$$ P(k_i(t) > k) = P\left(t_i < \frac{m^2 t}{k^2}\right) $$

이고, $t_i$가 균등분포이므로

$$ P\left(t_i < \frac{m^2 t}{k^2}\right) = \frac{m^2 t / k^2}{t} $$

따라서

$$ P(k_i(t) > k) = \frac{m^2}{k^2} $$

이것은 누적분포의 꼬리, 즉 complementary cumulative distribution이다.

보통 다음처럼 쓴다.

$$ P(K > k) \sim k^{-2} $$

9. 누적분포에서 확률밀도분포로#

우리가 흔히 말하는 degree distribution은

$$ P(k) $$

이다.

앞에서 얻은 것은

$$ P(K > k) \sim k^{-2} $$

이다.

연속 근사에서는 확률밀도는 누적분포를 미분해서 얻을 수 있다.

$$ P(k) = -\frac{d}{dk}P(K > k) $$

따라서

$$ P(k) \sim -\frac{d}{dk}k^{-2} $$

이고,

$$ P(k) \sim k^{-3} $$

즉 BA 모델의 degree distribution은

$$ P(k) \sim k^{-3} $$

이 된다.

10. 결론#

Continuum approximation을 통해 BA 모델의 degree distribution을 유도하면 다음과 같은 결과를 얻는다.

$$ P(k) \sim k^{-3} $$

즉, BA 모델은 power-law degree distribution을 만든다.

이때 exponent는

$$ \gamma = 3 $$

이다.

따라서 BA 모델은 scale-free network의 대표적인 생성 메커니즘으로 이해된다.

11. 핵심 흐름 요약#

전체 유도 과정은 다음과 같이 요약할 수 있다.

Preferential attachment를 가정한다.

$$ \Pi_i = \frac{k_i}{\sum_j k_j} $$

전체 degree 합은 대략 $2mt$이다.

$$ \sum_j k_j \approx 2mt $$

노드 $i$의 degree 증가율은 다음과 같다.

$$ \frac{dk_i}{dt} = m \frac{k_i}{2mt} = \frac{k_i}{2t} $$

미분방정식을 풀면,

$$ k_i(t) = m \left(\frac{t}{t_i}\right)^{1/2} $$

degree가 $k$보다 클 조건은

$$ t_i < \frac{m^2 t}{k^2} $$

등장 시간 $t_i$가 균등분포라고 보면,

$$ P(K > k) \sim k^{-2} $$

이를 미분하면,

$$ P(k) \sim k^{-3} $$

12. Continuum approximation의 의미#

여기서 continuum approximation은 원래 이산적인 네트워크 성장 과정을 연속적인 미분방정식으로 근사하는 방법이다.

실제로 degree는 정수이고 시간도 discrete step으로 증가한다.

하지만 노드 수가 충분히 크고 degree 변화가 평균적으로 부드럽다고 보면,

$$ \frac{dk_i}{dt} $$

와 같은 연속적인 증가율로 근사할 수 있다.

이 방식은 정확한 해는 아니지만, BA 모델이 왜 power-law 분포를 만드는지 직관적으로 보여주는 가장 간단한 유도법이다.

13. 한 줄 요약#

BA 모델에서는 먼저 들어온 노드가 preferential attachment 덕분에 더 많은 링크를 얻고, 이 성장 과정이 누적되면서 degree distribution이

$$ P(k) \sim k^{-3} $$

인 scale-free network가 만들어진다.