RIM (Raking) Ağırlıklandırma: Örneklemden popülasyona adil geçişin pratik yolu

Anketiniz bitti, tablo güzel görünüyor… ama örneklemde kadınlar %62, gençler %18, İç Anadolu beklediğinizden düşük. Bu durumda “olması gereken” nüfus dağılımlarına yaklaşmak için veri setine ağırlık vermemiz gerekir. Peki hangi ağırlık? İşte burada RIM (raking / iteratif oransal uyarlama) devreye girer.

Bu yazıda RIM’in ne olduğunu, ne zaman işe yaradığını, nasıl uygulandığını ve nerede frene basmak gerektiğini; sahadan örnekler ve basit matematikle anlatıyorum.

RIM nedir, ne değildir?

RIM (raking), veriye verdiğiniz ağırlıkları birden çok değişkenin marjinal hedeflerine (ör. cinsiyet, yaş, bölge) aynı anda yaklaştıran iteratif bir yöntemdir.

Amaç: Örnekleminizin ağırlıklı dağılımını, hedef nüfus dağılımlarına olabildiğince eşitlemek.
Yöntem: Ağırlıkları, seçtiğiniz her değişken için sırayla düzeltir; sonra tekrar başa döner; bu “tur”lar, farklar küçülene kadar sürer.

RIM değildir:

“Her kombinasyonu doldurayım” diyen tam çapraz post-stratifikasyon (hücre ağırlığı) değil; çünkü tüm hücreleri doldurmanız gerekmez.
Kötü bir örneklemi mucizevi şekilde kurtaran sihir değil; temsil problemi büyükse, RIM sadece düzensizliği “makyajlar”.

Ne zaman RIM, ne zaman başka bir şey?

RIM uygundur: 2–4 marjinal değişkeniniz varsa (cinsiyet, 4’lü yaş, 12 NUTS1 bölge gibi) ve her birinin kendi içinde nüfus hedefini biliyorsanız. Hücrelerin bir kısmı örnekte zayıf olsa bile marjinleri eşitlemek istiyorsunuz.
Tam hücre ağırlığı uygundur: 2 küçük değişkenin tüm çapraz hücreleri güçlü doluysa (ör. cinsiyet×yaş=2×4).
Model-temelli kalibrasyon (GREG) uygundur: Yardımcı değişkenler çok sayıda ve sürekli (örn. yaş tekil, gelir aralığı, eğitim yılı), hedefleri toplamlar üzerinden tanımlanıyorsa.

Mantık: “Bir tur ben, bir tur sen”

Basitleştirerek: başlangıçta her kişiye w=1 verin.

Cinsiyet için mevcut (ağırlıklı) oranınıza bakın; hedefle kıyaslayın. “Kadınlar örnekte %62 ama hedef %50” ise kadınların ağırlıklarını 0.50/0.62 ≈ 0.81 ile çarpın; erkekleri 0.50/0.38 ≈ 1.32 ile.
Sıradaki değişkene geçin, örn. yaş. Bu kez güncel ağırlıklarla oluşan yaş dağılımına bakın; her yaş kategorisinin ağırlıklarını kendi hedefine göre çarpın.
Bölge için aynı işlemi yapın.
Tekrar cinsiyete dönün; farklar küçülmüş olmalı. Tur atmaya devam edin.

Algoritma, hedeflerle örnek arasındaki farklar çok küçülene (ör. her marjinde sapma < %0.1) ya da maksimum tur sayısına ulaşana kadar sürer.

Not: Tüm çarpanlar pozitif olmalı; RIM negatif ağırlık üretmez.

Mini örnek (rakamlar yuvarlatılmıştır)

Hedef cinsiyet: Kadın %50 / Erkek %50
Hedef yaş (4’lü): 18–24 %20 / 25–34 %30 / 35–44 %30 / 45–54 %20
Hedef bölge (3’lü): Marmara %40 / İç-Anadolu %25 / Diğer %35

Örneğinizde ağırlıksız dağılım Kadın %62, 18–24 %14, Marmara %48 olsun.

1. tur (cinsiyet): Kadın ağırlıkları ×0.81; erkek ×1.32
1. tur (yaş): 18–24 ×(0.20 / mevcut_oran), 25–34 ×(0.30 / …) …
1. tur (bölge): Marmara ×(0.40 / …) vb.
2. tur: Cinsiyete geri dön; farklar daha küçük. 3–6 turda hedeflere “yakınsama” genelde sağlanır.

Yakınsamayı sıkı tutarsanız (aşırı küçük sapma), bazı bireylerin ağırlıkları yükselir. Bu yüzden aşağıdaki “kısıtlar” önemli.

Üç kritik tercih: sınır, tohum, yakınsama

Ağırlık sınırları (trimming / capping)

Tipik bir bant: 0.5 ≤ w ≤ 3 ya da 0.33 ≤ w ≤ 4.
Amaç: Aşırı uç ağırlıklar olmasın; “bir kişinin” 10 kişiyi temsil ettiği tablolarla uğraşmayın.
Sınır koyduğunuzda hedeflerden küçük sapmaları kabul edeceksiniz; bu, sahada gerçekçidir.

Tohum ağırlık (seed)

Başlangıçta herkese 1 vermek yerine, tasarım ağırlığı (seçilme olasılığına göre) veya panel/kanal farkı gibi bilgilerle başlamak, RIM’in daha hızlı ve mantıklı yakınsamasını sağlar.

Yakınsama eşiği & tur sayısı

Pratik: maks. 25–30 tur, marj sapması < %0.1–0.5 aralığı.
Katı eşik = daha doğru marjinler ama daha uç ağırlıklar; esnek eşik = daha yumuşak ağırlıklar.

Etki: Tasarım etkisi ve etkin örneklem

Ağırlıklar istatistiksel belirsizliği artırır. İki faydalı ölçü:

Ağırlık kaynaklı tasarım etkisi DEFFw≈1+CV(w)2DEFF_w \approx 1 + \text{CV}(w)^2DEFFw≈1+CV(w)2 (CV: ağırlıkların varyasyon katsayısı) — CV büyüdükçe standart hatalar şişer.
Etkin örneklem büyüklüğü neff=(∑wi)2∑wi2n_{\text{eff}} = \frac{(\sum w_i)^2}{\sum w_i^2}neff=∑wi2(∑wi)2 Bu değer, “ağırlıklandırılmış n’in” aslında kaç düz gözleme denk geldiğini söyler. Raporlarda bu iki değeri vermek iyi uygulamadır.

RIM’den önce şu soruları sorun

Temel temsil problemi neydi? Erişemediğiniz bir kitleyi (ör. kırsal yaşlılar) ağırlıkla “yaratamazsınız”. Önce saha stratejisini düzeltmek gerekebilir.
Hangi marjinler gerçekten önemli? Cinsiyet-yaş-bölge çoğu genel çalışmada yeterlidir. 6–7 marjin istemek, yakınsamayı bozar ve uç ağırlık üretir.
Sınıflandırmaları gerçekçi mi? Yaşta 10’lu kırılımlar yerine 4’lü/5’li bloklar, ağırlıkların sağlığını artırır.
Sıfır hücre var mı? Örneğinizde hiç olmayan bir kategoriye RIM hayat veremez. Ya anket dönemini uzatıp doldurun ya da sınıflandırmayı birleştirin.

Sık sorulanlar

“RIM ile hedefler birebir tutmalı mı?”
Hayır. Ağırlık sınırları koyduysanız küçük sapmalar normal ve çoğu zaman tercih edilir.

“Kaç marjin çoktur?”
Genel halk çalışmalarında 3–4 marjin (cinsiyet, yaş, bölge, bazen eğitim) pratik üst sınır. Daha fazlası yakınsamayı zorlar, ağırlıkları uçurur.

“Ağırlıklar analizi nasıl etkiler?”
Tahminlerde ağırlıkları kullanın; standart hatalar için ağırlık-duyarlı yöntem (sandwich, replicate weights, vb.) tercih edin. Aksi hâlde yanılabilirsiniz.

Kapanış: Ağırlık bir “son işlem” değil, tasarım kararıdır

RIM’i yalnızca analizde uygulanan bir buton gibi görmek kolay; ama doğru soru şudur: Hangi marjinleri neden sabitliyoruz? Bu karar sahadan başlar. Makul sınıflar, mantıklı sınırlar, düzenli kalite filtreleri ve şeffaf raporlama ile RIM, veriyi “gerçeğe yaklaştıran” güvenilir bir köprü olur.

RIM (Raking) Ağırlıklandırma: Örneklemden popülasyona adil geçişin pratik yolu