Bir BAP ya da TÜBİTAK projesinde en kritik karar, bazen en çok atlananıdır: Kaç kişiye ulaşacağız ve bu sayı neden bu kadar? Örneklem büyüklüğünü “eldeki bütçeye göre” değil, araştırma sorusuna, etki büyüklüğüne ve risk iştahına göre belirlediğinizde hem bilimsel ikna gücü artar hem de sahada sürpriz yaşamazsınız. Bu yazıda, proje yazımından saha kurulumuna uzanan pratik bir yol anlatıyorum—formül ezberletmeden, karar mantığını görünür kılarak.
Temeli doğru kuralım: Alfa, beta, güç ve etki büyüklüğü
- Alfa (α): Yanlış alarm riskiniz. Genellikle %5 (iki taraflı test).
- Beta (β): Gerçek bir etkiyi ıskalama riski. Güç = 1−β. Gücü %80 ya da %90 seçmek, “etki varsa yakalayabilme” olasılığını belirler.
- Etki büyüklüğü (Δ / Cohen’s d vb.): “Pratikte anlamlı” dediğiniz fark. İstatistiksel olarak anlamlı olan her şey pratikte anlamlı değildir; projenin asıl amacı burada belirleyici.
Bir proje önerisinde bu dörtlünün açık yazımı (α, güç, varsayılan varyans/baseline ve hedeflenen fark) hakem için turnusol kâğıdı gibidir.
En çok sorulan: “Kaç kişiye ihtiyacım var?” — iki tipik örnek
1) İki oran karşılaştırması (ör. bir eğitim öncesi/sonrası memnuniyet %50’den %60’a çıksın istiyoruz)
- α = 0.05 (iki yönlü), Güç = %80
- p₁ = 0.50, p₂ = 0.60 (Δ = 0.10)
Bu parametrelerle hesap, grup başına ≈ 388 kişi verir. Saha gerçekleri için %15 yanıt/kalite kaybı payı bırakırsanız: ≈ 456 kişi/grup hedefleyin.
2) İki ortalama farkı (ör. puan ortalaması 5 birim artsın; σ ≈ 15)
- α = 0.05 (iki yönlü), Güç = %80
- Δ = 5 puan, σ = 15 puan
Bu koşullarda grup başına ≈ 142 kişi yeterlidir. Yine saha kaybı için +%10–15 pay ekleyin.
Not: Bunlar “eşit grup, basit rasgele örnekleme” içindir. Tasarım karmaşıklaştıkça (kümeleme, ağırlıklandırma) düzeltme gerekir.
Tasarım etkisi: Kümeleme, katmanlama ve ağırlıklar
Sahada her şey SRS (basit rasgele) gibi işlemez.
- Küme örnekleme/okul–mahalle gibi doğal gruplar: Aynı kümedeki kişilerin birbirine benzerliği örneklem varyansını şişirir. Tasarım etkisi (DEFF) ≈ 1 + (m−1)×ICC. Örn. küme başına 10 kişi, ICC=0.02 ise DEFF ≈ 1.18; yani hesaplanan n’i %18 artırın.
- Tabakalı (stratified) tasarım: Doğru kurgulanırsa verimliliği arttırır; ama tabaka küçüldükçe her tabaka için asgari gözlem şarttır.
- Ağırlıklandırma: Saha sonrası populasyona oturtmak için kullandığınız ağırlıklar, standart hatayı büyütür; tasarım etkisini yükseltebilir. Planı yazarken bunu “öngörülen DEFF” ile baştan kabul edin.
Sonlu evren düzeltmesi (FPC): Evren küçükse n düşer
Hedef evren küçük olduğunda (örn. N = 5.000 üretim işletmesi) büyük n’ler gereksiz yere pahalı olabilir.
Kaba kural: n_adj = n₀ / [1 + (n₀−1)/N].
Örn. n₀ = 1.000 ve N = 5.000 ise düzeltilmiş örneklem ≈ 833 olur. Projede bu detayı yazmak, bütçe–bilim dengesini mantıklı gösterir.
Birincil sonlanım ve çoklu karşılaştırma
Hakemlerin en sevdiği netlik: “Birincil sonlanım ölçütü budur” cümlesi. Güç hesabınız birincil soru üzerinden yapılmalı. On yan değişkene birden “anlamlılık” kovalamak, alfa’yı parçalar. Çoklu test varsa önceliklendirme (ve gerekirse düzeltme) planı yazın; aksi hâlde gerekli n hızla büyür.
Tek kuyruk mu iki kuyruk mu?
BAP/TÜBİTAK’ta çoğu zaman iki yönlü test beklenir; çünkü “hangi yönde değişeceğini” önceden kesinlemek güçtür. Özel durumlar (ör. yalnızca artış makul) gerekçelendiriliyorsa tek yön düşünülebilir; aksi hâlde iki yönlü seçin ve gücünüzü oradan hesaplayın.
Varyans/başlangıç oranı nereden bulunur?
Üç kaynak makuldür:
- Önceki literatür / benzer projelerin raporları,
- Kısıtlı kapsamlı pilot çalışma (10–60 gözlem arası),
- Uzman görüşüyle “temkinli” (konservatif) varsayım.
Unutmayın: Aşırı iyimser (çok küçük varyans, çok büyük fark) varsayım n’i yapay düşürür; sonra güç kaybı yaşarsınız.
Cihaz ve kanal karışımı: Güç hesabına dolaylı etkiler
Mobil katılımlar masaüstüne göre daha kısa/eksik olabilir; bazı ölçeklerde “orta” seçeneğe kayma artar. Bu, varyansı etkileyerek gereken n’i yukarı çekebilir. Proje metninde beklenen cihaz dağılımını ve operasyonel kalite önlemlerini (hızlı yanıt filtresi, dikkat sorusu, tekrarlı madde) belirtmek, hakemin “pratik güç” kaygısını yatıştırır.
Bütçe–bilim dengesi: n’i büyütmeden gücü büyütmenin yolları
- Gürültüyü azaltın: Daha temiz ölçüm (açıklayıcı tanımlar, dengeli ölçek) varyansı küçültür, aynı n ile daha yüksek güç.
- Keskin sonlanım seçin: “Genel memnuniyet” yerine alt boyutlardan birini birincil yapmak bazen daha “net” etki verir.
- Ölçümü tekrarla: Aynı bireyde öncesi–sonrası ölçüm (eşleştirilmiş tasarım) “kişiler arası” varyansı elimine eder, n ihtiyacını düşürür.
- Tabakalı örnekleme ile isabet: Heterojenliği tabakalar içinde azaltırsanız, toplam n verimli kullanılır.
Son söz
Doğru örneklem ve güç analizi, yalnızca bir tablo doldurmak değildir; bilimsel iddianızın sigortasıdır. Etki büyüklüğünü gerçekçi seçin, tasarım etkisini baştan kabul edin, küçük bir pilotla varsayımlarınızı doğrulayın ve bütün bunları proje metninde şeffafça yazın. Böylece hakemler, saha ve bütçe aynı hizaya gelir.
Hazır bir taslağınız varsa, sayıların arkasındaki varsayımları birlikte elden geçirebiliriz. Gerekirse 1–2 saatlik bir mini pilot kurgulayıp varyansı/yanıt oranını ölçer, n ve güç hesabınızı netleştiririz. Bilim ve operasyon aynı tabloda buluştuğunda, proje hem ikna edici hem uygulanabilir olur.