Benford Yasası: Sahtekarlığı Ortaya Çıkaran Matematiksel Kural

Gerçek hayattaki verilerin rastgele olmadığını söylesek ne derdiniz? İster bir ülkenin nüfus verileri olsun, ister şirketlerin muhasebe kayıtları; sayıların dünyasında gizli bir düzen var.

Bu düzen, "Benford Yasası" olarak bilinen ve özellikle finansal sahtekarlıkları tespit etmede kullanılan büyüleyici bir matematiksel kuraldır.

Peki, doğadaki ve insan yapımı sistemlerdeki sayılar nasıl bu yasaya uyar ve dolandırıcılar bu yasayla nasıl yakalanır? İşte detaylar.

Benford Yasası Nedir?

Benford Yasası'nın ilk basamak dağılım grafiği

Benford Yasası (veya İlk Basamak Yasası), gerçek hayattaki sayısal veri setlerinde, sayıların ilk basamağının 1 olma olasılığının, diğer rakamlar (2'den 9'a) olma olasılığından çok daha yüksek olduğunu belirten bir gözlemdir.

Bu yasaya göre, verilerin yaklaşık %30'u "1" ile başlarken, sadece %4.6'sı "9" ile başlar. Bu durum, ilk bakışta sezgilere aykırı görünse de, doğal süreçlerde oldukça yaygındır.

Yasa, ismini 1938 yılında bu fenomeni yeniden keşfeden fizikçi Frank Benford'dan almıştır. Ancak daha önce 1881 yılında Simon Newcomb tarafından fark edilmiştir.

Kısaca, "1" rakamının liderlik ettiği bir veri kümesi, "9" rakamının liderlik ettiği bir kümeden çok daha geniş bir yayılıma sahip olma eğilimindedir.

Matematiksel Temeli ve Dağılım

Sayıların loğaritmik dağılımını gösteren grafik

Yasanın arkasındaki matematik, logaritmik bir dağılıma dayanır. Bir sayının ilk basamağının $d$ ($d \in \{1, \dots, 9\}$) olma olasılığı şu formülle hesaplanır:

$$P(d) = \log_{10}\left(1 + \frac{1}{d}\right)$$

Bu formüle göre rakamların sıklık dağılımı şu şekildedir: 1 (%30.1), 2 (%17.6), 3 (%12.5), 4 (%9.7), 5 (%7.9), 6 (%6.7), 7 (%5.8), 8 (%5.1), 9 (%4.6).

Bu dağılım, verilerin birkaç dereceden büyüklük (orders of magnitude) kapsaması ve verilerin kendi içlerinde belirli bir oranda büyümesi durumunda geçerlidir.

Yani, verileriniz $10$ ile $10.000$ arasında ise ve bu aralıkta homojen bir dağılım göstermiyorsa, Benford Yasası işlemeye başlar.

Sahtekarlık Tespitinde Kullanımı

İnsanlar sahte veriler oluştururken, rakamları genellikle gerçekten rastgele seçerler (yani her rakamın gelme ihtimalini eşit (%11.1) sanırlar). Bu durum, Benford Yasası'na aykırıdır.

Denetçiler, bir şirketin fatura kayıtlarını veya vergi beyannamelerini incelediğinde, ilk basamak dağılımının Benford Yasası'ndan önemli ölçüde sapıp sapmadığını kontrol ederler.

Örneğin, sahte faturalar oluşturulurken "7", "8" veya "9" ile başlayan sayıların gereğinden fazla kullanılması, yasanın işaret ettiği "1" ile başlama kuralını bozduğu için hemen dikkat çeker.

Bu teknik, muhasebe hileleri, seçim sonuçlarındaki usulsüzlükler, bilimsel verilerdeki manipülasyonlar ve kara para aklama gibi durumlarda bir "ilk uyarı" mekanizması olarak çalışır.

Yasaya Uyan ve Uymayan Veriler

Benford yasasına uyan farklı veri setleri örnekleri

Benford Yasası, rastgele olmayan ancak doğal olarak gelişen veya insan yapımı karmaşık sistemlerdeki veriler için mükemmel çalışır.

Uyan Veriler: Ülke nüfusları, nehir uzunlukları, fiziksel ve kimyasal sabitler, borsa endeksleri, elektrik faturaları, şirket harcamaları.

Uymayan Veriler: Telefon numaraları, posta kodları, boy veya kilo gibi sınırlı bir aralıkta (örneğin 50-200 cm) olan veriler, piyango numaraları.

Yasa, sayıların birimlerine bağlı değildir (kilometre veya mil kullanılması sonucu değiştirmez). Ayrıca verilerin çarpımsal bir süreçle artması gerekir.

Örnek Senaryo: Vergi Denetimi

Bir vergi denetçisi, küçük bir işletmenin 1.000 adet faturasını inceliyor. Normalde fatura tutarlarının yaklaşık 300'ünün "1" ile, sadece 46'sının "9" ile başlaması beklenir.

Ancak analiz sonucunda, "9" ile başlayan faturaların 200 adet olduğu görülüyor. Bu, istatistiksel olarak aşırı bir sapmadır.

Bu sapma, işletme sahibinin vergi kaçırmak için kasten yüksek tutarlı sahte faturalar düzenlediğini (9 rakamının psikolojik olarak "büyük" görünmesi nedeniyle) işaret eder.

Denetçi, bu analiz sayesinde 1.000 faturayı tek tek incelemek yerine, sadece "9" ile başlayan faturalara odaklanarak zaman kazanır ve sahtekarlığı tespit eder.

Benford Dağılım Tablosu

Verilerin ilk basamaklarının beklenen dağılım oranlarını aşağıdaki tabloda karşılaştırmalı olarak görebilirsiniz:

Rakam Benford Yasası (%) Eşit Dağılım (%)
1 30.1 11.1
2 17.6 11.1
3 12.5 11.1
4 9.7 11.1
5 7.9 11.1
6 6.7 11.1
7 5.8 11.1
8 5.1 11.1
9 4.6 11.1

Benford Yasası, verilerin doğasındaki düzeni kullanarak sahtekarlığı ortaya çıkaran güçlü bir araçtır. Ancak bu yasa bir kanıt değil, bir **işaretçidir**; sapma görülen veriler daha detaylı incelenmelidir.

Sık Sorulan Sorular (SSS)
Hayır. Veri seti yeterince büyük değilse, sınırlı bir aralıkta ise veya insan tarafından kasten seçilmiş sayılardan oluşuyorsa yasa geçerli olmayabilir.
Hayır, ikinci ve hatta üçüncü basamaklar için de daha karmaşık benzer yasalar mevcuttur, ancak en güçlü sonuç ilk basamakta alınır.
Benford Yasası'ndaki sapma, sahtekarlığın kesin delili değil, "sahtekarlık şüphesi" uyandıran güçlü bir istatistiksel göstergedir.