Veri ve Bayesçi Epistemoloji

Dijital tartı her seferinde farklı tartıyor.

– Bir e-ticaret sitesindeki müşteri yorumu

Sensörler bir varlık veya sürecin büyüklüğünü ölçmek için kullanılır. Fakat en basitten en hassas sensörlere kadar tüm sensörler ölçüm hataları yapar. Bu hataların kullanıcıya nasıl yansıtılacağı sensörü tasarlayanların seçimidir. Peki deterministik olmakla suçlanan mühendislik bilimleri bu konuda bir şey yapmakta mıdır? Gerçekte ölçmediği bilgileri nasıl gösterebilmektedir? Yoksa yanlış değerler mi sunmaktadır?

Ölçüm aslında bir nesne veya olayın bir özelliğine dair sensörler aracılığıyla üretilen bilgidir. Ancak bu bilginin oluşturulması sürecine dış etmenler ve sensörlerden kaynaklı bilinemeyen belirsizlikler dahil olurlar. Ölçümlerde gürültü diye adlandırılan bu belirsizlikleri tam olarak yok etmek mümkün değildir ve sensörlerin farklı değerler vermesinini sebebi de bunlardır. Bu sorun cep telefonunuzdan tartılara kadar her yerde vardır.

İkinci yaklaşımsa Bayesçi yaklaşımdır. Bayesçi yaklaşım, tek bir doğru olamayacağını iddia eder. Her bir ölçüm bir olasılık dağılımına göre oluşur. Bayesçi yaklaşım a priori bir dağılımla konu hakkında önceden bildiklerimizi, olabilirlik ile ölçümlerle ilişkilendirerek yani bildiklerimizle gözlemlerimizi ilişkilendirerek, posterior bu olasılık dağılımı bulur. Posterior dağılım son erişilen dağılım anlamına gelmektedir.

Bu bakış açılarındaki farkı bir örnekle açıklamaya çalışalım. Örneğin yeni doğmuş bir bebeğin boyunu ölçmeye çalıştığımızı varsayalım. İlk seferde 50cm, ölçtüğümüzü farz edelim. Buradaki hata neye bağlıdır? Frekansçı yaklaşım ölçümü ideal varsayarak ilk ölçümde durabilir veya sonsuza kadar ölçüm yapmaya devam edip gerçek değeri en çok ölçülen değer olarak belirleyebilir. Bayesçi yaklaşım aynı ölçümlere biraz daha farklı yaklaşır. Modern sensör sistemlerindeki yaklaşımları doğrudan uygulayacak olursak, daha önce boyu ölçülen bebeklerin boy ölçümleri kullanılarak her bir ölçümün hangi olasılıkla yapılabileceği modellenir. Böylece a priori bilgi oluşturulmuş olur. Ölçüm geldikten sonra da bu bebeğe özel bir ölçüm dağılımı oluşturulmuş olur.

Bayesçi Epistemolojinin Önyargı Problemi

Bayesçi yaklaşımın temeli Bayes kuralıdır. Bayes kuralı ise, yine yukarıdaki örnekten ilerlersek, aşağıdaki gibidir. A ve B olayları A = boy ölçümü tahminimiz, B=boy ölçümü olsun,

Burada P(A) boy ölçümü tahmininin ilk yani a priori olasılık dağılımıdır, P(B|A) ise bir koşullu olasılıktır ve olabilirlik (likelihood) olarak adlandırılır. A’nın bir değeri için B’nin hangi değerleri alabileceğinin olasılık dağılımını gösterir. En genel anlamda olabilirlik bulunmaya çalışılan büyüklüğün ölçümde yol açtığı sonuçtur. Bebeklerin boylarını ölçerken ölçümle fiziksel büyüklük aynıdır. Ancak ivmeölçer kullanarak bir aracın hızını bulmaya çalışırken ölçülen ivmenin neden olacağı hızla bizim ön tahminimiz olan hızın karşılaştırılması gerekir. Bu iki terimi çarpımıyla P(A|B) yani posterior bilgi elde edilir.

Görüldüğü üzere Bayes yaklaşımında daha en başta P(A) dağılımını bilmemiz, yani boy hakkında bir fikrimizin olması beklenmektedir. Eğer ölçümlerin olduğu durumla a priori bilgimizi oluşturduğumuz şartlar çok farklıysa ne olacak? Bu soru Bayesçi yaklaşımının önyargılardan kaynaklanan hatalara neden olduğu eleştirilerine neden olmaktadır.

Modern birçok sistemin çalıştığı prensip bu sorunu nasıl çözebilmektedir? Bununla ilgili de felsefi açıdan tartışmalar olmakla birlikte, mühendislik uygulamalarında sonuç beklenir. Sorunun çözümü genellikle bilgisizliğimizi vurgulayan, her değer için yaklaşık aynı olan (-\infty,+\infty) aralığında tanımlı bir olasılık dağılımıyla başlanır. Diğer bir deyişle gelecek her ölçüme benzer bir tepki verecek bir başlangıç noktası seçilir. Ölçümlerin gelmesiyle birlikte bu olasılık dağılımı belirli bir bölgeye yoğunlaşır.

Peki başlangıçta sistemin frekansçı bakıştan ne farkı kalmaktadır? Günümüzde Bayesçi yaklaşımı kullanan ve ölçümleri her adımda öğrendikleriyle daha da iyileştiren ardışık (sequential) çalışan matematiksel çözümler kullanılmaktadır. Bu çözümler temelde yukarıdaki Bayes kuralıyla çalışır ve ilk icat edilenlerden birisi Kalman filtresidir. Aya ilk ayak basan insanları taşıyan Apollo 11 projesinde kullanılmıştır. Tabi ki son 50 yılda konuyla ilgili çok fazla gelişme olmuştur. Ama matematiğe girmek zorunda kalmadan konuyu şimdilik burada bırakalım.