Could a Machine Make Probability Judgments (1959)

Cheltenham, İngiltere

Olasılık kuramlarının birçoğu, inanç dereceleri ya da yoğunluklarıyla veya rasyonel inançlarla ilgilenir. İnanç derecelerine sahip bir makine kavramı paradoksal görünebilir ve bu nedenle bir makinenin olasılık yargıları verip veremeyeceğini sormayı ilginç buluyorum. Böyle bir soruyu yanıtlamaya çalışırken, "inanç derecesi" ifadesini açıklığa kavuşturabiliriz. Bununla birlikte, bilinçli olarak spekülatif olacağım ve gerçekten olasılık yargıları veren bir makineyi masaya koyamıyorum. Amacım yalnızca sorulan soruya makul bir süre içinde elimden geldiğince iyi bir yanıt vermeye çalışmaktır.

Tartışmamız öğrenen makineler, satranç oynayan makineler ve büyük ölçüde rastgele ağlardan oluşan makineler konularına değinecektir. Bu konularda halihazırda belirli bir miktar çalışma yapılmıştır, ancak ilgili literatürün tamamını burada listelemeye çalışmayacağım.

Bir ek uyarı daha gereklidir. Makinelerle ilgili tartışmaların bir kısmı antropomorfik ve teleolojik görünebilir. Eğer öyleyse, bunun nedeni "sanki" sözcüklerinin çoğu zaman örtük olarak varsayılmasıdır. Bir argüman fazla katı biçimde ifade edilirse, ilgi çekici olmaktan çıkma tehlikesi vardır. Tamamen katı bir argüman sonsuza kadar sürebilir ve kimse tarafından anlaşılmayabilir.

"Makine" için on farklı tanım, "olasılık" için on anlam ve "yargı" için on tanım verseydim, yanıtlamam gereken 1000 farklı soru olurdu. Elli dakika konuşacak olsaydım — ve çok az insanın bundan daha uzun konuşmasına izin verilmelidir — her bir soruyla ilgilenmek için ortalama üç saniyem olurdu. Gerçekte elbette sorunun anlamını ciddi biçimde sınırlayacağım.

Bir bilimkurgu öyküsünü hatırlıyorum; bu öyküde bir insan ile bir android arasındaki gözlemlenebilir tek fark, androidlerin erişilemez bir biçimde "made in Birmingham" ya da "fabriquée en Paris" damgasını taşımalarıydı. Androidler üretilebilseydi, acı hissedip hissedemeyecekleri sorusu hukuki, ahlaki ve felsefi açıdan ilginç olurdu; ancak olasılık yargıları verip veremeyecekleri sorusu, insanların bunu yapıp yapamayacağı sorusuna indirgenirdi. Ayrıca androidlerin yapılıp yapılamayacağını düşünmek bana fazla spekülatif geliyor.

Ben daha çok, makinelerin yakın gelecekte olasılık yargıları verip vermeyeceği gibi pratik bir soruyla ilgileniyorum.

Aklımdaki makineler, önümüzdeki yirmi yıl içinde yapılması muhtemel genel amaçlı bilgisayarlar ile, işlevsel olarak çoğu genel amaçlı bilgisayardan ziyade beyne benzeyen, büyük ölçüde rastgele elektriksel ağlardan oluşan makinelerdir.

Kısmen rastgele bir elektriksel ağ, tasarımının belli bir ölçüde şansa bırakıldığı bir ağdır. Tasarım sabitlendikten sonra davranış deterministik olabilir de olmayabilir de.

Beynin büyük ölçüde rastgele sinir ağlarından oluştuğu muhtemel görünmektedir. (Tek yumurta ikizlerinin parmak izleri farklıdır; dolayısıyla parmak izi gelişimi kısmen rastgeledir. Beyin, bir parmak izinden çok daha fazla bileşen içerdiği için, aynı durumun beyin için de geçerli olması muhtemeldir.) Büyük ölçüde rastgele ağlardan oluşan makineler, beyinlere kıyasla daha yüksek hız avantajına sahip olurdu; ancak mevcut teknikler kullanılırsa, çok daha az sayıda temel bileşen dezavantajına sahip olurlardı.

İlke olarak, genel amaçlı bir bilgisayar, kısmen rastgele bir ağ tarafından yapılabilen her mantıksal işlemi yapabilir; ancak uygulamada, kısmen rastgele bir ağ çeşitli iş sınıflarında çok daha verimli olabilir. Bunun bir nedeni, çoğu genel amaçlı bilgisayara kıyasla daha fazla paralel çalışma yapabilmesidir.

Mind dergisinde yayımlanan ve "Computing Machinery and Intelligence" başlığını taşıyan bir makalede Turing, genel amaçlı bir bilgisayarın önümüzdeki elli yıl içinde "düşünecek" şekilde programlanabileceğini savunmuştur. Bir makinenin, beş dakikalık bir konuşma sırasında — konuşma teleprinter aracılığıyla yürütülürken — sizi, bir erkeğin yapabildiği kadar iyi biçimde onun bir kadın olduğuna inandırabiliyorsa, düşünebildiğinin söylenebileceğini belirtmiştir. Turing’in argümanları esas olarak karşı-argümanların bertaraf edilmesine yönelikti ve bu makalede yapıcı değildi. Programın nasıl düzenlenebileceğini hiç çalışıp çalışmadığını bilmiyorum.

Bilimsel tümevarımın mekanikleştirilip mekanikleştirilemeyeceği konusunda Popper ve Somenzi tarafından yayımlanmış kısa tartışmalar da vardır. Bir makine düşünebiliyorsa ya da bilimsel tümevarım yapabiliyorsa, o hâlde — en azından insanlar yapabiliyorsa — a fortiori olasılık yargıları da verebilir. Benzer biçimde, bir makine insan çevirmen tarzında kusursuz çeviri yapabiliyorsa, çoğu dilsel metin belirsiz olduğu için olasılık yargıları vermesi gerekir. (Ancak bir makine, en olası anlamı seçmek yerine bir belirsizliğin tüm anlamlarını listeleyebilir.)

Dolayısıyla sorumuz, bu diğer soruların yanıtlarıyla ilişkilidir ve aynı zamanda daha az iddialıdır. Sınırlı bir alanda olasılık yargıları verebilen uygulanabilir bir makine örneği düşünebilirsek, sorumuz olumlu ve yapıcı biçimde yanıtlanmış olur. Makinenin her şey hakkında olasılık yargıları verebilmesi gerekli değildir.

Şunu söylemeye değer ki, ilke olarak bir makine, Turing’in anlamında kesinlikle düşünebilir; çünkü her olası soru için uygun yanıtları depolayabilir. Bu stratejinin temel sorunu, uygulanamaz olmasıdır. Ayrıca düşünme, muhtemelen yalnızca belleğin kullanılmasından daha fazlasıdır. Makinelerin düşünebilip düşünemeyeceğini sormanın tek anlamlı yanı, böyle makinelerin uygulanabilir olup olmadığıyla ilgilenmemizdir; aynı durum makinelerin olasılık yargıları verip veremeyeceği sorusu için de geçerlidir.

Olasılık Yargıları

Bir noktaya kadar kuram, olgun bir biçime ulaşmış diğer bilimsel kuramlar gibidir. Yargılar bir "kara kutu"ya beslenir ve "ayırt etmeler" dışarı verilir.

Yargılar → Kara Kutu → Ayırt Etmeler

Kara kutu, kuramın aksiyomlarına (yani biçimsel postülalarına) dayanan biçimsel aygıttır (yani soyut ya da matematiksel kuramdır). Kara kutunun içinde "olasılık" sözcüğüne herhangi bir özel anlam verilmez. Altı ya da yedi aksiyom vardır; bunlardan bazı tipik olanlar şunlardır:

A1. P(E | F) ("F verildiğinde E’nin olasılığı" şeklinde okunur), E ve F önermeler olmak üzere, negatif olmayan bir sayıdır.
A3. P(E·F | H) = P(E | H)P(F | E·H), burada E·F, "E ve F" anlamına gelir.
A4. E ve F mantıksal olarak eşdeğerse, o hâlde herhangi bir G için P(E | G) = P(F | G) ve P(G | E) = P(G | F).

A4’ün olası bir değişikliği vardır:

A4'. Eğer "siz" E ve F’nin mantıksal olarak eşdeğer olduğunu kanıtladıysanız, o hâlde P(E | G) = P(F | G) vb.

Kara kutuyu kullanmak için uygulama kurallarına ihtiyaç vardır. P′(E | F) > P′(G | H) bir olasılık yargısı olsun; yani F verildiğinde E’ye olan inanç derecenizin (ya da yoğunluğunuzun), H verildiğinde G’ye olan inanç derecenizden daha fazla olacağına dair bir ifade olsun. (Bu tür yargılar verebilme olanağının, sayısal inanç derecelerinin varlığına bağlı olmadığını unutmayın.) Temel uygulama kuralı, tırnakların (kesme işaretlerinin) silinebileceğidir; yani kara kutuda P(E | F) > P(G | H) yazabilirsiniz ve tersi de geçerlidir. Bir yargıyı içeri sokmak, tırnakları silmektir; bir ayırt etme yapmak ise tırnakları eklemektir.

Yargılar kümesi, inançların girdi gövdesidir. Olasılık kuramının amacı, inançlar gövdenizi genişletmek ve içindeki tutarsızlıkları saptamaktır. Bunlar çoğu zaman daha olgun bir değerlendirme yoluyla düzeltilebilir.

Rasyonel Davranış Kuramı

Kuram, "yararlar" tanıtılarak ve "rasyonel davranış ilkesi" ile birleştirilerek bir "rasyonel davranış kuramı"na genişletilebilir. Bu ilke, uygun bir azalan ağırlıklandırma fonksiyonu ile tüm gelecek üzerine entegre edilmiş yararın matematiksel beklentisinin maksimize edilmesini önerir.

Aksiyomlar ve kuralların yanı sıra "öneriler" de vardır. Bunlar kesin değildir; çünkü kesin bir öneri, bir uygulama kuralı ya da bir aksiyom hâline gelirdi. Örneğin:

Sayısal olasılıklar, kusursuz biçimde karıştırılmış kusursuz iskambil desteleri ya da esasen benzer koşullar altında gerçekleştirilen sonsuz deneme dizileri hayal edilerek tanıtılabilir. Her iki yöntem de idealleştirmedir ve aralarında çok az tercih farkı vardır. Bu bir zevk meselesidir; bu nedenle bu konuda bu kadar çok tartışma vardır.
Olasılık kuramının herhangi bir teoremi ve herhangi birinin istatistiksel çıkarım yöntemleri, olasılık yargıları vermenize yardımcı olmak için kullanılabilir.
Kuram uygulandıktan sonra bir inançlar gövdesinin makul olmadığı bulunursa, bunu düzeltmenin iyi bir yolu dürüst olmaktır (duygusal olmayan yargı kullanmak). (Bu öneri, yarar yargıları için daha zordur; çünkü onlar hakkında duygusuz olmak daha zordur.)
Bayes postulası ya da ilgisizlik ilkesi bir öneri örneğidir. Bir kural olurdu, ancak yeterince kesin hâle getirilemez.

Rasyonel davranış kuramının gerekçelendirmeleri F. P. Ramsey, von Neumann ve Morgenstern ile L. J. Savage tarafından verilmiştir.

Bazı insanlar olasılık kuramını, insanlardan bağımsız ve tekil olduğu varsayılan rasyonel inanç derecelerine uygulamayı tercih ederler. Bunlara Edgeworth ve Bertrand Russell tarafından "güvenilirlikler" denir. Bu tür kuramlar Jeffreys ve Carnap tarafından desteklenir. Bir güvenilirliğin, insanların, hayvanların ya da robotların varlığından bağımsız olarak var olduğu varsayılır.

Aşağıdaki iki ifadenin eşdeğer olduğuna dikkat edin:

"F verildiğinde E’nin güvenilirliğinin, H verildiğinde G’ninkinden fazla olduğuna hükmediyorum," ve
"P′(E | F) > P′(G | H)."

İkinci ifade, güvenilirlikler yerine inanç dereceleriyle ilgilidir. Güvenilirliklerin var olduğuna inanıyorsanız, güvenilirliklerin büyüklüğü hakkında inanç derecelerine sahip olabilirsiniz.

İnanç dereceleri ve güvenilirliklerin yanı sıra, Popper’ın "eğilimler" dediği "fiziksel olasılıklar" da vardır. Bunlar, "esas olarak aynı koşullar" altında yapılan sonsuz bir deney dizisinde, bir güvenilirliğin (güvenilirliği 1 olmak üzere) yaklaşacağı sınırlardır. Pişmemiş kil ve çamurun heterojen bir karışımından oluşan bir zarın atılması örneğinde olduğu gibi, bazen bir deneyi birden fazla kez yapmak son derece zordur. Buna rağmen eğilimin var olduğu varsayılabilir. Her durumda, özellikle evrenin sonsuz genişlikte olduğu varsayılırsa, deneyin tekrarlandığı hayal edilebilir.

Yarın yağmur yağma olasılığıyla ilgileniyorsanız, fiziksel olasılığı tahmin etmek istersiniz; ancak uygulamada bundan daha iyisini yapmanız kesinlikle mümkün değildir, yani güvenilirliği tahmin edersiniz ve güvenilirlik tahmininiz sizin inanç derecenizdir.

Olasılık Yargıları Vermek

Şimdi, bir inançlar bütününü genel amaçlı bir bilgisayara verirsek, kara kutunun işlemlerini bizim yerimize pekâlâ yerine getirebilir. Böyle bir makine için olasılık yargıları verdiğini söylemek makul görünmez (belki bunların salt matematik içinde kullanıldığı durumlar hariç): en fazla, yalnızca “ayırt edişler”i (yukarıdaki teknik anlamda) türetir. Aslında, makinenin olasılık yargıları verdiğini ancak bunlar operatör tarafından girilenlerden türetilemiyorsa söylemem gerektiğini düşünüyorum. Ayrıca makine, yalnızca operatörün söylediklerini inkâr ediyorsa pek faydalı olmazdı. İstenen şey, makinenin en azından yeterli bir eğitimden ve olgun bir değerlendirmeden sonra tutarlı bir inançlar bütünü üretebilmesidir.

Makinemizin, anlatıldığı şekliyle olasılık kuramından yararlanabildiğini varsayacağım; geriye kalan soru, kendi olasılık yargılarını nasıl vereceğidir.

İlk bakışta mantıksal bir güçlük vardır; çünkü yargıların nasıl verileceğini kesin olarak belirtseydik, bunlara yargı değil, olasılık kuramının uygulanma kuralları derdik. Dolayısıyla belirtim kesin olmamalıdır. Soru, bir makine ya da bir makine programı için kesin olmayan belirtimlerin nasıl yapılabileceğidir.

Elbette bir makine rastgele olasılık yargıları yazdırabilir, fakat o zaman kısa sürede tutarsızlıklara düşer. Makineyi makul ölçüde akılcı kılmaya eğilimli bir ilke olmalıdır. Bu ilke belki de akılcı davranış kuramında bulunabilir.

Bu kuramı uygulamak için makine, değer (yarar) yargıları verebiliyormuş gibi davranmalıdır. Her hedef arayan makinenin yararları tahmin edebiliyormuş gibi davrandığı söylenebilir. Burada da yararlar tamamen insanlar tarafından belirlenmiş olabilir. Örneğin, iyi bir satranç oynayan makine, kaybetmeye kıyasla kazanmayı tercih ediyormuş gibi davranacaktır. Nitekim belirli bir tür satranç oynayan makine, ana sorumuz için yeterli bir örnek sağlayacaktır. Operatörle ya da diğer makinelerle bahis yapan makineler de başka bir örnek sınıfı oluşturur.

Bir Makineye Olasılık Yargıları Vermeyi Öğretmek

Öğretim çeşitli biçimler alabilir; bunlardan yalnızca aşağıdaki ikisini ele alacağım:

(a) Makineye son yargısının doğru mu yanlış mı olduğunu “söylemek”; ya da neredeyse eşdeğer ama daha verimli olarak, kendi yargılarımızı ona söylemek;
(b) Makineyi son yargısına göre “ödüllendirmek” ya da “cezalandırmak”.

Bu ikinci öğretim biçimi, büyük ölçüde kısmen rastgele ağlardan oluşan bir makine için daha uygun görünmektedir (örneğin bir “P.R.N.” makinesi). P.R.N. makinesinin, nöron modellerinden ve nöronlar arasındaki sinaptik bağlantılardan büyük ölçüde oluşacağını varsayacağım. Her nöronun bir eşik değeri vardır; giriş gerilimi eşik değerinin üzerine çıktığında nöron ateşler.

Kısmen rastgele ağlar kullanmanın amacı, sistematik bir düzenlemenin öğretimle kolayca aşılamayan önyargılı çalışma biçimleri getirebilmesidir. Bir P.R.N. makinesinin tasarımındaki temel sorunlardan biri, hangi yönlerden sistematik, hangi yönlerden rastgele olması gerektiğine karar vermektir. Söylemeye gerek yok, makinenin giriş ve çıkış organları olmalıdır ve genel amaçlı bir bilgisayar ile kısmen rastgele ağların birleşiminden oluşan bir melez makine olması da mümkündür.

Bir P.R.N. makinesi doğru bir yargı verdiğinde, örneğin üzerine bir miktar kimyasal dökülerek ödüllendirilebilir; bu kimyasal, en son kullanılan tüm nöronların eşiklerini kalıcı olarak düşürür, en azından bir sonraki ıslatmaya kadar. Ceza ise eşikleri yükselten bir panzehir kullanmaktan ibarettir. Ödül ve cezanın dereceleri de mümkün olur ve bir bahiste kazanılan ya da kaybedilen miktara karşılık gelebilir. Bu tür bir muamele özellikle genç P.R.N. makineleri için uygundur. “Sıcak kanla”, yani makine ne için ödüllendirildiğini ya da cezalandırıldığını unutmadan önce uygulanmalıdır. (Aksi hâlde, bir şekilde hatırlatmaya ihtiyaç duyabilir.) Makineye sunulan durumlar başlangıçta basit olmalıdır. Bu muamele oldukça kabadır ve özellikle ödül hak edilirken ceza verilmişse, travmalara ve bastırmaya yol açabilir. Eğer bu muamele uzun bir süre boyunca başarısız olursa ve birkaç kez baştan başlatıldıktan sonra da sonuç alınamazsa, makine sorunlu olarak sınıflandırılır ve yeniden tasarlanır. Ayrıca, psikanalize benzer bir yöntemle tedavi edilmesi olasılığı üzerine düşünmek de ilginçtir. Belki akıl dışılığın alanları bir tür serbest çağrışım yoluyla saptanabilir. Bu doğrultudaki araştırmalar, sonunda hem insan psikolojisinin hem de robot psikolojisinin incelenmesine yarar sağlayabilir. (Bkz. W. R. Ashby.19)

Az önce sözü edilen yeniden tasarımda, değiştirilebilecek çok sayıda parametre vardır; örneğin:

(a) toplam nöron sayısı,
(b) diğer nöronlara olan bağlantıların ortalama sayısı ve standart sapması,
(c) engelleyici bağlantıların oranı,
(d) yenilenmediği takdirde her bir sinaptik bağlantının etkin kaldığı süre.

Sorunlu olmayan bir makineye rastlarsak ve bu makine çok karmaşıksa, yargılarını nasıl verdiğini bilmeyeceğimiz için, adil bir şekilde kendi yargılarını verdiğini söyleyebiliriz. Doğrudur, makineyi kendimiz yetiştirmiş oluruz ve bu nedenle yargıları bizimkine benzeme eğiliminde olur. Öte yandan, öğretimde çok dikkatli olur ve yorgun ya da sarhoşken öğretim yapmazsak, makinenin yargıları bizim en iyi hâlimizdeki yargılarımız kadar iyi ve çok daha hızlı olabilir. Makinenin gerçekten “kendine ait bir zihni” geliştirmesini istiyorsak, bir aşamada makinenin, kendi başarı ve başarısızlık deneyimlerinden doğrudan öğrenmesine izin vermeli ve kendi yargılarımızın daha iyi olduğu konusunda sonsuza kadar ısrar etmemeliyiz.

P.R.N. makineleriyle ilgili bu yorumlar kasıtlı olarak spekülatiftir. Bununla birlikte, benim kişisel tahminim, önümüzdeki yirmi yıl içinde P.R.N. makineleriyle çok çarpıcı başarılar elde edileceğidir.

Bir Makineye Satranç Oynamayı Öğretmek

Makineyi öğretmenin (a) yöntemini, yani son yargısının doğru mu yanlış mı olduğunu söylemeyi ("kimyasallar" kullanmadan) ya da kendi yargılarımızı ona bildirmeyi tartışmak istiyorum. Bu yöntem, yeterince olgun bir P.R.N. makinesiyle ya da eğer böyle makineler yapılabilirse bir androidle işe yarar; ancak genel amaçlı bir bilgisayara satranç oynamayı öğretmek için de oldukça uygulanabilir bir yöntem olduğunu belirtmek isterim.

Satranç, kuramsal bilimsel araştırmanın birçok özelliğini sergilerken, aynı zamanda rahatça tartışılabilecek kadar da basittir. Bu, Turing, Shannon ve diğerlerinin bir makineye satranç oynatacak programlar geliştirmeye ilgi duymalarının muhtemel bir nedenidir. Satranç, uygulanabilir bir örnek sunmayabilir. Ancak aşağıdaki genel fikirlerin etkili olacağı bir oyun tasarlamak mümkün olurdu. Önümüzdeki yirmi yıl içinde gerçekten iyi bir satranç oynayan bir makinenin yapılıp yapılmayacağı açık bir sorudur. (Manchester’da programlanan iki hamleli satranç problemlerinin otomatik çözümü, satranç oynayan makineler sorununun ancak kenarına dokunmaktadır.)

[Devam Edecek]

COMPUTERS and AUTOMATION Ocak 1959 sayısı