← Computers & Automation

İstatistik ve Otomatik Bilgisayarlar

B
Bilinmeyen Yazar
1955 · Computers and Automation

Gordon Spenser
Eastern Joint Computer Conference, Philadelphia
8–10 Aralık 1954

Milton Stoller
Dijital Diferansiyel Analizör

George F. Forbes
Küçük, Yüksek Hızlı Bir Manyetik Tambur

M. K. Taylor
Ters-Yüz Edilmiş Bir Manyetik Tambur

Neil Macdonald
Otomatik Hesaplama Hizmetleri Listesi (kümülatif)

İstatistik ve Otomatik Bilgisayarlar

Gordon Spenser
Morristown, New Jersey

Modern, yüksek hızlı ve yüksek kapasiteli otomatik bilgisayarlar, daha önce olanaksız olan istatistiksel tekniklerin analizini mümkün kılmıştır. Bu bilgisayarlar, birçok alandaki yöntemleri köklü biçimde değiştirmiştir. On yıl önce çözüm yöntemi bulunmayan problemler, bugün otomatik hesaplamaya açık istatistiksel terimlerle yeniden ele alınmıştır. Aerodinamikten zoolojiye kadar, otomatik istatistiksel hesaplama daha önce kapalı olan kapıları açmaktadır.

Nükleer Biyofizik

Örneğin, nükleer bilim laboratuvarlarında ve giderek radyoaktif izleyici tekniklerini kullanan endüstrilerde, insanların zararlı miktarlarda radyasyon almadığının belirlenmesi önemlidir. Ancak radyasyonun nüfuz etme gücü ve etkileri, yayılan nükleer parçacıkların türüne ve enerjisine bağlı olarak büyük ölçüde değişir.

Yakın zamanda, atomik bir dönüşüm sırasında sıklıkla yüksek enerjiler ve hızlarla yayılan, elektriksel olarak yüksüz parçacıklar olan nötronların etkileri üzerine bir çalışma yapılmıştır. Çalışma, hayvan dokusundaki etkileri incelemek üzere tasarlanmıştır. Doğrudan matematiksel bir yaklaşım son derece karmaşıktı.

Bu nedenle fiziksel durum şu süreçle yaklaşıklandı: bir kaynaktan bir nötronun yayılmasına izin verilir; dokunun bileşen elementleriyle rastgele çarpışması sağlanır; her çarpışmada kaybedilen enerji miktarı ve çarpışmanın konumu kaydedilir; bilgisayar kullanılarak nötronun yolu benzetilir; dokuya verilen hasar, enerji kaybının doğrudan bir fonksiyonu olarak hesaplanır; ve gerekli olan her yerde rastgele seçimler yapılarak bu işlem art arda birçok nötron için tekrar edilir. Bu yolla istatistiksel bir örneklem derlenir.

İstatistiksel işlem, rastgele olarak şunların seçilmesini içeriyordu: (1) örneğin karbon, fosfor, oksijen vb. gibi ilgili element türü; (2) geri saçılma yönü; (3) bir sonraki çarpışmaya kadar olan iz uzunluğu; vb.

Nötronun enerjisi tamamen düşürülene kadar süreç tekrarlanır. Bu biçimde bilgisayarda izlenen yeterince büyük sayıda nötronla, standart istatistiksel teknikler, çeşitli başlangıç enerjilerine sahip nötronlardan belirli bölgelerde oluşan hasarın kestirimlerini sağlayacaktır. Ayrıca bu kestirimlerin istatistiksel kesinliğine ilişkin ölçüler de elde edilebilir.

Artık Monte Carlo yöntemi olarak adlandırılan bu genel yaklaşım, modern bir otomatik bilgisayar için son derece uygundur; çünkü her bir çarpışmayı üretmede yer alan temel adımlar aynıdır, ancak istenen kesinliği elde etmek için çok sayıda tekrar ve dolayısıyla çok sayıda hesaplama gerekir. Yüksek hızlı bir bilgisayarda saatler içinde yapılan iş, elle yapılsaydı yıllar, delikli kart donanımıyla yapılsaydı aylar alırdı.

Kimya Mühendisliği

Kimya mühendisliğinde sürekli gelişen teknoloji, sık sık şu soruyu gündeme getirir: “Öngörülen bir teknolojik değişiklik, belirli bir özelliğe göre ürünümü anlamlı biçimde iyileştiriyor mu?” İnceleme yapan mühendise yanıt sağlayacak standart istatistiksel teknikler mevcuttur; ancak bu teknikler hesaplama açısından zahmetli ve zaman alıcı olabilir ya da yalnızca kısıtlayıcı koşullar altında geçerli olabilir. Bu durumda, bilgisayar için problem hazırlamak genellikle pratik değildir; çünkü bilgisayar için kısa olan hesaplama süresi ve bilgisayar çözümünün kısıtlayıcı koşulları hesaba katmayabilmesi söz konusudur.

Buna karşılık, yakın zamanda geliştirilmiş ve dağılımdan bağımsız ya da parametrik olmayan istatistik olarak bilinen bir teknikler bütünü vardır. Bu teknik, çok genel varsayımlar altında, çoğu zaman çok az hesaplamayla ya da hiç hesaplama yapmadan kimya mühendisinin sorusuna yanıt verir. Örneğin bir yöntem, söz konusu özelliğin ölçümlerinin yalnızca büyüklük sırasına göre listelenmesini ve standart yöntem A ile önerilen değişiklik B arasında ayrım yapılmasını gerektirir. 14 ölçümün listesine ilişkin bir kayıt şöyle görünebilir:

A A B A A A B B A A B B B B.

Artık yapılması gereken tek şey, ortaya çıkan serileri, yani aynı harfin art arda göründüğü küme sayısını saymaktır. Yukarıdaki dizide altı seri vardır. El kitaplarındaki tablolar, deneysel sonuçlara makul olarak atfedilebilecek istatistiksel anlamlılık derecesini hemen gösterecektir.

Ancak bu tür bir tekniğin yerinde kullanımı, deneyciyin ne sıklıkla yanlış bir karara varacağını bilmesine bağlıdır: özellikle, gerçekte fark olmadığı hâlde önerilen değişiklikten anlamlı bir fark olduğu sonucuna ne sıklıkla varacağı; ya da tersine. Bir fark olduğu sonucuna varma olasılığına istatistikçiler bir testin gücü adını verir. Bir testin gücünün matematiksel olarak hesaplanması çoğu zaman zordur; bu durumda, yukarıdaki örnekte 14 olan örneklem büyüklüğü mertebesinde bir integralin değerlendirilmesini içerir.

Bununla birlikte, bir testin gücünü kestirmek için istatistiksel bir hesaplama otomatik bilgisayarlarla mümkündür. Bu yöntem, belirli bir miktar farklılık gösterdiği bilinen popülasyonlardan örneklemler üretmek ve ardından doğru kararların sıklığını kestirmek için testi uygulamaktır. Benzer biçimde türetilmiş çok sayıda örneklemin üretilmesi ve aynı test yordamının uygulanması, modern bir bilgisayar için son derece uygun, tekrarlamalı bir işlemdir. El kitabı tablolarının bulunmadığı durumlarda ise, makineyle örnekleme, bunları oluşturmak için elverişli bir yöntem olarak kullanılabilir.

Ekonomi

Birçok ekonomistin amacı, ulusun ekonomisinin durumunu öngörecek matematiksel bir denklem elde edebilmektir. Doğal olarak böyle bir ifadenin geçerliliği için ön koşullardan biri, ekonomik bütünün çeşitli bileşenleri hakkında kapsamlı bilginin varlığıdır; örneğin yük vagonu yüklemeleri, dolaşımdaki para hacmi, eldeki stoklar, başlatılan yeni inşaat projelerinin sayısı ve hem genel hem de ayrıntılı çok sayıda başka bileşen.

İstatistiksel problem, belirli bir biçimde bir araya getirildikleri varsayıldığında çeşitli bileşenlerin göreli önemlerine ilişkin kestirimler elde etmektir; örneğin şu denklemde olduğu gibi:

y = a₁x₁ + a₂x₂ + a₃x₃ + …,

burada y, ekonominin durumunu bazı keyfi birimlerle ifade eder; x’ler çeşitli bileşenleri temsil eder; a’lar ise ilgili bileşenlerin önemlerinin ölçüleridir. Temel sorun iki yönlüdür: a’ların belirlenmesi; ve y için öngörülen bir değerin, y’nin gerçek değerinden ne kadar sapmasının olası olduğunun saptanması.

a’ların tahmin edilmesi, matris tersini alma olarak bilinen matematiksel probleme eşdeğerdir. Bir matrisin tersini almak, genel olarak, bilinmeyen a’ların sayısının üçüncü kuvvetiyle orantılı sayıda çarpma gerektirir (matrisin “derecesi”). Dolayısıyla, bileşenlerin sayısının iki katına çıkarılması, sekiz kat daha fazla çarpma gerektirir. Kısa bir süre öncesine kadar, yirminci dereceden bir matrisin tersinin alınması kayda değer bir olaydı; ancak günümüzde teknik literatür, derecesi yüzlere ulaşan matrislerin tersinin alınmasına ilişkin raporlar içermektedir.

Bu yolla ufuklar giderek daha geriye itilmekte ve ekonomik sistemimiz hakkında daha fazla bilgi elde edilebilmektedir.

Psikoloji

Benzer teknikler ve ilerlemeler psikolojide de görülmektedir. Çoklu faktör analizi, psikolojik testlerde bağımsız özellikleri ayırmak için kullanılan bir tekniktir. Özelliklerin ya da karakteristiklerin ayrıştırılması problemi; zekâ belirtilerinin analizinde, sınıflandırma problemlerinin çözümünde (bir örneği, ölçülebilir fiziksel özelliklerin bir bileşimine dayanarak birkaç türden birine atamaya çalışırken) ya da diğer alanlarda ortaya çıkabilir.

Daha yüksek dereceli matrislerin tersinin alınabilmesi, çok daha fazla ölçüm türünde yer alan bilgilere dayanarak örnekler arasında ayrım yapmayı mümkün kılar ve böylece sınıflandırmanın hassasiyetini artırır.

Demografi

1890 ABD nüfus sayımının yararlılığı, toplam dökümün derlenmesinin 1897 yılına kadar tamamlanamaması ve bu süre içinde Amerika Birleşik Devletleri nüfusunda çok büyük değişikliklerin meydana gelmiş olması nedeniyle ciddi biçimde azalmıştı. Sayım Bürosunun gereksinimlerine yanıt olarak Herman Hollerith tarafından geliştirilen delikli kartların kullanımı o dönemde durumu hafifletmişti; ancak günümüzde nüfusun artışı ve nüfus sayımı anketinin kapsamının genişlemesi yeniden zararlı gecikmeler doğurma tehdidi taşımaktadır.

Bu tehditle başa çıkmak için Sayım Bürosu, birincil bilgileri depolamak ve fotoğrafik çoğaltmaya uygun tüm çizelgeleme ve baskı raporlarını hazırlamak amacıyla manyetik bant ve modern bir elektronik bilgisayar kullanmaya başlamıştır.

Yeni bilgisayar sistemi, ilk kez 1950 Nüfus ve Konut Sayımında geniş ölçekte kullanılmıştır. Başarıyla ele alınan problemlerden biri, Alabama, Iowa, Louisiana ve Virginia’daki belirli bölgeler için, toplam sayım nüfusu yaklaşık 11,7 milyon kişi olan alanlarda genel nüfus özelliklerinin tablolaştırılmasıydı.

Bunlar, modern otomatik bilgisayarların istatistiğe uygulanmasının yalnızca birkaç örneğidir; ancak uygulama alanlarının çeşitliliğini göstermektedirler. Ayrıca, bir başlık altında tanımlanan tekniklerin pek çok başka alanda benzer karşılıkları vardır. Son olarak, istatistik ve otomatik bilgisayarlar alanında kilit öneme sahip olan husus, bilgisayarların matematiksel istatistikte araştırma yürütmek için kullanılmasıdır. Yeni yöntemler tam matematiksel titizlikle geliştirilebilse bile, genellikle yeterli tablolar hesaplanmadıkça uygulamalı istatistikçinin araç setine giremezler. Bu fonksiyonların birçoğu

(13. sayfada devamı)

İstatistik ve Otomatik Bilgisayarlar

(Sayfa 3’ten devam)

İstatistik o kadar karmaşıktır ki, otomatik bilgisayarlardan önce tablolaştırılamıyordu. Hızlı, otomatik bilgisayarların daha yaygın kullanımı, kuşkusuz matematiksel istatistiğin yeni ve güçlü tekniklerinin yayılmasına yol açacak ve bunlar her yerde uygulamalı alanlara girecektir.

SON