← Computers & Automation

The Appetite for Instant News Election Predictions

B
Bilinmeyen Yazar
1960 · Computers and Automation

ANINDA HABERE OLAN İŞTAH: SEÇİM TAHMİNLERİ

Stephen E. Wright
Applied Data Research
Princeton, N. J.

(Association for Computing Machinery’nin Milwaukee, Wisc.’te 26 Ağustos 1960’ta yapılan toplantısında sunulan bir rapora dayanmaktadır)

Yeni bir başkanlık kampanyası ivme kazanmaya başlarken, ülke yakında yükselen bir heyecan dalgasına kapılacaktır. Atlar son virajı dönüyor, düzlüğe çıkış yakında başlayacak. Son yıllarda olduğu gibi, Seçim Gecesi yarışın doruk noktası, yeni bir olgu olan elektronik tellal tarafından izlenecektir. Üç büyük ağın tamamı, haberleri olmadan önce bildirmek için çaresiz bir yarışta bilgisayarları kullanacaktır.

Bilgisayarlarda seçim tahmini yapmak, Profesör Jackson’ın Köprü Oynama Programı bir yana, yararsız etkinlikler listesinde üst sıralarda yer almalıdır. Kumar mesleğinin dışında, oyların kesin olarak bilindiği andan altı ya da sekiz saat önce iyi bir tahminde bulunmanın olası hiçbir yararı yoktur. Üstelik, olaylar gece bitmeden yanlış çıkabilecekken, aklı başında insanlar neden milyonlarca seyircinin önünde boyunlarını uzatsın?

Yanıt, yayıncılık endüstrisinin gücüyle büyütülen anında habere olan iştahımızda yatmaktadır. Prenses Margaret’in gelinliğiyle ilgili haberler için acı içinde bekleyen bir kamuoyunun, bir sonraki Başkanımızın kimliğini sabah gazetelerinden öğrenmesine izin verilemez.

İşte bu nedenle Kasım 1952’de UNIVAC siyasal sahneye yürüdü ya da sendeledi. Ortaya çıkışı, o yıl selefleri olan kamuoyu yoklamacılarının sergilediği aşırı temkinlilikle elverişli hale geldi. Hatırlayacağınız üzere bu seçim, Başkan Dewey yönetiminin son aylarında yapıldı.

Ayrıca Gallup ve Roper yalnızca insandır; oysa elektronik bilgisayar büyük bir sihirle donatılmıştır. Kamuoyunun dev beyne duyduğu hayranlık, onun yüzüstü düşmesini ve böylece insanın makine üzerindeki nihai üstünlüğünün doğrulanmasını uman sinsi bir beklentiyle karışıktır. İstatistiğin bir şekilde Amerikan karşıtlığını çağrıştırdığı yadsınamaz gerçeğini de belirtmeliyim. İnsanların gelecekteki davranışlarını tahmin edebilme yeteneği, açıkça demokratik sürecin inkârı olarak görülür; düşünce kontrolüne ve sosyalizme götürür.

Söylemeye gerek yok ki, bu etkenler bilgisayarın performansının televizyon ağları açısından haber değerini artırdı. Ağların bu ilgisi, 1952’de seçim projesini o dönemde yeni olan harikalarını tanıtma umuduyla üstlenen Remington Rand’ın ilgisiyle örtüştü. Bunda parlak ve bir gecede başarıya ulaştılar. “IBM’in UNIVAC’ı” evlerde bilinen bir ad haline geldi. Ne yazık ki ev pazarı bu ürün için hazır değildi.

Şimdi bu etkinliğin yüzeysel niteliğini bir an için bir kenara bırakalım ve bu tür tahminlerin gerçekte nasıl yapıldığına bakalım.

Tarihsel modelimiz, oyların, gerçek seçmenlerin bulunduğu şüpheli sandıklardan geldiğini izleyen eski tip mahalle simsarıdır (günümüzde sandık gözlemcileri bile devlet adamıdır). Şöyle diyebilir:

"Geçen yıla göre 16. Mahallede 200 oy daha aldık. Bu tür bir farkla bölgede genellikle 2.000’lik bir çoğunluk elde ederiz. Banliyölerde 3.000’lik bir üstünlükleri var, ama bizim oylarımız orada her zaman geç gelir. En iyisi gidip yeni Belediye Başkanına saygılarımı sunayım."

Ulusal seçimlerde veri hacmi çok büyüktür ve oylar mahalle ve sandık düzeyinde değerlendirme yapılmasına olanak vermeyecek kadar rastgele gelir. Ancak bu analizin arkasındaki bazı temel fikirler kullanılır: mevcut oyların zaman içinde ekstrapolasyonu, geçmiş sonuçlarla karşılaştırma ve mekânsal ekstrapolasyon. Ve elbette bilgisayar, hem geçmiş verilerin hem de güncel sonuçların nicel bir analizini yapabilir.

Büyük veri yığınlarını sindirmekte ve basit özetler üretmekte başarılıdır. Bunu hızlı ve doğru yapar. Bunu doğru biçimde yapıp yapmadığı ise kullanılan istatistiksel modele, programcıların becerisine ve itiraf etmeliyim ki şansa bağlıdır.

Olasılık her neyse, tamamen sağlam bir tahmin yanlış çıkabilir ve iki aday arasında kesin bir tahmin yapılırken yanlış olmak, gazete editörlerinin, siyasi yorumcuların ve iflas etmiş at yarışçılarının keyfi için yüzde 100 yanlış olmak demektir.

Önceki seçimlerde şanslıydık; ancak 1954 Kongre yarışları hariç tutulursa, yarışlar çok da başa baş değildi. (Kendimi siyasete karşı bir duyarsızlık geliştirirken buluyorum; kazanan kim olursa olsun ezici bir zafer umar hale geldim. Ayrıca iki partili sistemin ateşli bir savunucusu oldum; üçlü yarışları tahmin etme düşüncesi beni ürpertiyor!)

UNIVAC üzerinde seçim tahmini yaparken kullandığımız istatistiksel model, New York Üniversitesi’nden Dr. Max Woodbury tarafından geliştirildi. Dr. Woodbury şu anda Avrupa’da bir iyi niyet turunda olduğundan ve karşılık veremeyeceğinden, istatistik bilgimin yalnızca ihmal edilebilir düzeyde değil, aynı zamanda güçlü biçimde önyargılı olduğunu belirtmeliyim. Mesleğinden uzaklaşmış bir elektronik mühendisi olarak, olasılık kuramında her zaman tuhaf bir şeyler olduğundan şüphelenmişimdir. Yıllar boyunca Dr. Woodbury ile istatistiksel modellerini programlama konusunda birçok mücadele verdim; sağduyu adına istatistiğe karşı savaştım. Şimdiye kadar her zaman onun haklı çıktığını kabul etmek can sıkıcıdır.

Seçtiğimiz model türü, mevcut verilerin niteliğiyle sınırlıdır. Siyasi açıdan istikrarlı ve ülkenin başlıca bölgelerine eşit biçimde dağılmış, uygun şekilde seçilmiş kilit sandıklar ya da bölgelerden nihai oyları elde etmek arzu edilir. Bu tür veriler ancak son izleyici yatağına gittikten sonra mevcut olduğundan, mümkün olan en erken zamanda elde edebildiğimiz her şeyle yetinmek zorundayız. Bu da, ağırlıklı olarak iki büyük haber ajansına, özel telefon ve teleks raporlarıyla desteklenmiş biçimde dayanmak anlamına gelir.

Haber ajansları ulusal yarışları öncelikle, belirli bir eyalette her aday için toplamlar ve rapor veren sandık sayısı biçiminde bildirir.

Son başkanlık seçiminden tipik bir dönüş şudur: Vermont, 720 sandığın 243’ü; Eisenhower, 5.120; Stevenson, 30. Büyük metropol alanları olan eyaletlerde oylar şehir ve eyaletin geri kalanı olarak ayrılabilir.

Daha ince alt bölümlere ilişkin bilgiler kuramsal olarak mevcuttur, ancak genellikle dışlanır; çünkü elle yazıya dökülmüş devasa veri hacimlerinin bilgisayara beslenmesinde sınırlamalar vardır, geçmiş verilerin analizindeki güçlükler vb.

Bu nedenle, Başkanlık ve Senato seçimlerindeki tahminleri ele alırken temel birimimiz eyalettir.

Her eyalet içinde iki olasılığımız vardır:

a. Bu eyaletten bazı raporlar mevcutsa, bu andaki iki partili oyu bilerek, nihai oyun dağılımının ne olacağını sorarız.

b. Bu eyaletten hiç rapor yoksa, rapor veren eyaletlerdeki eğilimi ve bu eyaletin geçmişte nasıl oy verdiğini bilerek, nihai oyun dağılımının ne olacağını sorarız.

Yani, rapor veren her eyalet içinde:

  1. Her partinin mevcut oylarını nihai oya ekstrapole ederiz.
  2. Tahmin edilen Demokratik yüzdesini hesaplar ve bu eyaletteki geçmiş ortalamalarla karşılaştırırız.
  3. Bir fark hesaplarız.
  4. Ulusal bir eğilim üretmek için bu farkları özetleriz.
  5. Bu eğilimi rapor vermeyen eyaletlere uygulayarak onların Demokratik yüzdelerini tahmin ederiz.

Bu açıklama, elbette, gerçekte kullanılan modelin büyük ölçüde basitleştirilmiş bir sürümüdür. Uygulamada bu eğriler, belirsizlik getiren bir saçılma gösterir ve bu da bizi ekstrapolasyonun bir hassasiyet derecesini tahmin etmeye götürür; bu hassasiyet, sayılan sandık sayısı arttıkça artan bir fonksiyondur.

Bir eyalet tahmini siyah-beyaz değildir. Bazı oylar raporlanmıştır, ancak diğer eyaletlerdeki eğilimi de dikkate alırız. Birçok eyalet şehir ve eyaletin geri kalanı oylarına ayrılır ve tahminleri birleştiririz.

Geçmiş verileri kapsamlı biçimde analiz ederiz. Eyaletler için 1944’e, bazı metropol alanları için 1952’ye kadar uzanan bilgilere sahibiz. Ağırlık atamak için bu bilgilerden yararlanırız. Geçmiş tarih dışında görevde olma durumu gibi başka nesnel etkenler de dikkate alınabilir. Adayların tarım meselesi, emek, yerel konular gibi konulardaki tutumları gibi bazı öznel etkenler önerilmiştir; ancak nicel bir ölçüt yoktur. Zaman sınırlamaları bu etkenlerin dâhil edilmesini engellemiştir.

Geçmiş verilerin toplanması çok büyük bir iştir; ancak bazı başvuru kaynakları vardır: Scammon’ın America Votes’u, Temsilciler Meclisi Katibi vb. Veri analizi her seçimde tekrarlanmalıdır; çünkü bir önceki seçimler en güvenilir biçimde ilişkili verileri sağlar. Geçmiş verilerin analizi, bilgisayarlar olsa bile bel kırıcı bir iştir. Dr. Woodbury gibi bir matematikçi geçmiş programlardan asla memnun olmaz; her zaman programı "iyileştirmek" için "küçük değişiklikler" arar. Bilgisayarları programlamadıkça, küçük bir değişikliğin ne kadar büyük olabileceğini asla bilemezsiniz!

Bilgisayar için yazılan program, özellikle teleks ve telefon dönüşlerindeki hatalar—oylarda, yarışlarda, bölgelerdeki hatalar—olmak üzere, verinin doğruluğu üzerinde denetimle ilgilenir. Oy sayımında fazladan bir basamak varsa, ya oy sayımı düzeltilir ya da dışlanır; belki partiler ters çevrilmiştir; yanlış bölge raporlanmış olabilir; ya da rakamlar uydurulmuş olabilir.

Bilgiyi bilgisayarın kabul edebileceği bir biçime dönüştürmek için insanlara güvenmek zorundayız. Bu nedenle bilgiyi üç kez yazdırırız ve bilgisayar bilgiyi üçte iki çoğunluk esasına göre kabul eder. 1962’ye kadar doğrudan giriş yapabilen bilgisayarların kullanılabilir olması umulmaktadır.

Bilgisayar, bu sefer raporlanan toplam oyun, geçen sefer raporlanan toplam oydan az olmadığını denetler. Ayrıca şunları da kontrol eder:

  • rapor veren sandık sayısının geçen seferkinden fazla olduğunu;
  • rapor veren toplam sandık sayısının bölgedeki toplam sandık sayısından az olduğunu;
  • toplam oyun makul olduğunu;
  • toplam Demokratik yüzdesinin makul olduğunu.

COMPUTERS and AUTOMATION, Ekim 1960

Bu yıl yalnızca büyük ağlar değil, üç büyük bilgisayar üreticisi de tahmin yarışına kapılmış durumdadır. Aslında seçim tahmini artık haber kapsamının zorunlu bir parçasıdır. Sekiz yılda ne kadar yol aldık!