BİLGİSAYARLA BİLİMSEL ÖZETLEME
H. T. Rowe
International Business Machines Corp.
New York, N.Y.
International Business Machines Corp.’taki araştırmacılar, bilimsel ve teknik makalelerin IBM 704 Elektronik Veri İşleme Sistemi kullanılarak özetlerinin üretilmesine yönelik bir yöntem hakkında ilk ilerleme raporunu yayımlamışlardır.
Makaleler bilgisayar tarafından cümle cümle analiz edilir. Makine daha sonra “en anlamlı” cümleleri seçer ve bunları elektronik bir yazıcıda yeniden üretir. İnsan mühendis ya da bilim insanı bu cümleleri okuyarak makalenin kendisi için değerli olup olmadığına karar verebilir.
Auto-Abstracting olarak adlandırılan makineyle özetleme tekniğinde, özetlenecek makale önce IBM kartlarına delinerek aktarılır, ardından manyetik banda çevrilir ve bu bant makineye yerleştirilir. (Geliştirilmekte olan optik tarama, ileride kart aşamasını bütünüyle ortadan kaldırabilir.) Makine manyetik bandı saniyenin çok küçük bir kesrinde “okur” ve bir program uygulayarak sözcükleri varlıklar olarak ele alır. Bunların “önemini”, tekil kullanım sıklığını ve kombinasyonlar ile eşleşmelerin sıklığını ölçerek belirler.
Makalenin tamamı, sözcük kullanımının ve konumunun istatistiksel analizine tabi tutulur ve bundan bir değerler tablosu elde edilir. Makine daha sonra her cümleyi bu tabloya dayanarak analiz eder ve ona bir önem katsayısı verir. Ardından bu katsayıların derecesine bağlı olarak, makine en yüksek sıradaki birkaç cümleyi seçer ve yazdırır.
Önem çok yüksekse, tek bir cümle tüm özet olarak hizmet edebilir. Buna karşılık anlam birkaç cümleye yayılmışsa, makine bunların tümünü yazdırır.
Makine özetlerinin bir avantajı, özette yalnızca yazarların özgün ifadelerinin yer alması ve özetleme cümlelerinin insan değerlendiricilerin yanlış yorumlarına tabi olmamasıdır. Bir diğer avantaj ise, anahtar cümle ya da cümlelerin seçiminin matematiksel analiz ve sabit bir standart aracılığıyla yapılmasıdır.
Otomatik özetleme tekniği, IBM’in Yorktown Heights Araştırma Merkezi’nden H. P. Luhn tarafından yürütülen bilgi erişimi problemleri üzerine araştırmalardan doğmuştur. Bu tür elektronik veri işleme yöntemleriyle çözüm bekleyen çok sayıda zahmetli bilgi arama problemi bulunmaktadır.
Patent Ofisi, yeni patentler olarak sunulan makine tasarımlarındaki milyonlarca varyasyonu önce sınıflandırmak, sonra hâlihazırda dosyalanmış benzer varyasyonların tüm sınıfını bulmak ve ardından varyasyon derecesini belirlemek gibi Herkülvari bir görevle karşı karşıyadır.
Hekimler, her bilinen hastalık için binlerce belirti kombinasyonunu ezberlemiş bir bilgisayara belirtilerin girilmesi yoluyla hastalıkların teşhis edilmesi olasılığını değerlendirmektedirler.
Teknik özellikler ve maliyet sınırlamaları verildiğinde, reçineler ve plastikler dâhil olmak üzere kimyasal bileşikler, geliştirilmiş binlercesi arasından bilgisayarlar tarafından seçilebilir.
IBM araştırmacıları, bu ilerleme raporunun edebî özetleme alanında yalnızca ilk bir adım olduğunu, ancak daha ileri geliştirmeyi haklı çıkaracak kadar başarı elde edildiğini belirtmektedirler.