← Computers & Automation

Pictorial Information Processed on a Digital Computer

B
Bilinmeyen Yazar
1958 · Computers and Automation

Dijital Bir Bilgisayarda İşlenen Görsel Bilgi

Ulusal Standartlar Bürosu \ Washington 25, D.C.

Resimlerin bilgi içeriğinin işlenmesine yönelik keşif niteliğindeki deneyler, yakın zamanda Ulusal Standartlar Bürosu Elektronik Otomatik Bilgisayarı SEAC üzerinde gerçekleştirilmiştir. Uygun tarama ve görüntüleme donanımlarının yardımıyla bilgisayar, resimleri girişe uygun dijital biçime dönüştürür, bilgiyi önceden düzenlenmiş bir yordam doğrultusunda işler ve sonuçları görsel bir çıktı olarak gösterir.

Resim işleme için yüksek hızlı elektronik bilgisayarların olası uygulamaları hakkındaki bilgiyi artırmak amacıyla, Büro’nun Veri İşleme Sistemleri Laboratuvarı’ndan R. A. Kirsch tarafından deneyler yürütülmektedir.

Otomatik veri işleme tekniklerinin geliştirilmesi için en büyük itici güç, alfabetik veya sayısal bilgilerin yüksek hızda işlenmesi gereksinimi olmuştur. Normalde bu tür bilgiler zaten dijital biçimde mevcuttur. Aksi halde, sayılara dönüştürülebilirler. Her iki durumda da, uygun giriş aygıtlarıyla bilgisayarlara beslenmek üzere elle bir araya getirilebilirler.

Bu tür geleneksel veri tiplerinin işlenmesine duyulan büyük gereksinimin bir sonucu olarak, yalnızca yakın zamanda, genel amaçlı bilgisayarların, alışılmadık veri türlerini toplamak için özel amaçlı giriş aygıtlarıyla birlikte kullanımına herhangi bir dikkat verilmiştir. Özellikle, doğal olarak resimler, diyagramlar veya insanlar tarafından görsel kullanım için tasarlanmış diğer grafiksel düzenlemeler biçiminde ortaya çıkan bilgilerin otomatik olarak toplanması ve işlenmesi için dijital bilgisayarların kullanımına yönelik araştırmalar yetersiz kalmıştır.

Basılı alfabetik ve sayısal karakterlerin tanınması gibi problemlere önemli ölçüde çaba yönlendirilmiş olsa da, bu çaba çoğunlukla çok belirli işlevleri yerine getiren özel donanımların yapılmasıyla ilgilidir. Daha genel bilgi sağlamak amacıyla, Büro, görsel bilginin doğasını anlamaya yardımcı olmak için genel amaçlı dijital bilgisayarların kullanımını içeren bir dizi keşif deneyini başlatmıştır.

Giriş ve Çıkış için Donanım

Görsel bilgiyi SEAC’e beslemek için, bir resimdeki bilgiyi sayısallaştıran basit bir mekanik tambur tarama aygıtı kullanılmaktadır. Taranacak fotoğraf, yaklaşık 3½ inç çapında bir tambur üzerine monte edilir. Tambur dönerken, bir fotokatlayıcı ve bir aydınlatma kaynağı, tamburun eksenine paralel olarak hareket eden bir vida mili üzerine monte edilmiştir. Vida milinin adımı, fotokatlayıcının tamburun her bir dönüşünde 0,25 mm hareket etmesini sağlayacak şekildedir.

Optik sistemdeki bir maske 0,25 mm’lik bir kareyi aydınlatır ve bir stroboskop diski, tamburun her 0,25 mm’lik dönüşünde birer optik darbe üretir. Böylece fotokatlayıcı, her bir 0,25 mm’lik karenin göreli yansıtırlığını inceleyebilir. Tarayıcının elektronik devreleri aracılığıyla, resimdeki koyu bir kare ikili 1’e dönüştürülür. Yeterince beyaz bir kare ise ikili 0 üretir. Tüm resim 25 saniye veya daha kısa sürede taranır.

Resim 44 × 44 mm olduğundan, 30.976 ikili basamağa dönüştürülür ve SEAC’in belleğinde 704 sözcük yer kaplar.

Tarayıcıdan bilgisayara beslenmiş bir resmi görüntülemek için, bellekte saklanan resimdeki her bir ikili 1’in konumu için bir çift koordinat sayısı türeten bir program hazırlandı. Kodları çözüldüğünde bu sayılar, bir osiloskobun düşey ve yatay girişlerine uygulanan bir çift analog gerilim üretir; böylece görsel bir görüntü oluşturulur.

SEAC Üzerinde Resimlerin İşlenmesi

Örüntü tanımada amaç, bir örüntüyü bir örüntüler grubundan ayırt etmek için gerekli olan en az bilgi miktarına indirgemektir. Bu deneylerde yaklaşım, örüntüleri en önemli özelliklerini elde edecek şekilde basitleştirmek için hesaplamalı süreçlerden oluşan bir kütüphane geliştirmekti. Ön deneyler, hangi işlemlerin en bilgilendirici olacağını belirlemekle ilgiliydi.

Bu temel işlemleri yerine getiren ayrık yordamların derlenmesi, çok çeşitli örüntü tanımlama mantıklarının benzetimini yapabilen esnek bir sistemin temelini sağlayacaktır. Programcı, örüntü analizinin izleyeceği yolu belirledikten sonra, bu dosyaya başvurup amacına en iyi hizmet edecek yordamları uygun bir bileşim içinde seçmekle yetinir.

Ayrıca, analist bilgisayar konsolunda oturup bu teyp kütüphanesinden, önceki işlemlerin sonuçlarını inceledikten sonra pragmatik olarak seçebileceği çeşitli yordamları çekebilir ve bu yolla bilgisayarı adım adım incelenen örüntünün tanınmasına doğru yönlendirebilir.

Bu yordamlarda iki tür çıktı ayırt edilebilir: sayısal veriler ve dönüştürülmüş resimler. Sayısal veriler doğrudan bilgisayardan okunabilir; ancak resimsel bilgi, resim çıkış osiloskobunda gösterilebilmesi için önce dönüştürülmelidir. Bu gibi durumlarda resim görüntüleme yordamı kullanılır.

Kütüphanedeki en basit yordamlardan biri, bir örüntüdeki toplam siyah alanı sayar. Bu program her biti sırayla inceler ve bit bir siyah alanı temsil ettiğinde sayımı artırır. Birçok örüntüde tümüyle siyah ya da tümüyle beyaz olan çok sayıda sözcük bulunacağı gerçeğinden yararlanılır. Tüm sözcüklerin tamamı sıfırlar ya da tamamı birler sabitleriyle karşılaştırılmasıyla önemli ölçüde zaman kazanılır. Alan sayma süreci SEAC üzerinde yaklaşık otuz saniye gerektirir.

Bir resimdeki nesne sayısını saymak için bir yordam tasarlandı. Siyah bir alan, tamamen beyaz alanlarla çevrili olduğunda bir “nesne” olarak tanımlanır. 53 nesne içeren bir fotoğraf SEAC’e verildiğinde, bilgisayar doğru sayımı üretti. Nesnelerin bazıları sezgisel olarak iki ya da daha fazla örtüşen nesne şeklinde yorumlanabilse de, bu sezgisel nesne tanımı kullanılmadı.

Nesne sayma yordamı, katı ve basitçe bağlantılı nesneleri saymakla sınırlı değildi. Dokuz soyut şeklin bulunduğu bir resim SEAC’e verildiğinde, nesneler içbükey geri girintili profiller (örneğin bir spiral) içerse, çoklu bağlantılı olsa (B harfi) ya da diğer nesneler arasında serpiştirilmiş olsa bile doğru sayımı üretti.

SEAC’in yanıtlamak üzere programlandığı başka bir soru türü, sayılan nesnelerin her birinin alanının değerlendirilmesini içeriyordu. Bir nesnenin alanı, nesnenin toplam siyah kısmı olarak tanımlandı ve örneğin siyah bir halka alanı tarafından çevrelenen beyaz daireyi kapsamadı.

Nesne sayma yordamı ile alan sayma yordamının birleştirilmesiyle, belirli bir değerden büyük alanlara sahip nesnelerin sayısını belirlemek amacıyla SEAC üzerindeki tarayıcıya bir resim beslemek mümkün oldu. Bu, kir lekelerinin değerlendirme dışı bırakılmasını sağladı. Programın basit bir değişikliğiyle, nesneler alanlarına göre sayılabilir ve sınıflara ayrılabilirdi.

SEAC Üzerinde Karmaşık Süreçlerin Benzetimi

Resim giriş ve çıkış olanağına sahip genel amaçlı bir bilgisayarın en güçlü özelliklerinden biri, resim işleme mekanizmalarının davranışlarını bir bilgisayar programıyla benzeterek performanslarını inceleyebilme yeteneğidir. Bu yolla mekanizmalar, bazı durumlarda laboratuvar koşullarında oluşturulması güç olabilecek şartlar altında test edilebilir.

Otomatik karakter algılama (baskı okuma) makineleri, resim işleme aygıtlarının özellikle önemli bir sınıfını oluşturur. Çeşitli mantıksal… üzerine bir çalışma başlatıldı.

Bir bilgisayar yordamı, bu çizimde gösterilen soyut şekillerin sayısını (dokuz) doğru biçimde saydı ve başka bir bilgisayar yordamı da, her bir şeklin alanını (her şeklin yanındaki sayıyla ifade edilen), kenarları çeyrek milimetre olan kareler cinsinden belirledi.

Mayıs 1958 tarihli COMPUTERS and AUTOMATION

Basılı karakterlerin tanınması için önerilmiş şemalar. Bir alfabenin her karakteri için benzersiz alanların belirlenmesine dayanan bir karakter tanıma mantığını incelemek üzere bir yordam yazıldı. Basılı karakterleri tanımaya yönelik böyle bir mantıksal prosedürde, her karakterin diğer hiçbir karakter için siyah olmayan, o karaktere özgü siyah olan belirli bölümleri vardır. Bu benzersiz alanlar karakterlerin tanımlanmasını sağlar.

SEAC için önerilen ve bu tanıma mantığını inceleyen yordam, farklı karakterlerin birkaç fotoğrafını karşılaştırdı ve görüntüleme matrisinin hangi bölümlerinin (1) ele alınan tüm harfler için siyah, (2) ele alınan tüm harfler için beyaz ya da (3) bazen siyah bazen beyaz olduğunu belirledi. Bu son alan, tüm görüntüleme çerçevesinin karakterleri tanımlamak için kullanılabilecek tek kısmıdır.

Artık farklı yazı tiplerindeki karakterler üzerinde çalışmalar yapılarak, farklı yazı tiplerini karakterize eden yararlı tanıma alanlarının yüzdesi belirlenebilir.

Bu yordamdaki bir eksiklik, analiz edilen karakterlerin doğrusal ötelemelerine karşı sonuçların çok duyarlı olmasıdır. Bu güçlüğü aşmak için, herhangi bir resmin ağırlık merkezini hesaplayan ve ardından ağırlık merkezini matriste istenen herhangi bir konuma, genellikle merkeze, taşımak üzere resmi kaydıran bir SEAC programı hazırlandı. Örtüşen alanlar yordamı, kaydırma yordamı ile yönlendirilmiş karakterleri incelemek için kullanılmaktadır.

Resimler Üzerinde Basit İşlemlerin Etkileri

SEAC için, 30.000 noktalı bir resimdeki her bir nokta üzerinde basit işlemler gerçekleştiren programlar kodlandı. Bu işlemlerin her birinde, bilgisayar bir nokta üzerinde nasıl işlem yapacağını belirlerken yalnızca o noktanın hemen yakın çevresini dikkate aldı. Bu tür basit yordamlar donanım biçiminde kolaylıkla mekanize edilebildiğinden, bu basit işlemlerin bir resim üzerinde önemli genel etkiler üretip üretemeyeceğini görmek için deneyler yapıldı.

İlk yordam, bir resme gürültü eklemek içindi. Rastgele ikili basamakların resimdeki herhangi bir noktanın yerine kullanılabilmesi için kodlandı. Gürültüden hangi noktaların etkileneceğini belirlemek üzere başka bir rastgele sayı üreten yordam kullanıldı. Bilgisayarın istenen herhangi bir gürültü dağılımını benzetebilme ve buna karşılık gelen fotoğraflar üretebilme yeteneği, gürültünün fotoğrafik bilginin tanınma kolaylığı üzerindeki etkilerinin oldukça ayrıntılı biçimde incelenmesini mümkün kılar.

Resimler üzerinde olağandışı sonuçlar üreten bir başka basit işlem, bir tür uzamsal türevlemedir. Bu işlemde bilgisayar her siyah noktayı inceler. Eğer sekiz siyah nokta tarafından tamamen çevriliyse, beyaz bir noktaya dönüştürülür. Diğer tüm durumlarda siyah bir nokta yazılır. Böyle bir işlemin etkisi, bir görüntünün sınırlarını korurken tüm iç alanı silmektir. Bu işlemden sonra bilgisayar resmin tüm basamaklarını tersine çevirir; yani siyahı beyaza ve beyazı siyaha dönüştürür. Bu, bir resmin sözde bir “custering” işlemidir. 50 kez custering uygulandıktan sonra bile, görüntünün bazı izleri hâlâ kalır. Ek denemeler ayrıca gürültülü şekillerin custering işlemi altında kararlı göründüğünü de göstermektedir.

Diğer Resim İşleme Yordamları

Bu yordamlara ek olarak başka bazı basit yordamlar da yazılmıştır. Bunlar arasında resimleri üst üste bindirme, resimleri öteleyip üst üste bindirerek yayma, ince ayrıntılarını görünür kılmak için resimleri büyütme, resimleri bant ve tel üzerinde kalıcı biçimde kaydetme ve bir dizi resmi analiz ederek resim kümesinde her zaman siyah ya da her zaman beyaz olan noktaların sayısını belirleme yordamlari yer alır.

Bu deneysel resim işleme yordamları, esas olarak, resim giriş ve çıkışına sahip SEAC gibi genel amaçlı bir olanakta gerçekleştirilebilecek resim işleme prosedürlerinin çeşitliliğini göstermeye hizmet eder.

Bu deneysel incelemelere ek olarak, pratik açıdan oldukça önemli bazı resim işleme işlemlerini göstermek üzere SEAC’in programlanabilirliğinin fizibilitesi üzerine çalışmalar yapılmıştır. Aşağıdaki durumların her birinde bu çalışmalar, açıklanan işlemi yapacak şekilde SEAC’in programlanabileceğini göstermiştir; ancak programların hiçbiri fiilen yazılmamıştır.

  1. Kimyasal ve elektriksel diyagramların otomatik kodlanması.
    Bilginin depolanması amacıyla diyagramların resimsel gösterimi çok verimsizdir. Örneğin, SEAC girişi olarak kullanılan boyuttaki bir resimde basit bir transistör osilatör şeması ya da fenol kimyasal bileşiği için bir yapı diyagramı temsil edilebilir. Ancak bu durumların her birinde yararlı bilgi yaklaşık 100 ya da 200 bitten (ikili basamak) fazla değildir; buna karşılık resimde 30.000 bit gereklidir. Dolayısıyla bir fotoğrafı kabul edip bilgisayar tarafından depolanmak üzere kodlanmış bir çıktı üreten bir makine prosedürü, bu durumda resmin depolanması için gereken kapasitenin yüzde yarımından daha az bir depolama gereksinimiyle sonuçlanacaktır.

  2. Basılı karakterlerin tanınması için mantıksal prosedürlerin benzetimi.
    Daha karmaşık tanıma şemaları programlanıp analiz edilseydi, benzetilmiş bir test, önerilen bir donanım parçasında köklü değişikliklere yol açabileceğinden, donanım yapım maliyetlerinde tasarruf sağlanabilirdi.

  3. Stereografik fotoğrafların fotogrametrik analizi.
    Buradaki amaç, fotoğrafik bilgiden eş yükselti haritaları üretmektir. Hatta foto yorumlamanın makineyle yapılmasının mümkün olabileceğine dair nedenler vardır. Bu, bir hava fotoğrafındaki nesneleri tanıyıp sınıflandıracak bir programın hazırlanmasını gerektirir; böylece bir harita üzerine kültürel bilgilerin bindirilmesi ya da çeşitli başka türde örtüşmelerin sağlanması mümkün olur. Burada karşılaşılan sorunların bazıları, “örüntü tanıma” olarak bilinmeye başlayan konunun sınırlarına dayanır ve bu alanda daha fazla araştırmaya hâlâ ihtiyaç vardır.

L harfinin bir dizi fotoğrafı, daktilo ile yazılmış L harfinin “custering” sürecine birçok kez tabi tutulduğunda türündeki değişimleri göstermektedir. Esasen bu süreç, bir görüntünün sınırlarını korurken iç alanı siler. Resim birçok kez custering uygulandıkça sol alt köşedeki bir kir zerresinin görünüşte nasıl büyüdüğüne dikkat ediniz.

Mayıs 1958 tarihli COMPUTERS and AUTOMATION

Daha fazla teknik bilgi için bkz. R. A. Kirsch, L. Cahn, L. C. Ray ve G. H. Urban tarafından yazılan “Experiments in processing pictorial information with a digital computer”, Proceedings of the Eastern Joint Computer Conference (IRE-AIEE-ACM), 1957.

Üzerine rastgele basamaklar bindirilmiş daktilo ile yazılmış P harfi 8 kez custering işlemine tabi tutulmuştur. Neredeyse hiçbir değişiklik olmadığına dikkat ediniz.