← Computers & Automation

The Photoscopic Language Translator

B
Bilinmeyen Yazar
computer_and_automation · Computers and Automation

Fotoskopik Dil Çevirmeni

Neil Macdonald
Yardımcı Editör, Computers and Automation

1. Genel

Mayıs ayında, New York eyaletinin Yorktown Heights kentindeki Mohansic Research Laboratory’de, International Business Machines Corporation, ABD Hava Kuvvetleri ile iş birliği içinde, Haziran 1959’dan bu yana Rus gazetesi Pravda’yı kaba fakat anlamlı bir İngilizceye çeviren bir makineyi ilk kez kamuoyuna açık olarak gösterdi.

Laboratuvardaki Rusça çeviri programı büyük ölçüde Hava Kuvvetleri’nin Air Research and Development Command birimiyle yapılan sözleşme kapsamında yürütülmüş, ancak IBM tarafından da desteklenmektedir. Şu ana kadar yaklaşık 55.000 sözcük kökünden oluşan bir Rusça sözlük derlenmiştir. Sözcük son ekleri de listelendiğinde, bu sayı metinlerde göründüğü şekliyle yaklaşık yarım milyon sözcüğe karşılık gelmektedir. Nihayetinde Rusça sözlük 400.000 kök içerebilir.

Makine, saniyede 30 sözcük hızında çeviri yapabilmektedir. Ancak şu anda çeviri, delikli kâğıt şerit girişinin ve elektrikli daktilo çıkışının hızıyla sınırlıdır. Delikli kâğıt şerit girişi, şu anda metindeki Rusça karakterleri kopyalayarak yazan bir daktilocu tarafından üretilmektedir; yazı yazılan makine, her karakter için ikili delik kodunu kâğıt şerit üzerinde üretmektedir.

Bununla birlikte, elektronik çeviri sisteminin kalbi, Computers and Automation’ın bu sayısının ön kapağında gösterilen fotoskopik disk belleği olarak adlandırılan dönen cam disktir. Yaklaşık 300.000 kodlanmış sözcük, her biri 0,00033 inç kenar uzunluğuna sahip siyah ve beyaz karelerden oluşan diziler halinde, yaklaşık 700 eşmerkezli iz üzerinde düzenlenmiştir. Bunlar Rusça karakterler ve noktalama işaretleri için ikili kodlanmış biçimlerdir. Keskin biçimde odaklanmış bir ışık demeti bu izler üzerinde hızla tarama yapar, doğru izi seçer ve Rusça giriş sözcüğünü o iz üzerindeki Rusça sözlük sözcüğüyle eşleştirir. Disk saniyede yaklaşık 23 kez döner. Eşleştirme 1/20 saniyeden daha kısa sürede yapılır. Karşılık gelen İngilizce sözcükler daha sonra hemen bir elektrikli daktilo tarafından yazdırılır. Makine herhangi bir anda söz varlığında bulunmayan bir sözcükle karşılaşırsa, bu sözcüğü daha sonra disk belleğine eklenmek üzere kırmızı renkte basar. Ayrıca, Rus alfabesinden bizim alfabemize transliterasyon yapılması gereken özel adları veya isimleri de kırmızı renkte basar.

Sonraki Aşamalar

IBM ayrıca basılı materyalin otomatik okunması konusunda kendi araştırmalarını sürdürmekte ve Cambridge, Mass.’ta bulunan Baird-Atomic Corporation’da bir geliştirme programını desteklemektedir. Bu yılın sonuna kadar, elektronik donanımın basılı materyali otomatik olarak okuyup tanıyacağı ve saniyede 40 sözcük hızında bilgisayara aktaracağı beklenmektedir.

Elektronik çevirmenin dilbilgisel kapasitesi hâlen üniversite düzeyinin oldukça altındadır; ancak şu anda geliştirilmekte olan bir sözcüksel tampon ve gelişmiş bir sözcük çözümleyici, bunu gelecek yıl iyileştirecektir.

Çözümleyici, tümce yapısının analizi için özel olarak tasarlanmış mantık devreleri içermekte olup, mevcut makineyle mümkün olandan daha akıcı bir Rusçadan İngilizceye çeviri sağlaması beklenmektedir.

Dil çevirmeninin yeni, katı hâl (solid-state), transistörlü bir sürümü olan Mark II, IBM Federal Systems Division’ın Kingston, New York’taki tesisinde üretilmektedir. Bu model, hâlen çalışmakta olan Mark I modeline kıyasla daha hızlı, son derece güvenilir ve çok daha kompakt olacaktır. Bu makinenin tek başına, ABD hükümetinin günümüzde bilinen tüm çeviri gereksinimlerini karşılayacağına inanılmaktadır.

Arka Plan

Günümüzde, dünyanın yabancı teknik literatürünün yüzde birinden daha azı İngilizceye çevrilmektedir. Bunun da yalnızca küçük bir bölümü, buna ihtiyaç duyan kişilere ulaşmaktadır.

Sovyetler Birliği’nde, Tüm Birlik Bilimsel ve Teknik Çeviri Enstitüsü’nde çalışan 2.600’den fazla tam zamanlı personelin yanı sıra 26.000 yarı zamanlı bilim insanı çevirmen, her yıl çevrilmiş kitap ve makalelerden yarım milyon özet yayımlamaktadır. Bunun bilimsel ve teknik ilerleme açısından sağladığı avantaj defalarca gösterilmiştir. Amerika Birleşik Devletleri’nin geleneksel çeviri yöntemlerini kullanarak buna yetişmesi olası değildir. IBM ve Hava Kuvvetleri’nin otomatik dil çevirisine duyulan gereksinimi hissetmelerinin nedeni budur.

Hava Kuvvetleri’nin makine çevirisine olan temel ilgisi Rusça teknik bilgi alanında olsa da, endüstri, bilim ve hükümetteki diğer alanların da sürekli değişen ve artan bilgi kütlelerini depolamak ve geri çağırmak için yeni yöntemlere acilen ihtiyaç duyduğu açıktır. Otomatik dil çevirisi, kanser araştırmaları, fizik, kimya, ekonomi ve uzay teknolojisi gibi son derece çeşitli alanlarda en güncel bilgilerin düzenlenmesi, bulunması ve yayılması yolunda atılan ilk adımlardan biridir. Yalnızca Rusya, bu alanlarda yılda birkaç milyar sözcük yayımlamaktadır.

Günümüzde yüzde birin onda birinden daha azı çevrilmektedir ve bunun Amerika Birleşik Devletleri Hükümeti’ne sözcük başına yaklaşık sekiz ila on sentlik bir maliyeti vardır. Elektronik çevirmen bu maliyeti bunun çok küçük bir bölümüne indirebilir. Ancak daha da önemlisi, çevrilebilecek durumda olan, fakat zaman ve para yetersizliği nedeniyle şu anda hiç ele alınmayan pek çok önemli Rusça makalenin bulunmasıdır.

Bu alandaki ilk çalışmalar Dr. Gilbert W. King tarafından International Telemeter Corporation’da gerçekleştirilmiştir. Buna ek olarak, Hava Kuvvetleri yüklenicileri arasında Cambridge University (İngiltere), Harvard University, University of Indiana, University of Milan (İtalya), New York University, Syracuse University ve University of Washington’ın yanı sıra Baird-Atomic Corporation, Intelligent Machines Research Corp. (şu anda Farrington Mfg. Co.’nun bir parçasıdır), Thompson Ramo-Wooldridge ve International Business Machines Corporation yer almıştır.

Fransızcadan İngilizceye Makine Çevirisi

Aynı zamanda IBM, şirketin kendi bünyesinde yürüttüğü Fransızca makine çevirisi programında da ilerleme kaydedildiğini bildirmiştir. Bu programda, yaklaşık 23.000 Fransızca sözcük ve bunların İngilizce karşılıklarından oluşan bir sözlük, matematiksel makalelerin kaba çevirilerini üretmek için hâlihazırda kullanılmaktadır. Bu makine çevirmeninin söz varlığı, matematik dışı konuların da çevrilmesine olanak tanıyacak şekilde kısa süre içinde artırılacaktır.

Mevcut makine çevirisinin kalitesi, Rusçadan İngilizceye yapılan makine çevirisinin güncel kalitesine benzer olup, aşağıdaki örnekte gösterilmektedir. Örnek, A bölümünde Fransızca bir pasajdan ve B bölümünde bunun İngilizce çevirisinden oluşmaktadır.

A

MATEMATİKSEL MANTIĞIN TANIMI. Bu dersin konusu olan cebirsel mantık, burada matematiksel mantığın en temel bölümü olarak ele alınmaktadır. Daha sonra "cebirsel" sözcüğüyle neyi kastettiğimizi açıklığa kavuşturacağız. Ancak, cebirsel mantığın ilk bölümünü oluşturduğu matematiksel mantığın ne olduğu hemen belirtilmelidir.

Bu amaçla, "mantık" sözcüğünün hemen hemen tüm dillerde üç farklı anlamı olduğunu hatırlayalım.

B

(OF) MATEMATİKSEL MANTIĞIN TANIMI

Bu dersin konusu olan cebirsel mantık, burada matematiksel mantığın en temel parçası olarak düşünülmektedir. Daha sonra "cebirsel" sözcüğüyle neyi işaret ettiğimizi açıklayacağız. Ancak, cebirsel mantığın ilk bölümünü oluşturduğu matematiksel mantığın nelerden oluştuğunu derhal belirtmek gerekir.

Bu niyetle, "mantık" sözcüğünün hemen hemen tüm dillerde üç farklı anlama sahip olduğunu hatırlayalım.

II. Bazı Teknik Ayrıntılar

Otomatik bir sözlük gibi çalışan fotoskopik disk, bir katot ışınlı tüp ışık kaynağı, hareketli bir mercek, bir fotokatot çoğaltıcı tüp ve bazı elektronik devreler (rakam algılayıcı) aracılığıyla okunur. Disk donanımına ek olarak, sistemin temel bölümleri arasında, giriş Rusça metnin yazılması için kullanılan giriş Flexowriter’ı, disk üzerinde uygun sözlük girdisi aranırken giriş metnini tutan giriş yazmacı ve çeviriyi yazdıran çıkış Flexowriter’ı yer alır.

Giriş

Girişteki Rusça karakterlerin her biri, giriş bandındaki delikler biçiminde kodlanır. Bant, bant okuyucudan geçtikten sonra bilgi, karakter başına altı adet olacak şekilde "birler" ve "sıfırlar" halinde kodlanır ve giriş yazmacına yerleştirilir.

Karşılaştırma

Bu karakterler daha sonra, merceğin ve katot ışınlı tüp demetinin hangi yönde hareket ettirileceğini belirlemek amacıyla sözlükten okunmakta olan bilgilerle karşılaştırılır. Işık demeti, karşılaştırıcı çok ileri gidildiğini gösterene kadar izler boyunca adım adım ilerleyerek her birinin küçük bir bölümünü okur. Ardından ışık demeti durdurulur ve diskin dönüşü (saniyede 23 devir) belirli bir iz üzerindeki her girdinin okunmasını sağlar. Bu durum, mümkün olan en uzun eşleşmeyi elde etmek için basılı bir sözlüğün bir sayfasındaki girdileri aşağıdan yukarıya doğru okumamıza yaklaşık olarak karşılık gelir (örneğin, "time"dan önce "time constant"). Rusça bir anlamsal birimle uygun bir eşleşme bulunduğunda, karşılık gelen İngilizce anlam, yüksek hızlı yazmaç üzerinden çıkış Flexowriter’ına aktarılır. Aynı zamanda, "dağıtıcı" tarafından gösterilen mantıksal devreler, eşleşme bulunan giriş karakterlerinin sayısını kaydetmiştir. Bu, az önce çevrilen giriş karakterlerinin atılmasını ve yeni giriş karakterlerinin giriş yazmacına kaydırılmasını mümkün kılar.

Çıkış

Bir çıkış tamponu, yazdırma işleminden önce tüm çıkış karakterlerinin toplandığı yerdir. Her seferinde bir karakter tutar ve içeriğin niteliğine bağlı olarak çeşitli kaynaklardan alım yapar. Hiçbir çevirinin gerekmediği durumlarda, örneğin Latin karakterleri, noktalama işaretleri ve sayılar için, karakterler doğrudan giriş yazmacından gelir. Rusça sözcük girdileri söz konusu olduğunda, İngilizce anlamlar disk bellek donanımından çıkış tamponuna gelir. Özel adlar gibi Latin karakterlerine çevrilmesi gereken Rusça girdilerde ise, giriş yazmacından doğrudan aktarım engellenir; böylece kontrol devreleri, dönüştürme ekleme donanımının gerekli değişiklikleri yapmasına olanak tanır. Bir Rusça giriş sözcüğü çevrilmesi gerektiği halde otomatik sözlükte bulunamazsa, o da Latin harflerine dönüştürülür. Her iki dönüştürme durumunda da, çıkış daktilosunun şerit rengi kırmızıya çevrilir. Bu özellik, kullanıcının sözlüğün bir sonraki baskısında hangi eklemelerin gerekli olduğunu bir bakışta fark etmesini sağlar.

Işık Kaynağı

Bir katot ışınlı tüp, ışık kaynağı olarak kullanılır; çünkü bir elektron demeti diğer tüm kaynaklardan daha hızlı hareket ettirilebilir. Işığın bir disk izinden diğerine taşınması gerektiğinde, bu değişim sapma akımı aracılığıyla son derece hızlı bir şekilde yapılır. Daha yüksek atalete sahip olan mercek motoru daha yavaş hareket eder ve katot ışınlı tüp elektron demetinin tüp yüzeyinin merkezine geri dönmesini sağlar. Böylece katot ışınlı tüp demeti düşük erişim süresini (ortalama 35 milisaniye) mümkün kılarken, mercek motoru elektron demetinin tüpün kenarına doğru aşırı gitmesini önler.

Hız

Bu çeviri sisteminin hızı, Rusça teknik literatürü, üretildiği hızla yaklaşık olarak eşdeğer bir ortalama hızda (günümüzde saniyede 30 sözcük) çevirmek için yeterlidir; ancak giriş ve çıkış Flexowriter’larının görece yavaş hızı, sistemin hızını önemli ölçüde daha düşük bir düzeye sınırlar. Gelecekte, otomatik sayfa tarayıcılarının ve karakter algılamanın kullanılmasıyla giriş hızı sınırlamasının ortadan kaldırılması beklenmektedir. Çıkış hızı sınırlaması ise yüksek hızlı yazıcılar kullanılarak ve birden fazla çıkış biriminin çoklanması yoluyla giderilebilir.

Bellek

On inçlik cam disk, 0,36 inç genişliğinde bir halka üzerinde 700 iz boyunca 30 milyon bit bilgi içerir. Hızlı erişim sağlamak amacıyla halkanın genişliği mümkün olduğunca küçük tutulmuştur. Kodlanmış sözlük girdileri, kenar uzunluğu yaklaşık üçte bir mil (0,00033 inç) olan açık ve siyah kareler halinde temsil edilir. Bu işaretler, katot ışınlı tüpten fotokatot çoğaltıcıya giden yol üzerindeki ışık demetini keserek bir sıfırı birden ayırt eder. Erişim süresi açısından bu işaretler küçük tutulduğundan, katot ışınlı tüp yüzeyindeki ışık kaynağı da küçük tutulmuştur. Bununla birlikte oldukça yoğundur (1600 kandela). Elektron demetinin, tek bir noktanın yakınında tutulduğunda herhangi bir katot ışınlı tüpte olduğu gibi tüp yüzeyindeki fosforu yakmasını önlemek için, demet, izler arasında adımlama için gerekli harekete ek olarak yaklaşık iki inç çapında bir çember çizecek şekilde hareket ettirilir. Bu hareket, mercekteki bir titreşimle dengelenir; böylece diskin izleri üzerindeki konumlandırma etkilenmez.

Adresler

Disk üzerindeki sözlük girdileri, Rusça sözcüklerin ve deyimlerin kendilerinin girdinin adresini oluşturacağı şekilde düzenlenmiştir. Rusça sözcükteki her karakterin, bir ağırlık olarak yorumlanabilen belirli bir ikili kodu vardır. Kiril "e" en düşük ağırlığa, Kiril "B" ise en yüksek ağırlığa sahiptir. Dolayısıyla her kodlanmış Rusça sözcük uzun bir ikili sayı gibi görünür. Disk üzerindeki düzen sayısal sıraya göredir; bu, alfabetik sıradan farklıdır ancak alfabetik sıraya bir tür benzerlik gösterir. Disk iz iz taranırken, Rusça sözcükteki her bit (bir veya sıfır), giriş yazmacındaki karşılık gelen bit ile karşılaştırılır (burada giriş yazmacı bir bellek adres yazmacı gibi davranır).

Bu karşılaştırma, bir uyuşmazlık bulunana kadar sürdürülür. Bu noktada, diskteki bir sıfır ve giriş yazmacındaki bir bir, bir sonraki ize "ileri git" anlamına gelir. Ters birleşim ise "geri dön" anlamındadır. Doğru girdinin geçildiği anlaşıldığında, belirli bir iz saniyede bir milyon bit hızında ayrıntılı olarak taranır. Sözlük girdisindeki Rusça sözcüğün sonunu belirten sembole ulaşılıncaya kadar her bir ve her sıfır giriş yazmacındaki karşılıklarıyla tam olarak eşleştiğinde, kesin eşleşme bulunmuş olur.

Arama elektroniği, yüksek hızlı vakum tüplü devrelerin transistörlü devrelere dönüştürülmesiyle kolaylıkla daha küçük boyutlara indirgenebilir.

Sözlüğün tasarımında fotoğrafik teknikler kullanılmıştır; çünkü fotoğrafik emülsiyonlar günümüzde bilinen en yoğun depolama ortamlarıdır. Bu depolama kalıcı olmakla birlikte, yeni disklerin hızlı bir şekilde hazırlanabilmesini sağlayan donanımların tasarımına büyük emek harcanmıştır; bu da sözlükteki girdi listesinin sık sık güncellenmesine olanak tanır.

Ezberlenmiş Sözlüğün Hazırlanması

Disk belleğin hazırlanmasına yönelik sistem, sözlüğe yerleştirilecek girdileri içeren bir belgeyle başlar. Bu girdiler kartlara anahtarlama yoluyla delinerek aktarılır. Kartlar hazırlandıktan sonra, bir IBM 704 bilgisayarı, basit sıralama işlemleriyle yeni kartları eskilerle birleştirir ve girdilerin tam listesini manyetik bant üzerine yerleştirir.

704 sıralama programı ayrıca, sözlük girdilerinin herhangi bir rastgele karışımını uygun sayısal sıraya koyar. Özel olarak tasarlanmış donanım, manyetik bandın, girdileri 70 mm’lik film ruloları üzerine fotoğrafik olarak kodlayan bir film yapım makinesine giriş olmasını sağlar. Diskin yapılmasından önce ara adım olarak filmin kullanılması, başlangıçtaki mühendislik sorunlarını (örneğin zamanlama gibi) önemli ölçüde azaltmış ve çalışan bir sistemin kurulmasında daha hızlı ilerleme sağlamıştır.

Film yapımı fotoğrafik bir süreç olduğundan (manyetik banttan gelen kodlanmış ikili bilgilere göre bir katot ışınlı tüp ışık kaynağı açılıp kapatılırken film makineden geçirilir), pozlamayı fotoğrafik banyo işlemi izlemelidir. Günümüzde standart bir Hava Kuvvetleri fotoğraf işlemcisi kullanılmakla birlikte, gelecekteki sistemler için bazı iyileştirmeler gerekli görünmektedir. Bu amaçla, işlemi otomatik hale getiren özel bir film işlemcisi üzerine araştırmalar yürütülmektedir.

Film üzerindeki bilgiler, Disk Yapım Birimi aracılığıyla diske kaydedilir. Burada da, filmden geçen ışığı diskin emülsiyonuna yönlendirmek için bir ayna ve mercek sistemiyle birlikte bir katot ışınlı tüp ışık kaynağı kullanılır. Hassas odaklama için bir servo sistemi kullanılır. Disk, pozlama sırasında dakikada bir devir hızında döndürülür; hız ve zamanlamayı dar toleranslar içinde tutmak için tasarımda özel önlemler alınmıştır. Bu süreçte, bilginin fotoğrafik noktalarının boyutu yaklaşık 55 kat küçültülür.

Disk yapım makinesi bilgiyi kaydettikten sonra diskin fotoğrafik işlenmesi, bilgi bitlerinin son derece küçük boyutu (0,00033 inç kare) nedeniyle, banyo ve sabitleme sıvılarındaki yabancı parçacıklara karşı son derece hassastır. Ticari olarak temin edilebilen çözeltiler, ince bir şekilde filtrelenene kadar tamamen işe yaramaz. Bu sorunun üstesinden gelmek için özel bir disk işlemcisi tasarlanmıştır. Bu aygıt, kullanılan sıvı miktarını en aza indirir ve sıvı emülsiyon yüzeyine temas etmeden hemen önce filtreler.

Disk yükleme sisteminin tasarımında gösterilen büyük özenin bir sonucu olarak, istenirse yaklaşık günlük aralıklarla yeni sözlükler hazırlanabilir. Bu hız, dil çevirisinin gereksinimlerini fazlasıyla karşılamaktadır. Bununla birlikte, depolamanın daha hızlı güncellenmesi gerekirse, tambur gibi küçük, silinebilir bir bellek kolaylıkla eklenebilir. Bu sistemde, giriş adresi büyük kapasiteli fotoğrafik bellek ile küçük kapasiteli silinebilir bellek üzerinde eşzamanlı aramaları başlatacaktır. Çoğu durumda bilgi yalnızca fotoğrafik bellekte bulunacaktır. Her iki bellekte de bir eşleşme bulunduğunda, "mantıksal seçim" donanımı, bilgisi en güncel olan silinebilir belleğin okunmasını belirleyecektir.