Bir Bilgisayar Tarafından Doğal Dilin İşlenmesi, Bölüm II

Bertram Raphael
Stanford Research Institute
Menlo Park, CA 94025

“Bilim insanları, doğrudan çözmeleri için çok zor olan bir sorunla karşılaştıklarında, genellikle önce üzerinde çalışmak için sorunun daha basit sürümlerini ya da özel durumlarını ararlar.”

Doğal ve Yapay Diller

İnsanın iletişim kurmak için dili kullanmasının onu diğer hayvanlardan ayırdığı söylenmiştir. Elbette bu iddia büyük bir aşırı basitleştirmedir. Hayvanlar âleminin pek çok düzeyinde bir tür dil kullanılmaktadır. Orman, tehlike ya da istek mesajlarını ileten sesler ve hareketlerle doludur. Yunusların sesli iletişim için ayrıntılı bir sisteme sahip olduğu görülmektedir ve arıların dans hareketleri, besin kaynaklarının uzaklığını ve yönünü şaşırtıcı bir doğrulukla betimleyebilmektedir. Yine de tüm insan kültürleri, konuşma dilini yalnızca temel bedensel gereksinimlerin karşılanmasına yardımcı olmak için kullanmaktan çok daha fazlası için kullanır. Sözlü ve yazılı sözcük; karmaşık durumları betimlemenin, soyut fikirler geliştirmenin, birçok insanın ayrı ayrı sahip olduğu bilgileri ortaklaşa geliştirilmiş kavramlar hâlinde birleştirmenin ve gelişen bir toplumda bilgiyi bir kuşaktan diğerine biriktirip aktarmanın temelidir.

Dil Bilgisi

Kuşaktan kuşağa aktarılan bilginin bir parçası olarak dil bilgisi de yer alır. Babil zamanından bu yana binlerce dil, kendi kabileleri ya da ulusları içinde ebeveynlerden çocuklara aktarılmıştır. Yaklaşık bin yıl önce Kutsal Roma İmparatoru II. Friedrich, dilin insanlara özgü, doğuştan gelen (ya da içgüdüsel) bir yetenek olduğunu düşünüyordu. Kuramını sınamak için, bir grup yeni doğmuş bebeği ebeveynlerinden ayırdı ve toplumun geri kalanından yalıtılmış olarak yetiştirdi. Deneyi bozmasınlar diye, dadılarının bile çocukların yanında konuşmasına izin verilmedi. Amaç, çocukların kendiliğinden konuşmaya başlayacakları “yerleşik” dili gözlemlemekti: yerel toplumlarının dili mi, Latince mi, İbranice mi, yoksa başka bir eski “kaynak” dil mi? Ne yazık ki deney başarısız oldu; eminim hayal edebileceğiniz çeşitli nedenlerle çocukların hiçbiri birkaç yıldan fazla yaşayamadı ve hiçbiri konuşmaya başlamadı.

Gözlemlenebilir Diller

Bir insan toplumunun günlük işlerinde başlıca iletişim aracı olarak kullanılmış olan dillere doğal diller denir. (Dünyanın herhangi bir yerinde hâlâ kullanımda olan bu doğal dillere yaşayan diller denir.) Bu diller, doğal biyolojik türler ya da maddenin fiziksel bileşenleri gibi, var olan ve gözlemlenebilir varlıklar olmaları anlamında doğaldır. Bilim insanları onları inceleyip betimleyebilir, ancak keyfi olarak değişmeye zorlayamazlar. Yaşayan diller, tıpkı biyolojik türlerin değişmesi gibi, evrim süreciyle değişir; her kuşakta birçok küçük değişiklik ortaya çıkar ve bunlardan birkaçı—bir anlamda dilin etkililiğini artıranlar—kalıcı özellikler hâline gelerek varlığını sürdürür. Dolayısıyla, bu tür evrimin birçok yüzyılını yaşamış olan çoğu doğal dilin, son derece pratik ve verimli iletişim ortamları olmasını bekleyebiliriz.

Bertram Raphael’in The Thinking Computer: Mind Inside Matter adlı eserinin 6. Bölümü olan “Natural Language”dan alınmıştır; W. H. Freeman and Co. tarafından, San Francisco, Calif., 1976 telifli olarak yayımlanmış ve izinle yeniden basılmıştır.

Yapay Diller

Yapay diller, belirli iletişim türleri için insanlar tarafından geliştirilmiş dillerdir. Müzik notasyonu, bir bestecinin ya da aranjörün tasarımlarını müzisyenlere aktardığı bir yapay dildir. Önerme hesabı, matematiğin özel alanları için kullanılan birçok yapay dilden biridir. Ve elbette FORTRAN, ALGOL, LISP ve benzerleri, bilgisayarların programlanmasını basitleştirmek üzere özel olarak tasarlanmış yapay dillerdir.

Bilgisayar kullanıcıları neden doğal dille ilgilenmelidir? Özel olarak geliştirilmiş bilgisayar dilleri, bilgisayarlarla iletişim kurmak için çok daha uygun görünmektedir. Tam da yapay dil olmaları nedeniyle, kullanıcılar belirli bir programlama görev sınıfını kolaylaştırmak için istedikleri yeni özellikleri düşündüklerinde, tasarımcılarının isteğine göre değiştirilebilir ya da genişletilebilirler. Doğal dillere bu şekilde müdahale edilemez. Ayrıca, bilim insanları henüz herhangi bir doğal dilin karmaşıklıklarını bütünüyle anlamış değildir; bu nedenle doğal diller için derleyicilerin ya da onların diğer doğrudan bilgisayar uygulamalarının nasıl yazılacağını da bilmemektedirler.

Bilgisayarlara Doğal Dil Öğretmek

Öte yandan, bu kitap bilgisayarları daha akıllı ve daha kullanışlı hâle getirmeye ve bilgisayarların önümüzdeki yirmi yıl içinde, daha ucuz ve daha erişilebilir hâle geldikçe, yakın zamana kadar oynadıkları son derece sınırlı ve uzmanlaşmış rollerden ziyade hangi rolleri üstleneceklerine ilişkindir. Geçmişte bilgisayarlar, çoğunlukla mühendislik, fizik, bankacılık gibi az sayıda uzmanlık alanındaki uzmanlar tarafından, genellikle yüksek düzeyde eğitimli bilgisayar uzmanlarından oluşan ekiplerin yardımıyla kullanılıyordu. Şimdi ise bilgisayarların daktilolar ya da telefonlar kadar kolay erişilebilir olacağı bir döneme geçiş sürecindeyiz; potansiyel kullanıcılar, doktorlar, avukatlar, okul çocukları, ev hanımları gibi hayatın her kesiminden insanlar olacak ve önemli bir hesaplama gücüne doğrudan erişimleri bulunacak. Bunu nasıl kullanacaklar? Okuma ve aritmetik gibi temel becerilerin yanında, her eğitimli kişi bilgisayar programlamayı da temel bir beceri olarak mı öğrenecek? Belki; ancak bu ek becerinin edinilmesi yükü, insanların bu yeni kaynağın sunduğu olanaklardan tam anlamıyla yararlanmalarını kesinlikle zorlaştıracaktır. İnsanlara bilgisayar dillerini öğretmek yerine, belki de daha tercih edilebilir bir yaklaşım, doğal dilleri bilgisayarlara öğretmek olurdu; böylece insanlar, kendilerine zaten tanıdık olan ortak bir dilde, bilgisayarlarla diğer insanlarla iletişim kurdukları kadar kolay iletişim kurabilirlerdi.

Bu makale, bilgisayarlara doğal dili anlamayı öğretme sürecinde karşılaşılan sorunları ve kaydedilen ilerlemeyi ele almaktadır.

Sözdizim

Hem doğal hem de yapay dillerin incelenmesi, geleneksel olarak iki ana alana ayrılmıştır: sözdizim ve anlambilim. Sözdizim, dilin cümlelerini oluşturan sembol dizilerinin, anlamları dikkate alınmaksızın, biçimsel yapısıyla ilgilenir.

Dilbilgisi

Dilin temel sembolleri, dilin dilbilgisi olarak adlandırılan bir dizi kuralın belirlediği biçimde, yalnızca belirli şekillerde birleştirilebilir. Sözdizimsel çözümlemenin temel görevi, hangi sembol dizilerinin dilbilgisel olduğunu, yani dile meşru biçimde ait olduğunu, hangilerinin ise olmadığını belirlemektir. Bir müzisyen yalnızca dilbilgisel müzik çalabilir; bir bilgisayar yalnızca dilbilgisel FORTRAN derleyebilir. Şekil 1, iyi bilinen yapay dillerden dilbilgisel ve dilbilgisel olmayan örneklere bazı örnekler göstermektedir.

Dilbilgisel

Müzik
r r r a J I J r r

Mantık
(∀x)(∀y)(∀z)[P(x,y) ∧ P(y,z) ⊃ P(x,z)]

FORTRAN

DO 10 I = 1, 100
DO 20 J = 1, 100
20 A(I,J) = 0
10 B(I) = 0

Dilbilgisel Olmayan

Müzik
— — —

Mantık
P(∀]]x ∧ ⊃ (z)y

FORTRAN

DO
10 I = 1
= 100
DO
20 I,100 = J
10 A(I,J) = 0
20 B(A)
= 0

Şekil 1: Dilbilgisel ve dilbilgisel olmayan örnek biçimsel dil parçaları.

Anlambilim

Anlambilim, dilin sembollerinin ve dilbilgisel sembol dizilerinin anlamlarını ifade eder. Bir müzik notasının anlambilimi, tonlardan, sürelerden ve ses niteliklerinden oluşur; bir bilgisayar programının anlambilimi ise bir bilgisayarın yazmaçlarında gerçekleşen aritmetik ve simgesel işlemlerden oluşur. Dilbilgisel olmayan ifadelerin nadiren anlamsal yorumları olduğundan, biçimsel dilleri genellikle iki ardışık aşamada inceleriz.

Önce, sözdizimsel çözümleme ifadenin dilbilgisel olup olmadığını belirler; ardından, eğer dilbilgiselse, anlamsal çözümleme ne anlama geldiğini belirler. (Bilgisayar dili örneğinde bu ayrım özellikle açıktır: bir derleyici neredeyse bütünüyle sözdizimsel bir biçimde çalışır ve ancak “çalışma zamanında”, derlemenin sonuçları yürütüldüğünde, anlambilim ortaya çıkar.)

1950’lere kadar çoğu dilbilimci, doğal dilin ayrı ve ardışık aşamalarda çözümlenebileceğini düşünüyordu: önce sözdizimsel, sonra anlamsal. Doğal dilin açıkça sözdizimsel olan özellikleri ve açıkça anlamsal olan özellikleri vardır. Belirli sözdizimsel dönüşümlerin, tıpkı bir müzik notasının temsil ettiği sesleri değiştirmeden belirli şekillerde değiştirilebilmesi gibi, anlamı etkilemeden doğal dile uygulanabileceğine inanılıyordu. Bu inanç, 1950’ler boyunca bilgisayarların metni bir dilden başka bir dile çevirmesi için yapılan büyük çaplı çabaların temelini oluşturdu. Önce, tek tek sözcüklerin çevirilerinin kolayca bulunabilmesi için büyük sözlükler bilgisayar bantlarına yüklendi. Ardından, sözcük dizilişi, ad durumları ve fiil zamanları gibi bariz sözdizimsel özelliklerin diller arasında gösterdiği farklılıkları açıklamak için ayrıntılı dilbilgileri geliştirildi. Bilgisayar bilimcileriyle birlikte çalışan dilbilimciler, programları diller arasındaki sözdizimsel farklılıkların yeterince çoğunu yakalayabilirse, çevrilen cümlelerin anlamlarının bozulmadan aktarılacağını umuyordu. Ne yazık ki bu deneyler feci biçimde başarısız oldu; ortaya çıkan çeviriler, özgün metinden her türden tuhaf ve beklenmedik biçimde farklı anlamlar taşıyordu. Örneğin, İncil’den alınan “The spirit is willing but the flesh is weak” alıntısı İngilizceden Rusçaya, ardından yeniden İngilizceye çevrildiğinde, bilgisayardan çıkan sonuç şuydu: “The wine is agreeable but the meat has spoiled.”

Bulanık Sınırlar

Bu erken dönem mekanik çeviri çabalarından çıkarılan ders, doğal dilde sözdizim ile anlambilim arasındaki sınırın son derece bulanık olduğudur. Anlambilimle de ilgilenmeden, doğal dilin yapısal özelliklerini betimleyebilecek herhangi bir dilbilgisi kuralı sistemi ne keşfedilmiştir ne de artık keşfedilmesi olası görünmektedir. Sözcüklerin hangi biçimsel yollarla bir araya getirilebileceği ile bu dizilerin anlamları, incelikli ve karmaşık biçimlerde birbiriyle ilişkili görünmektedir.

Bazı İngilizce cümleler açıkça hem dilbilgisel hem de anlamlıdır: “John gave the carrot to Mary,” ve bazıları ise o kadar açık biçimde dilbilgisel değildir ki anlamsızdır: “To gave Mary John carrot the.” Ancak, ifadeler açıkça dilbilgisel olmamasına rağmen anlamları bütünüyle açık olan İngilizce ifadeler de oluşturabiliriz: “I ain’t never been there,” “Me, Tarzan; you, Jane,” “Them’s them,” ve buna karşılık, bütünüyle dilbilgisel oldukları izlenimini vermelerine rağmen tamamen anlamsız olan ifadeler de vardır: “’Twas brillig, and the slithy toves did gyre and gimble in the wabe,” “Colorless green ideas dream furiously.” Gerçekte, doğal dilin dilbilgisi (sözdizimi) ile anlamı (anlambilimi), neredeyse temel tanımlardan itibaren, ayrılmaz biçimde iç içe geçmiştir.

Matematikçinin Dilbilgisi ile Dilbilimcinin Dilbilgisi

Dilbilimci—dilin doğasını inceleyen bilim insanı—bir dilin dilbilgisini, hangi cümlelerin dile ait olduğunu ve hangilerinin olmadığını belirleyen bir kurallar bütünü olarak tanımlama konusunda matematikçiyle hemfikir olacaktır.

Ancak, yapay dillerle ilgilenen matematikçi, dili dilbilgisiyle tanımlamakla yetinir; belirli bir cümle, ancak ve ancak dilbilgisi buna izin veriyorsa, belirli bir yapay dilin parçasıdır. Buna karşılık dilbilimci, var olan bir doğal dille karşı karşıyadır. Onun kurduğu dilbilgileri, dilin gerçek ama biçimselleştirilmemiş dilbilgisine yalnızca yaklaşık betimlemelerdir. Belirli bir cümlenin belirli bir doğal dilin parçası olup olmadığını sınamanın nihai yolu, o dilin ana dili konuşurlarına sormaktır; ve onlar genellikle, bir cümlenin yalnızca kendileri için anlamlıysa dilbilgisel olduğunu söyleyeceklerdir. Dolayısıyla, doğal bir dilin yaklaşık bir betimi olarak kurulan herhangi bir dilbilgisi, yalnızca yapısal olarak bozuk olan cümlelerle izin verilebilir cümleleri değil, aynı zamanda anlamlı olanlarla anlamsız olanları da ayırmaya çalışmalıdır.

Bir sonraki bölümde, doğal dil cümlelerinin yapı ve anlamını betimlemek üzere önerilmiş olan dilbilgisi türlerini daha ayrıntılı olarak inceleyeceğiz; onu izleyen bölümde ise, doğal dilin bazı yönlerini “anlayacak” biçimde programlanmış bilgisayar sistemlerine örnekler sunacağım.

Doğal Dilin Biçimsel Gösterimleri

Doğal ya da yapay bir dil için dilbilgisinin en basit biçimi, izin verilen tüm cümlelerin bir listesidir. Böyle bir listemiz olsaydı, aday bir cümlenin dilbilgisinin tanımladığı dilde olup olmadığını, yalnızca listede cümlenin yer alıp almadığına bakarak anlayabilirdik. Ne yazık ki, ilginç diller genellikle o kadar çok cümle içerir ki, bunların tümünün bir listesini yapmak mümkün değildir. Bunun yerine, muhtemelen sonsuz bile olabilecek bu çok büyük cümle kümesinin özet bir betimini oluşturan bir formül ya da bir kurallar kümesi gibi, kısa ve öz bir ifadeye ihtiyaç duyarız.

Öbek-Yapı Dilbilgileri

Bir öbek-yapı dilbilgisi, küçük bir kural kümesiyle sonsuz sayıda cümleyi temsil etmenin en yaygın yoludur. Bu tür bir dilbilgisinde her kural, bir sembol, bir ok ve bir sembol dizisinden oluşur ve okun sağındaki sembol dizisinin, okun solundaki sembolün yerine geçirilebileceği anlamına gelir. Terminal semboller olarak adlandırılan bazı semboller, hiçbir zaman herhangi bir okun solunda yer almaz.

G dilbilgisi, “John gave the carrot to Mary.” cümlesinde yalnızca altı sözcük içeren bir L dilini tanımlar. L başka hangi cümleleri içerir? Türetimde 9 ve 10 numaralı kuralların kullanımını basitçe yer değiştirerek, L’nin “Mary gave the carrot to John,” cümlesini de içerdiğini görürüz; bu da makul bir İngilizce cümledir. Ancak kuralları farklı şekillerde uygulayarak, L’nin “John gave John,” “The Mary gave John to the carrot,” “Carrot gave the Mary to carrot” ve benzerleri dâhil olmak üzere çeşitli başka “cümleler” de içerdiğini gösterebiliriz.

Açıkça görülmektedir ki L dili İngilizceden çok farklıdır. Ancak, bu farklılıkları yeterince kesin biçimde tanımlayabilirsek, belki G’yi değiştirmenin, kurallarını ekleyerek ya da değiştirerek, G’nin kabul ettiği L dilinden İngilizceye L’den daha yakın olacak yeni bir G' öbek-yapı dilbilgisi üretmenin yollarını bulabiliriz. Bu işlemi L' ile, ve böyle devam ederek tekrarlarsak, İngilizce için giderek daha iyi öbek-yapı dilbilgisi sürümleri elde edebiliriz.

1950’lerde bilim insanları şu soruyu sordular:

"Böyle bir yöntem, mekanik çeviri gibi pratik amaçlar için yararlı olacak kadar sıradan İngilizceye yakın bir dili kabul eden bir öbek-yapı dilbilgisi üretebilir mi?"

Bu hedef, kısmen öbek-yapı dilbilgilerinin, bilgisayar programlama dilleri gibi oldukça karmaşık yapay dilleri kesinlikle betimleyebilecek kadar güçlü olduklarının bilinmesi nedeniyle mümkün görülüyordu. Bu hedef aynı zamanda arzu edilir bulunuyordu; çünkü öbek-yapı dilbilgilerinin biçimsel özellikleri iyi anlaşılmıştı. Özellikle, tartışmamız bir dilbilgisinin kabul edilebilir rastgele cümleler üretmek için nasıl kullanılacağını açıklamış olsa da (bir S cümlesiyle başlayıp ardışık ikameler yaparak), dilbilgisini ters yönde çalıştırmak için de etkili yöntemler vardır: yani herhangi bir cümleyle başlayıp onun yapısal betimini üretmek (ya da cümlenin dilbilgisel olmadığını kanıtlamak). Bir dilbilgisinin bu özelliği, pratik uygulamalar için son derece önemlidir; ancak daha karmaşık dilbilgisi türlerinde her zaman mevcut değildir.

Öbek-yapı dilbilgilerinin (ve onları kullanan programların) pratikliği, ad ve fiil gibi, rolleri dilbilgisi kurallarıyla özetlenebilen geniş genel sözcük kategorilerinin varlığına bağlıdır. Doğal dili yakından incelediğimizde bu tür kategorilerin son derece yetersiz göründüğü için, bilgisayar işlemesi açısından doğal dili betimlemenin tek yolu olarak öbek-yapı dilbilgileri genel olarak terk edilmiştir.

Belirsizlik

Bir dilbilgisinde (öbek-yapı ya da benzer nitelikte) yapılan hemen her değişiklik, ister kapsamını genişletmek (İngilizcenin daha fazlasını kabul etmek) ister alanını daraltmak (daha fazla anlamsız ifadeyi dışlamak) amacıyla olsun, dilbilgisi kurallarının sayısında bir artış gerektirir. Yeni kurallar, daha önce oluşturulmuş kurallarla çoğu zaman beklenmedik biçimlerde etkileşime girer. Bu tür etkileşimlerin bir sonucu olarak, karmaşık dilbilgileri aynı cümleyi kabul etmenin birkaç farklı yoluna sıklıkla sahiptir; yani tek bir cümlenin birkaç farklı yapısal betimi olabilir. Bu durumda, cümlenin dilbilgisine göre belirsiz olduğu söylenir; her bir yapısal betimleme genellikle cümlenin olası farklı bir anlamına karşılık gelir.

İngilizce için bir bilgisayarda uygulanmış en ayrıntılı öbek-yapı dilbilgisi, 1960’ların başında Harvard’da geliştirildi. Binlerce kural içeriyordu ve bunun sonucunda, aynı cümle için sıklıkla birkaç, bazen onlarca farklı yapısal betimleme buluyordu. Örneğin, beş sözcüklü bir cümlenin dört ayrı yoruma sahip olduğu saptandı. Şu cümle verildiğinde:

"Time flies like an arrow,"

Harvard sistemi, aşağıdaki anlamlara karşılık gelen yapısal betimlemeler üretti:

Zaman, bir okun hareket ettiği şekilde hareket eder.
Sineklerin hızını, bir okun hızını ölçtüğünüz şekilde ölçün.
Bir oka benzeyen sineklerin hızını ölçün.
"Time flies" olarak adlandırılan belirli bir sinek türü bir oku sever.

Bunların tümü, bazıları oldukça tuhaf olsa bile, cümlenin kesinlikle anlamlı yorumlarıdır. Hatta, Harvard çözümleme sisteminin tasarımcılarının, programlarının böylesine yeni yorumlar geliştirebilmesinden büyük memnuniyet duyduklarını düşünüyorum. Ancak, söylediğimizi anlayacak pratik bilgisayar sistemleri üretmek istiyorsak, programın önce söylediğimiz her şeyin olası tüm belirsiz ve tuhaf (her ne kadar sözdizimsel olarak doğru olsa da) yorumlarını listelemesini ve ardından en anlamlı olana odaklanmasını istemeyiz. Bunun yerine, programlarımızın, belki önceki konuşmalara ya da belki de programın neyin en mantıklı olduğuna dair genel bilgisine dayanarak, "doğru" yorumu hemen tanımasını tercih ederiz. Dilbilimciler artık, aşağıda kısaca gözden geçireceğimiz ve anlamı sözdizimsel çözümlemeyle ilişkilendiren dil kuramlarına yönelmektedir. Sonunda bu kuramlar, şu anda geliştirilmekte olan geçici uygulamaları tamamlayacak, bilgisayar tarafından dil çözümlemesi için biçimsel bir temel hâline gelebilir.

Dönüşümsel Dilbilgisi

Doğal dilin dilbilgisine yaklaşmak üzere tasarlanan dilbilgilerinin yapısındaki önemli bir yenilik, dönüşümsel dilbilgisi olarak adlandırılır. Dilbilgisini düzenlemeye yönelik bu yaklaşım ilk kez 1957 dolaylarında MIT'de Chomsky tarafından önerilmiş ve o zamandan beri sürekli olarak incelenmiş, ayrıntılandırılmış ve değiştirilmiştir. Dönüşümsel dilbilgileri, öbek yapısının çekici yalınlığının çoğunu korumaya çalışırken, doğal dili daha iyi yaklaştırmak için betimleyici gücünü zenginleştirir. Bu zenginleştirmenin mekanizması, bir dizi dil betimleme düzeyinin eklenmesidir.

Merdivenin en alt basamağında, dönüşümsel dilbilgisinin temel bileşeni olarak adlandırılan bir öbek-yapı dilbilgisi bulunur. Bu temel bileşen, daha önce tartışılan öbek-yapı dilbilgileri gibi, uç sembol dizgeleri ve bunların yapısal betimlemelerini üretmek için kullanılabilir. Ancak temel bileşen tarafından üretilen yapısal betimlemeler, metinde göründükleri biçimiyle tekil ve kabul edilebilir İngilizce cümleleri tanımlamak için değildir; bunun yerine, İngilizce cümlelerin sahip olabileceği tekil anlamları tanımlamak üzere tasarlanmıştır ve cümlelerin derin yapı gösterimleri olarak adlandırılır.

Dönüşümsel dilbilgisinin diğer ana bileşeni olan dönüşümsel bileşen, temel bileşen tarafından üretilen derin yapıları, gerçek cümleleri tanımlayan diğer yapısal betimlemelere—yüzey yapılara—dönüştürebilen bir kurallar kümesinden (dönüşümler olarak adlandırılır) oluşur. Bazen birden fazla dönüşüm art arda uygulanabilir ve derin yapı ile yüzey yapı arasında birkaç ara betimleme düzeyi ortaya çıkabilir.

Dönüşümler

Aynı derin yapı, farklı dönüşümlere tabi tutulduğunda, birbirinden oldukça farklı görünen yüzey yapılar üretebilir. Örneğin, "John gave the carrot to the aardvark," "Did John give the aardvark the carrot?" "The carrot was given to the aardvark by John," ve hatta belki de "The large burrowing nocturnal African mammal of the order Tubulidentata received the biennial herb of the family Umbelliferae from John," cümlelerinin tümü aynı derin yapıya sahip olabilir: belirli bir sebzenin belirli bir kişiden belirli bir hayvana aktarımının bir gösterimi.

Yukarıda gösterilen dört dönüşümün her biri geniş bir genel kullanıma sahiptir: biri basit bir bildirime dayalı cümle üretir, biri bir soru üretir, biri edilgen çatıyı kurar ve biri cümleyi (bir sözlüğün yardımıyla) yeniden ifade eder. Aynı zamanda, birkaç farklı derin yapı bazen aynı ya da benzer yüzey yapılara yol açabilir; örneğin, eksiksiz bir dönüşümsel dilbilgisinin, "Time flies like an arrow" ifadesinin dört farklı anlamına karşılık gelen dört ayrı derin yapı gösterimine sahip olması gerekir.

Dönüşümsel dilbilgileri, dönüşümsel bileşenin sağladığı zenginlik ve esneklik nedeniyle, doğal dili betimlemek için öbek-yapı dilbilgilerinden çok daha iyi bir araçtır. Ancak, bu tür dilbilgilerine dayalı yararlı bilgisayarlı dil çözümleme sistemlerinin gelişimini engelleyen iki büyük sorun olmuştur.

Pratik Bir Sorun

Dönüşümsel dilbilgileri temelde üretici niteliktedir. Temel bir bileşenin nasıl kullanılacağını derin yapılar üretmek için ve derin yapıların nasıl dönüştürüleceğini, belirli bir dilin (bazı doğal dillere bir yaklaşım olabilen) tüm cümlelerini temsil eden yüzey yapılar üretmek için tanımlarlar. Ancak, verilen bir aday cümlenin dile ait olup olmadığını ve öyleyse derin yapısının ne olduğunu belirlemek için nasıl çözümleneceğini tanımlamazlar. Eğer cümlenin birden fazla olası derin yapısı varsa ("Time flies like an arrow"), hangisinin seçileceğine dair bir yönlendirme yoktur; belirsizlik sorunu biçim değiştirmiştir, ancak kesinlikle ortadan kalkmamıştır.

Öbek-yapı kurallarının aksine, dönüşümleri "tersine" çalıştırmak çok zordur ve bunu yapmaya yönelik girişimler genellikle yavaş ve hantallaşmış yöntemlerle sonuçlanmıştır.

Altta Yatan Kuramsal Bir Sorun

Derin yapıların, cümlelerin tekil anlamlarını temsil etmesi beklenir. Ancak bir anlam nasıl temsil edilir? Bu, zaten doğal dilin asıl amacı değil midir? Şöyle bir sav ileri sürülebilir: Doğal dilin anlamı tam olarak nasıl ilettiğini kesin olarak bilmediğimiz için, sorunu yalnızca ertelemiş ve belki de, dönüşümlerin altında gizlenen derin yapılar aracılığıyla anlamın nasıl iletileceği sorunuyla değiştirerek daha da bulanıklaştırmış olduk. Bu durum, bir zamanlar zekânın doğasını, herkesin kafasının içinde tüm akıllı kararları veren küçük bir adam—bir "homunculus"—varsayarak "açıklayan" felsefe ekolüne biraz benzer.

Anahtar Anlamdır

Durum aslında o kadar da kötü değildir. Her şeyden önce, anlamı kavramanın dili kavramanın anahtarı olduğunun basitçe fark edilmesi ve genel kabul görmesi, dilbilim ve ilgili alanlarda son yirmi beş yılın (1950–1975) çalışmalarının önemli bir sonucudur. İkinci olarak, her doğal dil, iletilen anlamları kavrayabilmek için çözümlenmesi gereken bir yapıya kesinlikle sahiptir ve dönüşümsel dilbilgisi bu yapıyı betimlemek için iyi bir çerçeve sunar. Son olarak, anlamların nasıl temsil edileceği konusunda tamamen karanlıkta da değiliz.

Chomsky, derin yapının ilk betimlemelerinde bir yol önermiştir ve birçok bilim insanı, hem dönüşümsel dilbilgisi şemasına uyacak hem de daha geçici dil işleme sistemlerinde kullanılacak farklı yaklaşımları etkin biçimde araştırmaktadır. Bir sonraki alt bölüm, dilin anlamının otomatik olarak ele alınmasına yönelik bu yaklaşımlardan bazılarını ya da (aynı anlama gelen daha süslü bir sözcük kullanmak gerekirse) anlambilimi gözden geçirmektedir.

Anlambilime Yaklaşımlar

Anlambilime yönelik temel yaklaşım, sözdizime yönelik yaklaşım gibi, sözcüklerden oluşan belirli gruplamaları ya da diğer mantıksal yapıları tanımlamak olmuştur. Ancak anlamsal gruplar, cümle yapıları oluşturmada benzer rol oynayan sözdizimsel sözcük gruplarının aksine, anlamı iletmede benzer rol oynayan sözcükleri içerir.

(Lütfen 18. sayfaya bakınız.)