Şimdi bu anlattıklarımızı bir örnek üzerinde inceleyelim: Yandaki şekil farelerin denek ola- rak kullanıldığı basit bir dolambacı (labirenti) göstersin. A ucundan içeri bırakılan fareler önce dolambacın içinde gelişigüzel dolaşıyorlar. B nok- tasına geldiklerinde, bir karar vererek sağa, sola ya da geriye dönmek seçe- neklerinden birisini seçmeleri müm- kün. Sola dönmüşlerse, D ucuna var- dıklarında bu ucun kapalı olduğunu görecekler ve geri dönmekten başka seçenekleri kalmayacak. Sağa dön- müşlerse, açık olan C ucundan dışa- rı çıkabilecekler ve böylece dolambaç- tan kurtulmuş olacaklar. “Dolambaç- tan kurtulmak” bile bir bakıma baş- lı başına bir ödül sayılabilir. Fakat aç, yiyecek bulmaya güdülenmiş bir fa- renin, C ucundan çıktıktan sonra bir yiyecek bulması ve böylece fizyolojik bir gereksinimini karşılaması kuşku- suz çok daha değerli bir ödüldür. Böylesi güdülenme ve ödüllenmelerin öğrenme adı verilen olgu için önemli etkenler olduğunu deneysel psikoloji göstermektedir. Farenin dolambacı “öğrenmesi” adını verdiğimiz bu ol- gu şöyle gelişiyor: Aynı fare, birçok kez aynı dolambaca A ucundan bıra- kıldığında, ilk kez yaptığı gibi sınama-yanılma yoluyla, ikinci kez ve daha senraki denemelerde de çıkışı buluyor. Fakat artan sayıdaki dene- yimler gösteriyor ki, farenin çıkışa varmak için yaptığı çabalamaların sa- yısı giderek azalmaktadır. Sonunda öyle bir duruma geliniyor ki, artık fa- re her denemede, hiçbir sapma yap- madan en kısa yol olan A-B-C yolu- nu izleyerek ödülüne ulaşabiliyor. So- nuç olarak, farenin gelişigüzel davra- nışlar arasından karşısındaki proble- mi çözmeye yönelik en uygun davra- nışlar dizisini belirleyerek yeni bir davranış geliştirmiş olduğunu, başka bir deyişle, farenin dolambacın çözü- münü öğrendiğini söyleyebiliyoruz. Bu örneği asıl amacımız açısından önemli olan bilgisayar programları ile ilişkisini kurarak incelemeye devam edelim: Örneğin bilgisayar oyunların- daki gibi “T” biçiminde düzenlenmiş bir dolambaç ve bu dolambacın için- de bir “sprite”ı gelişigüzel hareket et- tiren bir bilgisayar programımız ol- sun. (Bu tür görsel oyunlara aslında gerek yok. Bunlar problemin sunulu- şunu kolaylaştırmaya yarıyorlar.) Bu programa sprite'ın ya da farenin 'fiz- yolojik programı' “F” adını verelim. Fizyolojik program hakkında şunlar söylenebilir: 1. Nasıl ki fare, duyu organları, si- nir sistemi ve diğer uzuvları ile hare- ket halinde olup ileri, geri, sağa, sola dönmek gibi eylemleri otomatik ola- rak yapabiliyorsa, bilgisayar progra- mımız da sprite'ı sürekli hareket ettir- meli ve random sayılarla işleyen bir karar mekanizması yardımı ile B nok- tasına geldiğinde sağa, sola veya geri dönmek, D noktasına geldiğinde ise sadece geri dönmek gibi seçeneklerin seçimini gerçekleştirmelidir. Bu hare- ketler, aç bir farenin yiyecek arama çabasına benzetilebilir; fakat bu ge- nel çabalamalar belirli bir problemin belirli bir biçimde çözümüne yönelik değildir. Sprite'ın (farenin) çıkışa var- ması tümüyle rastlansal olarak ger- Commodore $ 8 Şrenmek... Bilgisayarcılar için büyülü bir sözcük bu. Öğrenen ve öğrendiğini kullanan bilgisayarlar çağın ilk hedefi. çekleşmektedir. Bu arada, sprite'ın hı- zının değişmediğini varsayıyoruz. 2. Farenin “acıkması”, “açlıktan ölmesi” ve “açlığını gidermesi” gibi olgulara karşılık olmak üzere bilgisa- yar programımızın da “mide”si diye- bileceğimiz bir alt-programı olsun. Bu programın çalışması şöyle olabilir: Fare dolambaca girdikten sonra çalış- maya başlayan bilgisayarın iç-saati bu amaç için kullanılabilir. Saatin alabi- leceği en büyük değer Tm olsun. Bu Tm değeri, yukarıda anlattığımız ran- dom sayılarla işleyen programın çıkı- şa ulaşabilmesine ortfalama olarak imkan verecek kadar büyük seçilme- lidir. Burada bir “ortalama değer”den söz etmek gerekir; çünkü “F” prog- ramı random sayılarla işlediğinden salt rastlansal olarak en kısa yolu iz- leyerek çıkışa ulaşmış olabileceği gi- bi, gene salt rastlansal olarak çok uzun bir süre geçtiği halde çıkışa ula- şamamış olabilir. Şimdi, ortalama va- rış zamanı olan Tm'den daha uzun bir süre geçtiği halde sprite çıkışa vara- mamışsa bunun anlamı “açlıktan öl- mek” olsun, Tm kadar veya daha kı- sa bir sürede çıkışa vardığında “yiye- ceğe ulaşmış”, yani “açlığını gider- miş” sayılsın ve saatin değeri sıfırlan- sın. 3. Sistemin, geçireceği deneyimle-