Denetimli ve Denetimsiz Öğrenme: Yapay Zekâ Nasıl Öğrenir?

Denetimli ve Denetimsiz Öğrenme: Yapay Zekâ Nasıl Öğrenir?

Denetimli ve Denetimsiz Öğrenme, yapay zeka sistemlerinin veriyi nasıl işlediğini belirleyen iki temel yaklaşımdır. Denetimli öğrenme algoritmaların “etiketli veriler” yani doğru cevapları bilinen örneklerle eğitildiği; denetimsiz öğrenme ise sistemin “etiketsiz veriler” içindeki gizli desenleri, yapıları ve anomalileri kendi başına keşfetmeye çalıştığı yöntemdir.

Günümüzde “veri yeni petroldür” sözünü sıkça duyuyoruz. Ancak ham petrol işlenmeden nasıl yakıta dönüşmezse ham veri de işlenmeden bir değere dönüşmez. İşte bu dönüşümü sağlayan rafineri Makine Öğrenimi (Machine Learning) teknolojisidir. Yapay zekâ terimini duyduğumuzda genellikle bilim kurgu filmlerindeki robotları hayal etsek de gerçek dünyadaki yapay zekâ; bankacılık işlemlerimizden film önerilerine, sağlık teşhislerinden otonom araçlara kadar veriden “öğrenen” matematiksel modeller bütünüdür.

Peki, bir bilgisayar tam olarak nasıl öğrenir? Bir öğretmenin rehberliğinde adım adım mı yoksa bilinmeyen bir dünyayı kendi başına keşfederek mi? Bu soru bizi makine öğreniminin iki temel ve en kritik disiplinine götürür: Denetimli Öğrenme (Supervised Learning) ve Denetimsiz Öğrenme (Unsupervised Learning).

Denetimli Öğrenme (Supervised Learning) Nedir?

Denetimli öğrenmeyi, bir öğretmenin öğrencisine ders anlatması ve ardından onu sınava tabi tutması süreci gibi düşünebilirsiniz. Bu senaryoda öğretmen (veri bilimci), öğrenciye (algoritma) hem soruları (girdi verisi) hem de doğru cevapları (çıktı/etiket) gösterir.

Bu yöntemde kullanılan anahtar kavram Etiketli Veridir. Sistem, “Bu resim bir kedi, bu resim bir köpek” veya “Bu kredi başvurusu riskli, bu başvuru güvenli” şeklinde önceden uzmanlar tarafından tanımlanmış binlerce örnekle beslenir.

Süreç Nasıl İşler?

  1. Eğitim Aşaması: Algoritmaya verilerin büyük bir kısmı (örneğin %80’i) cevaplarıyla birlikte verilir. Algoritma, girdiler ile çıktılar arasındaki matematiksel ilişkiyi kurar.
  2. Test Aşaması: Kalan %20’lik veri, cevapları gizlenerek algoritmaya sorulur. “Öğrendiklerini şimdi uygula” denir.
  3. Tahmin: Eğer model test aşamasını başarıyla geçerse artık tamamen yeni ve etiketsiz verilerle karşılaştığında doğru tahminler yapabilir hale gelir.

Denetimli öğrenme genellikle problemin niteliğine göre iki ana kategoriye ayrılır:

1. Sınıflandırma (Classification)

Verilerin belirli, ayrık kategorilere atandığı problemlerdir. Amaç “Ne kadar?” sorusuna değil “Hangisi?” sorusuna cevap vermektir. Çıktı, “Evet/Hayır”, “Kedi/Köpek/Kuş” veya “Spam/Spam Değil” gibi net sınıflardır.

  • Detaylı Örnek: E-posta sağlayıcınızın spam filtresi. Milyarlarca e-postadan hangisinin dolandırıcılık içerdiğini, hangisinin normal olduğunu kelime sıklıklarına, gönderici adresine ve link yapılarına bakarak öğrenir. Siz bir e-postayı “Spam” olarak işaretlediğinizde aslında sisteme yeni bir etiketli veri sunarak onu eğitmiş olursunuz.
  • Tıbbi Örnek: Bir tümörün görüntüsüne bakarak “İyi Huylu” veya “Kötü Huylu” olarak sınıflandırılması.

2. Regresyon (Regression)

Çıktının bir kategori değil sürekli bir sayısal değer olduğu durumlardır. Burada amaç veriler arasındaki ilişkiyi (korelasyonu) bularak geleceğe yönelik bir rakam tahmin etmektir.

  • Detaylı Örnek: Gayrimenkul değerleme. Bir evin oda sayısı, metrekaresi, konumu, bina yaşı ve o bölgedeki suç oranları gibi onlarca değişkeni analiz ederek evin piyasa fiyatını tahmin etmek.
  • Finansal Örnek: Gelecek ayın satış rakamlarını veya bir hisse senedinin kapanış fiyatını tahmin etmek.

Denetimsiz Öğrenme (Unsupervised Learning) Nedir?

Denetimsiz öğrenmede ise durum çok daha farklı ve biraz daha maceracıdır. Burada bir öğretmen yoktur; doğru cevap anahtarı verilmemiştir. Algoritma, devasa bir Etiketsiz Veri yığınıyla baş başa bırakılır. Bilgisayara “Bu bir elmadır” denmez; bunun yerine bilgisayarın önüne karışık bir meyve sepeti konur ve “Bunları özelliklerine göre ayır, yapılarını çöz” denir.

Sistem, insan müdahalesi olmadan veriler arasındaki gizli yapıları, benzerlik desenlerini veya aykırı durumları kendi başına keşfetmek zorundadır. Bu yöntem, verinin doğasını anlamak ve “Büyük Veri” (Big Data) içindeki anlamlı bilgiyi damıtmak için kullanılır.

Denetimsiz öğrenmenin temel teknikleri şunlardır:

1. Kümeleme (Clustering)

Veri setindeki elemanları, benzerliklerine göre gruplara ayırma işlemidir. Algoritma, veriler arasındaki mesafeye veya yapısal benzerliğe bakarak onları kümeler. Önceden tanımlanmış gruplar yoktur; gruplar verinin kendisinden doğar.

  • Detaylı Örnek: Müşteri Segmentasyonu. Bir e-ticaret sitesi, müşterilerini yaş, harcama tutarı ve ziyaret sıklığına göre analiz eder. Algoritma kendiliğinden “Hafta sonu alışveriş yapan genç teknoloji severler” veya “Sadece indirim döneminde gelen stokçular” gibi kümeler oluşturabilir. Pazarlama ekipleri bu kümeleri daha sonra isimlendirir ve onlara özel kampanyalar düzenler.

2. Boyut Azaltma (Dimensionality Reduction)

Günümüz dünyasında veriler yüzlerce hatta binlerce özelliğe (değişkene) sahip olabilir. Bu karmaşıklık hem işlemeyi zorlaştırır hem de görselleştirmeyi imkânsız kılar. Boyut azaltma, verinin içindeki en önemli bilgileri koruyarak gereksiz gürültüyü atıp veriyi sadeleştirme işlemidir.

  • Detaylı Örnek: Bir e-ticaret sitesinde kullanıcıların fare hareketleri, tıklama süreleri, kaydırma hızları gibi yüzlerce mikro davranış sinyali toplanır. Boyut azaltma algoritmaları bu yüzlerce sinyali analiz ederek bunları “Satın alma isteği” ve “Gezinme modu” gibi birkaç ana bileşene indirger.

3. Birliktelik Kuralı Madenciliği (Association Rule Mining)

“Bunu yapan, şunu da yaptı” mantığıdır. Veri setindeki öğeler arasındaki sık görülen ilişkileri ve korelasyonları ortaya çıkarır. Özellikle perakende sektöründe çapraz satış stratejilerinin kalbidir.

  • Detaylı Örnek: Market Sepeti Analizi. Ünlü “Bira ve Bebek Bezi” efsanesi buna örnektir. Yapılan analizlerde, cuma akşamları markete giden babaların bebek beziyle birlikte bira da aldıkları gibi beklenmedik bir ilişki keşfedilmiştir. Bu bilgi, rafların düzenlenmesinden kampanya kurgularına kadar her şeyi değiştirir.

Karşılaştırma Tablosu: Denetimli vs. Denetimsiz Öğrenme

İki yöntem arasındaki farkları net bir şekilde görebilmek, projeniz için doğru aracı seçmenin ilk adımıdır:

Karşılaştırma Tablosu: Denetimli vs. Denetimsiz Öğrenme

Hangi Durumda Hangisini Seçmeliyim?

Projenizin başarısı, doğru algoritmayı seçmekten çok, probleminizi doğru tanımlamakla başlar. Karar verirken şu rehberi kullanabilirsiniz:

“Net bir hedefim ve geçmiş verim var” diyorsanız:

Eğer amacınız “Gelecek ay müşteri kaybı yaşayacak mıyım?” veya “Bu resimde tümör var mı?” gibi spesifik bir soruyu yanıtlamaksa ve elinizde bu durumların geçmiş örnekleri (etiketli veri) varsa Denetimli Öğrenme kaçınılmaz tercihtir.

  • Strateji: Veri etiketlemeye bütçe ayırın veya eldeki veriyi temizleyin. Sınıflandırma veya Regresyon modellerine odaklanın.

“Elimde çok veri var ama ne anlama geldiğini bilmiyorum” diyorsanız:

Veri ambarınızda milyonlarca satır log kaydı, müşteri hareketi veya metin belgesi var ama bunların etiketleri yoksa amacınız veriyi anlamlandırmak, gruplamak veya anormallikleri tespit etmekse Denetimsiz Öğrenme ile başlamalısınız.

  • Strateji: Veriyi kümeler halinde inceleyin. Aykırı değerleri tespit edin. Elde ettiğiniz içgörüleri daha sonra denetimli öğrenme modelleri kurmak için kullanabilirsiniz.

Günlük Hayattan Somut ve Karmaşık Örnekler

Teknik terimleri bir kenara bırakırsak bu teknolojiler hayatımızın görünmez kahramanlarıdır.

  • Netflix ve Hibrit Öneri Sistemleri: Netflix sadece ne izlediğinize bakmaz (İçerik bazlı filtreleme). Aynı zamanda sizin izleme geçmişinize benzer geçmişe sahip milyonlarca diğer kullanıcıyı kümeler (Denetimsiz). Sonrasında o kümedeki diğer insanların beğenip sizin henüz izlemediğiniz filmleri size %95 eşleşme oranıyla tahmin eder (Denetimli/Hibrit).
  • Bankacılıkta Dolandırıcılık (Fraud) Tespiti:
    • Denetimli Yaklaşım: Banka, geçmişteki onaylanmış dolandırıcılık işlemlerini sisteme öğretir. Sistem, yeni gelen işlem bu şablonlara uyuyorsa alarm verir.
    • Denetimsiz Yaklaşım: Sistem, sizin normal harcama alışkanlıklarınızı (lokasyon, tutar, saat) öğrenir. Eğer normal deseninizin çok dışında bir harcama (Anomali) olursa daha önce hiç görmediği bir dolandırıcılık türü bile olsa işlemi durdurur.
  • Otonom Araçlar (Sürücüsüz Arabalar): Bir otonom araç yolda giderken kameradaki görüntüleri sürekli işler. “Bu bir yaya”, “Bu bir dur tabelası” diyebilmesi için milyonlarca etiketli görüntüyle (Denetimli Öğrenme) eğitilmiştir. Ancak hiç karşılaşmadığı bir yol koşulu veya engel gördüğünde çevreyi algılamak için denetimsiz öğrenme tekniklerinden de faydalanır.

Sıkça Sorulan Sorular (FAQ)

Okuyucularımızın zihnindeki soru işaretlerini gidermek adına, yapay sinir ağları hakkında en çok merak edilenleri derledik:

Zekâ, bağlama göre değişir. Denetimli öğrenme, kendisine öğretilen sınırlar içinde çok yüksek doğrulukla çalışır (Dar Yapay Zekâ). Denetimsiz öğrenme ise bilinmeyeni keşfetme yeteneğiyle insan zekasının “merak” ve “örüntü tanıma” yönüne daha yakındır ancak sonuçları her zaman net olmayabilir.

Klasik anlamda hayır, ancak pes etmeyin. İki yol izleyebilirsiniz:

  1. Etiketleme: Veriyi etiketlemek için insan gücü kullanabilirsiniz (Crowdsourcing vb.).
  2. Yarı Denetimli Öğrenme: Önce Denetimsiz öğrenme ile verileri kümelere ayırıp her kümeye toplu bir etiket atayarak veriyi “yarı-otomatik” etiketlemiş olursunuz. Sonrasında Denetimli modele geçebilirsiniz.

Derin Öğrenme, makine öğreniminin özel bir alt dalıdır ve insan beynini taklit eden “Yapay Sinir Ağlarını” kullanır. Hem denetimli (örn: Görüntü Tanıma) hem de denetimsiz (örn: Dil Modelleme) öğrenme görevlerinde, özellikle çok büyük ve karmaşık verilerle çalışırken devreye girer. Yani denetimli/denetimsiz öğrenme birer “yöntem” iken derin öğrenme bu yöntemleri uygulayan güçlü bir “teknoloji”dir.

Bu, üçüncü bir türdür. Burada veri seti yoktur; bir “ajan” (agent) vardır. Ajan, deneme-yanılma yoluyla bir ortamda hareket eder. Doğru yaptığında ödül, yanlış yaptığında ceza puanı alır. Satranç oynayan yapay zekalar veya yürümeyi öğrenen robotlar genellikle bu yöntemi kullanır. Denetimli ve denetimsiz öğrenmeden mantık olarak tamamen farklıdır.

Kesinlikle! Buna “Yarı Denetimli Öğrenme” (Semi-Supervised Learning) denir. Dünyadaki verilerin %90’ından fazlası etiketsizdir. Az miktarda etiketli veri ile çok miktarda etiketsiz verinin birlikte kullanıldığı bu yöntem, özellikle Google Görseller veya Facebook etiketleme sistemleri gibi devasa veri setlerinde standarttır.

Sonuç

Yapay zekâ yolculuğunda başarılı olmak, sadece en güçlü algoritmaya sahip olmakla değil elinizdeki verinin karakterine uygun yöntemi seçmekle mümkündür. Denetimli öğrenme ile geleceği tahmin ederek riskleri minimize edebilir, denetimsiz öğrenme ile verinin içindeki gizli fırsatları keşfederek inovasyon yapabilirsiniz.

İşletmeniz veya projeniz için doğru adımı atmak istiyorsanız, önce verinize bakın: O size ne anlatıyor, siz ondan ne duymak istiyorsunuz? Cevap, etiketlerin içinde veya desenlerin arasında sizi bekliyor.

Yapay zekâ çözümleri, veri madenciliği ve dijital dönüşüm stratejileri hakkında daha derinlemesine bilgi almak için Mochatouch blogunu takip etmeye devam edin.

İlgili Diğer İçerikler
Yazıyı Beğendiniz mi? Yorum Yapın

E-posta adresiniz yayınlanmayacaktır.Zorunlu alanlar * ile işaretlenmiştir.