Makine Öğrenmesi

 Makine öğrenmesi sayesinde, bilgisayarlar artık hava durumunu tahmin etme, borsa sonuçlarını belirleme, alışveriş alışkanlıklarını anlama, bir fabrikada robotları kontrol etmek vb. gibi durumlar için “eğitilebilir” durumdadırlar. Google, Amazon, Facebook, Netflix, LinkedIn gibi firmalar tüketiciye yönelik daha popüler hizmetlerin tümünü makine öğrenmesiyle desteklemektedir. Fakat tüm bu öğrenmelerin merkezinde bir algoritma olarak bilinen şey vardır. Özet olarak bir algoritma tam bir bilgisayar programı değil, tek bir problemi çözmek için sınırlı bir adım dizisidir. Algoritmada özel ve tek bir hedefe ulaşmak için belirli adımlar atılmaktadır.


 

Özünde makine öğrenmesi deneme yanılma esasına dayanır. Kendi kendini süren bir arabanın bir yayayı bir ağaçtan veya bir araçtan ayırt etmesine yardımcı olabilecek bir program el ile yazılamayabilir ancak verileri kullanarak bu sorunu çözebilecek bir program için bir algoritma oluşturulabilir. Algoritmalar ayrıca programların bir kasırganın yolunu tahmin etmesine, Alzheimer’ın erken dönemini teşhis etmesine, dünyanın en fazla ödenen ve ödenmeyen futbol yıldızlarını belirlemesine yardımcı olmak için oluşturulabilir. Makine öğrenme algoritmaları temelde programların öngörülerde bulunmalarını sağlar ve zaman içinde deneme yanılma deneyimlerine dayanarak bu tahminlerde daha iyi sonuçlar alır.

Makine öğrenmesi algoritmalarının dört ana türü vardır:

  • Denetimli Öğrenme (Supervised Learning)
  • Denetimsiz Öğrenme (Unsupervised Learning)
  • Yarı Denetimli Öğrenme (Semi-supervised Learning)
  • Takviyeli Öğrenme (Reinforcement Learning)

enetimli öğrenmede etiketli verileri içeren bir bilgisayar programı sağlanır. Örneğin, görüntüleri sıralamak için bir algoritma kullanarak kedi ve köpek resimlerini ayırma görevi tanımlandığında, kedisi olanların bir “kedi” etiketi olur ve köpeği olan resimlerin “köpek” etiketi olur. Bu bir “eğitim” veri seti olarak kabul edilir ve etiketler, program görüntüleri kabul edilebilir bir oranda başarılı bir şekilde sıralayabilene kadar yerinde kalır. Sürecin sonunda girdi verilerini en iyi tanımlayan işlev seçilir ve verilen “X” (girdi) için en iyi tahmini “y” (çıktı) yapar. Denetimli öğrenme algoritmaları, hedef tahmin çıktısı ile girdi özellikleri arasındaki ilişkileri ve bağımlılıkları, önceki veri setlerinden öğrendiği ilişkilere dayanarak yeni veriler için çıktı değerlerini tahmin edebilecek şekilde modellemeye çalışır.

  • En Yakın Komşu (Nearest Neighbor),
  • Naive Bayes, Karar Ağaçları (Decision Trees),
  • Doğrusal Regresyon (Linear Regression),
  • Destek Vektör Makineleri (Support Vector Machines),
  • Yapay Sinir Ağları (Artificial Neural Networks)

gibi algoritmalar, denetimli öğrenme algoritmalarının başlıcalarıdır.

enetimsiz öğrenme hiçbir şekilde etiket içermez. Bunun yerine, program iki yöntemden birini kullanarak kedi ve köpek görüntülerini iki gruba bölme görevine kör bir şekilde atılır. Kümeleme algoritmasında bacak boyu, gövde uzunluğu, gözler vb. gibi özelliklere dayalı olarak benzer nesneler bir araya getirilir. Diğer algoritmaya ise ilişkilendirme denir ve programın keşfettiği benzerliklere dayanarak kurallar oluşturulur. Başka bir deyişle, görüntüler arasında ortak bir kalıp belirlenir ve görüntüler buna göre sıralanır. Temel olarak desen tespiti ve tanımlayıcı modellemede kullanılan makine öğrenme algoritmaları ailesidir.

  • K-Ortalama Kümeleme (K-Means Clustering),
  • Birliktelik Kuralları (Association Rules)

gibi algoritmalar, denetimsiz öğrenme algoritmalarının başlıcalarıdır.

arı denetimli öğrenme, bilgisayarların hem etiketli hem de etiketsiz verilerin varlığında, insanlar gibi doğal sistemlerin nasıl öğrendiği üzerine yapılan çalışmalarla ilgili bir öğrenme paradigmasıdır [1]. Yarı denetimli öğrenmede yalnızca birkaç resim etiketlenir. Bilgisayar programı daha sonra etiketlenmemiş görüntüler hakkında en iyi tahminde bulunmak için bir algoritma kullanır ve ardından veriler programa eğitim verileri olarak geri beslenir. Daha sonra sadece birkaç etiketi içeren yeni bir görüntü grubu sunulur. Program kedi ve köpekleri kendi arasında kabul edilebilir bir oranda ayırt edebilinceye kadar tekrarlayan bir işlemdir. Yarı denetimli öğrenme önceki ikisinin arasında yer alır. Etiketleme pek çok durumda uzmanları gerektirdiği için maliyeti oldukça yüksektir. Dolayısıyla, gözlemlerin çoğunda etiket yokluğunda ancak az sayıda mevcut olsa da, yarı denetimli algoritmalar model yapımı için en iyi adaylardır. Bu yöntemler, etiketlenmemiş verilerin grup üyeliğinin bilinmemesine rağmen, bu verilerin grup parametreleri hakkında önemli bilgiler taşıdığı fikrinden yararlanmaktadır.

akviyeli öğrenmede program oyunun kurallarını ve nasıl oynanacağını bilir ve turu tamamlama adımlarını uygular. Satranç, bu tür bir algoritmaya örnek olabilir. Programa verilen tek bilgi maçı kazanıp kazanmamasıdır. Sonunda bir maç kazanana kadar başarılı hamlelerini takip ederek oyunu tekrarlamaya devam eder. Sürekli olarak yinelemeli bir şekilde çevreden öğrenir. Süreçte aracı, çevre konusundaki deneyimlerinden olası tüm durumları araştırana kadar öğrenir.

  • Zamansal Fark (Temporal Difference (TD)),
  • Q Öğrenme (Q Learning),
  • Sarsa algoritmaları,

başlıca takviyeli öğrenme algoritmalarındandır.

Bu öğrenme türlerinin derinlemesine olarak içeriğine sonraki postlarda değineceğim.

                                                      Dünden Bugüne Yapay Zeka
 

KAYNAKLAR

[1] Zhu, X., and Goldberg, A. B. (2009). Introduction to Semi-Supervised Learning. Artificial Intelligence and Machine Learning, 130. doi: 10.2200/S00196ED1V01Y200906AIM006

[2] Savaş, S. (2019), Karotis Arter Intima Media Kalınlığının Derin Öğrenme ile Sınıflandırılması, Gazi Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Ana Bilim Dalı, Doktora Tezi, Ankara.

Hiç yorum yok:

Yorum Gönder