Makine Öğrenmesinin Sınırlılıkları

 

Makine öğrenimi sistemlerinin sağladığı fırsatlar ve faydalarla beraber, sınırlılıkları ve zorlukları da bulunmaktadır. Bu sınırlılıklar şöyle açıklanabilir:

Öğrenme problemine uygun algoritmanın belirlenmesi, makine öğrenimi için en önemli problemlerden birisidir. Araştırmacılar, problemin ihtiyacına yönelik algoritmayı belirleyebilmesi, bunun için de farklı pek çok algoritmayı deneyerek test etmesi gerekmektedir. Algoritma ile birlikte model parametrelerinin de belirlenmesi gerekmektedir. Metin işlemleri için bazı algoritmalar iyi performans gösterirken, görüntü işleme için farklı algoritmalar daha iyi performans gösterebilmektedir.

Eldeki veriler içerisinde bulunan gürültüler, makine öğrenmesinin bir başka sınırlılığıdır. Özellikle büyük veri kavramıyla birlikte ortaya çıkan, veri yığınları arasında yapılandırılmış ve/veya yapılandırılmamış verilerin aynı anda bulunması, makine öğrenmesinde baş edilmesi gereken diğer bir sorundur. Verideki gürültü; bir görüntünün boyut, renk, çözünürlük gibi özelliklerindeki farklılıklar, bir metin verisindeki yanlış yazım, noktalama işaretleri, kullanılan özel simge ve kısaltmalar gibi farklı şekillerde karşımıza çıkabilir.

Özellik çıkarımı, sistemin doğru çalışması, doğru özelliklerin ve özellik sayılarının seçilmesine bağlı olarak değiştiği için makine öğrenimi sisteminin en önemli adımlarındandır. Özellik çıkarım işlemi işlemin gerçekleştirildiği probleme bağlıdır ve özeldir. Daha açık belirtmek gerekirse, bir sağlık probleminde belirlenen özellikler, otonom bir araç için kullanılacak özelliklerden farklı olacaktır. Farklı disiplinlerde, farklı problem çözümlerine üretilen ortak bir özellik çıkarımı, gelecekte çok büyük problem çözümlerine fayda sağlayabilecektir.

Aşırı öğrenme bir diğer makine öğrenimi sınırlılığıdır. Oluşturulan model, eğitim sırasında yüksek performans gösterirken, test verisi üzerinde düşük performans gösterebilir veya beklenildiğinden daha az performansta olabilir. Bu durumda, eğitim verilerinin model tarafından ezberlendiği, bir diğer deyişle modelin aşırı öğrendiği düşünülmektedir. Bunun önüne geçmek için, eğitim sırasında modelin karmaşıklığı arttırılmakta, çeşitli yöntemler denenmektedir.

Denetimli makine öğrenmesi yöntemlerinde etiketlenmiş veriler üzerinden model eğitilerek tespit ve teşhisler gerçekleştirilir. Bu modeli kurgulamak için de elde hatırı sayılır miktarda büyük bir veri bulunmalıdır. Böyle bir veri etiketleme işi için uzman kişiler ve yoğun mesai gerekmektedir. Ayrıca insan kaynaklı hatalara da sebebiyet verilmesi mümkündür. Özel problemlerin çözümünde, uzman personel eksikliği de yaşanabilir. Tüm bunlar bir araya gelerek, veri etiketleme sınırlılığını ortaya çıkarmaktadır.

Dünden Bugüne Yapay Zeka

Savaş, S. (2019), Karotis Arter Intima Media Kalınlığının Derin Öğrenme ile Sınıflandırılması, Gazi Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Ana Bilim Dalı, Doktora Tezi, Ankara.

 
 

Hiç yorum yok:

Yorum Gönder