ImageNet isimli dünyanın en önemli nesneleri tanıma yarışmasında 2012 yılında Krizhevsky ve arkadaşları tarafından AlexNet [1] isimli Derin Konvolüsyonel Yapay Sinir Ağları (Deep Convolutional Neural Netrowks) yoluyla yapılan sınıflandırma sonucunda elde edilen başarı, derin öğrenmenin dünya literatüründeki en büyük etkisi olmuştur. Bu başarı sonrasında derin öğrenme yükselişe geçmiştir. Literatürde derin öğrenme ile ilk olarak 2006 yılında derin fikir ağları olarak adlandırılan bir metot [2] ile tanışılmıştır. Derin Fikir Ağları (Deep Belief Nets — DBN), her bir görüntü tanıma yönteminin doğruluğunu ölçmek ve tahmin etmek için tercih edilen MNIST (0–9 sayıları arasında değişen 70.000 tane 28 x 28 piksel el yazısı karakterlerinin görüntü verileri) veri tabanı kullanılarak test edilmiştir. Derin öğrenmenin zamanla gelişimi Şekilde gösterilmiştir [3].
Derin öğrenme zaman çizelgesi [3]
Son yıllarda, derin öğrenme araştırmalarında geliştirilen teknikler, makine öğrenmesi ve yapay zekânın en etkili ve önemli yönleri dâhil olmak üzere hem geleneksel hem de yeni biçimlerde, genişletilmiş kapsamlar içinde büyük bir yelpazede bilgiyi işleme çalışmalarını etkilemektedir.
Derin öğrenme, makine öğrenmesinin bir alt alanı olmakla beraber derin sinir ağlarının gün geçtikçe yaygınlaşan uygulama alanıdır. Bu alanda her bir çalışmaya ait özelleştirilmiş algoritmalar yerine, verileri öğrenmeye dayanan ve çözümlerin daha geniş veri kümesini kapsaması amaçlanmaktadır. Derin öğrenme, makine öğrenmesindeki yapay zekâ problemlerini çözmek için gelecek vaat eden bir yaklaşımdır.
Derin öğrenmenin çeşitli tanımları bulunmaktadır [4]:
Tanım 1: Denetimli veya denetimsiz özellik çıkarımı ve dönüşümü, model analizi ve sınıflandırma için birçok doğrusal olmayan bilgi işlem katmanını kullanan bir makine öğrenme teknikleri sınıfı.
Tanım 2: Makine öğrenmesi içinde, veriler arasındaki karmaşık ilişkileri modellemek için çoklu temsil seviyelerini öğrenmek için algoritmalara dayanan bir alt alan. Böylece üst düzey özellikler ve kavramlar alt düzey özellikler olarak tanımlanır ve bu tür özellikler hiyerarşisine derin bir mimari denir. Bu modellerin çoğu denetlenmeyen temsillerin öğrenilmesine dayanmaktadır.
Tanım 3: Daha üst düzey kavramların daha düşük seviyeli olanlardan tanımlandığı özelliklerin veya faktörlerin veya kavramların hiyerarşisine tekabül eden birkaç temsil seviyesinin öğrenilmesine dayanan bir makine öğrenme alt alanıdır ve aynı düşük seviyeli kavramlar birçok üst seviye kavramın tanımlanmasına yardımcı olabilir. Derin öğrenme, öğrenme temsillerine dayalı daha geniş bir makine öğrenme yöntemleri ailesinin bir parçasıdır. Bir gözlem (örn., bir görüntü) birçok şekilde gösterilebilir (örn., bir piksel vektörü), ancak bazı gösterimler ilgi çekici görevleri öğrenmeyi kolaylaştırır (örn., bu bir insan yüzünün görüntüsü müdür?) Örneklerden ve bu alandaki araştırmalardan, neyin daha iyi temsil edilebileceğini ve nasıl öğrenileceğini belirlemeye çalışır.
Tanım 4: Derin öğrenme, makine öğreniminde farklı soyutlama seviyelerine karşılık gelen çoklu seviyelerde öğrenmeye çalışan bir dizi algoritmadır. Genellikle yapay sinir ağları kullanılır. Bu öğrenilen istatistiksel modellerde seviyeler, daha yüksek seviyeli kavramların düşük seviyeli kavramlardan tanımlandığı ve aynı düşük seviyeli kavramların daha yüksek seviyeli kavramları tanımlamaya yardımcı olabileceği farklı kavram seviyelerine karşılık gelir.
Tanım 5: Derin Öğrenme, makine öğrenmesini orijinal amaçlarından birine (yapay zekâ) yaklaştırmak amacıyla tanıtılan makine öğrenimi araştırmasının yeni bir alanıdır. Derin öğrenme, görüntüler, sesler ve metinler gibi verileri anlamada yardımcı olan çoklu temsil ve soyutlama seviyelerini öğrenmekle ilgilidir.
Derin öğrenme, derin sinir ağını kullanan bir makine öğrenme tekniğidir. Derin sinir ağları ise iki veya daha fazla gizli katman içeren çok katmanlı sinir ağlarıdır [5].
Derin öğrenme yapısı |
Derin öğrenmede, verilerin birden fazla özellik seviyesinin veya temsillerinin öğrenilmesine dayanan bir yapı söz konusudur. Üst düzey özellikler, alt düzey özelliklerden türetilerek hiyerarşik bir temsil oluşturur [6]. Bir görüntü için temsil, piksel başına yoğunluk değerlerinin bir vektörü veya kenar kümeleri, özel şekiller gibi özellikler olabilir. Bu özelliklerin içinden bazıları veriyi daha iyi temsil etmektedir. Derin öğrenme yöntemlerinde, elle çıkarılan özellikler yerine veriyi en iyi temsil eden hiyerarşik özellik çıkarımı için etkin algoritmalar kullanılmaktadır [7].
Derin öğrenmenin çeşitli üst düzey tanımları arasında ortak olan iki temel husus vardır [4]:
- Çoklu katmanlardan veya doğrusal olmayan bilgi işlem aşamalarından oluşan modeller,
- Ard arda daha yüksek, daha soyut katmanlarda özellik gösteriminin denetimli veya denetimsiz bir şekilde öğrenilmesine yönelik yöntemler.
Derin öğrenme algoritmalarının çalıştırılması ve problemlerin çözüme ulaştırılması için, kapasitesi yüksek (özellikle GPU) makineler ve büyük miktarda veriye ihtiyaç vardır. Problemleri parçalara ayıran ve ayrı ayrı çözen standart makine öğrenme algoritmalarının aksine, derin öğrenmede problem baştan sona çözülür. Daha da önemlisi, derin bir öğrenme algoritması ne kadar çok veri ile beslenirse, görevin yerine getirilmesi de o kadar iyi olur. Ayrıca zaman faktörü de önemlidir. Zaman kısıtlı olmayan çalışmalar, büyük veri ile beslendiğinde daha iyi sonuçlar ortaya çıkarabilir.
Günümüzde derin öğrenmenin popülaritesinin üç önemli sebebi, büyük ölçüde artan işlemci yetenekleri (örn., grafik işlemciler (GPU)), eğitim için kullanılan verilerin büyük ölçüde artması ve makine öğrenmesi ve sinyal/bilgi işleme araştırmalarındaki son gelişmelerdir. Bu gelişmeler, derin öğrenme yöntemlerinin karmaşık, bileşimli doğrusal olmayan işlevlerden etkin bir şekilde yararlanmasını, dağıtılmış ve hiyerarşik özellik gösterimlerini öğrenmesini ve hem etiketli hem de etiketlenmemiş verileri etkili bir şekilde kullanmasını sağlamıştır [4].
Yapay zekâ ve derin öğrenme görev tanımlama |
Makine öğrenmesinde algoritma, insanlar tarafından sağlanan bilgilere dayanarak bir kare ile üçgen arasında ayrım yapmaktadır. Derin öğrenmede, program önceden beslenen bilgilerle başlamaz. Bunun yerine, şekillerin kaç köşeye sahip olduğunu, bu köşelerin bağlı olup olmadığını ve dik olup olmadıklarını belirlemek için bir algoritma kullanır. Algoritma sonuç olarak eklenen bir dairenin kare ve üçgen sıralamalarına uyup uymadığını anlamaktadır.
İnsanlar tarafından kolaylıkla yapılabilen imge ve/veya ses tanımlama gibi problemlerin çözülmesi, yapay zekâ yöntemleri için zor olmaktadır. Bu sezgisel problemler, birbirleri ile ilişkisi tanımlanabilen en basit konseptlerin hiyerarşik olarak dünyayı anlama ve deneyimleme yetisinin bilgisayarlar tarafından öğrenilmesiyle çözülebilmektedir. Deneyimlerle kazanılan bilgilerle birlikte, bilgisayarların kullandığı her bir probleme özgü formüllere ve hesaplama işlemlerine gerek kalmamaktadır. Hiyerarşik yapı bir grafik olarak düşünüldüğünde, her birisi diğerinin üzerinde kurulu çok katmanlı derin bir yapı oluşmaktadır. Bu sebeple, hiyerarşik yapıya dayalı yapay zekâ yöntemleri, derin öğrenme olarak ortaya çıkmaktadır [8].
Derin öğrenme sinir ağlarının araştırma alanları, yapay zeka, grafik modelleme, optimizasyon, örüntü tanıma ve sinyal işleme arasındaki kesişme noktalarındadır [4]. Bu algoritmalar günümüzde sürücüsüz araçlar, sağlık hizmetleri, film önerileri, çeviri hizmetleri, chatbotlar, sayfa önerileri, reklam hizmetleri gibi pek çok uygulamada kendini göstermeye başlamıştır.
Derin öğrenme mimarilerinin bu denli ilgi gören bir çalışma alanı olmasındaki unsurlar şöyledir:
- Dünya çapında yaygın metin, görüntü ve ses veri setlerinin araştırmalar için kullanıma sunulması.
- Yüksek işlem güçlü grafik kartlarının (GPU) üretilmeye başlanması.
- AlexNet, ZFNet, ResNet, GoogLeNet, VGG16–19, Inception vb. gibi derin mimarilerin kullanıma sunulması.
- Keras, Tensorflow, Theano, Caffe, Pytorch, MatConvNet vb. gibi derin öğrenme platformları ve kütüphanelerinin kullanılmaya başlanması.
- Aktivasyon fonksiyonları, veri eğitimi ve veri arttırma yöntemleri ve etkili optimazörlerin araştırmacılar tarafından geliştirilerek kullanıma sunulması.
Derin öğrenme yelpazesi |
Derin sinir ağlarında ise iki veya daha fazla gizli sinir ağı katmanı bulunmaktadır. Derin sinir ağlarında veri içerisinde basitten karmaşığa doğru daha kapsamlı ilişkiler kurulur. Her katman bir önceki katmanla kendi arasında bir ilişki kurmaya çalışır. Böylece girdiler hakkında daha detaylı inceleme yapılarak daha doğru karar verilmesi sağlanır. Şekilde üç gizli katmalı bir derin sinir ağı yapısı görülmektedir.
Derin sinir ağı yapısı
Derin sinir ağları yapısı oluşturulurken farklı aktivasyon fonksiyonları kullanılabilir. Bu fonksiyonlar verinin türüne, yapısına, büyüklüğüne ve modeli oluşturan kişiye göre değişebilir. Aktivasyon fonksiyonu hücreye gelen girdiye karşılık olarak bu hücrenin üreteceği çıktıyı belirler. Genellikle doğrusal olmayan bir fonksiyon seçilir. Başlıca aktivasyon fonksiyonları, Sigmoid, TanH ve ReLU’dur.
Aktivasyon fonksiyonları
formülleriAktivasyon fonksiyonları
Dünden Bugüne Yapay Zeka
KAYNAKLAR
[1] Krizhevsky, A., Sutskever, I., and Hinton, G. E. (2012). 25th International Conference on Neural Information Processing Systems. ImageNet Classification with Deep Convolutional, 1097–1105. Lake Tahoe, Nevada: NIPS’12 Proceedings.
[2] Hinton, G. E., Osindero, S., and Teh, Y.-W. (2006). A fast learning algorithm for deep belief nets. Neural Comput, 1527–1554.
[3] Ay Karakuş, B. (2018). Derin Öğrenme ve Büyük Veri Yaklaşımları ile Metin Analizi. Doktora Tezi, Fırat Üniversitesi Fen Bilimleri Enstitüsü, Elazığ.
[4] Deng, L., and Yu, D. (2013). Deep Learning Methods and Applications. Foundations and Trends in Signal Processing, 7, 197–387. doi: 10.1561/2000000039
[5] Phil, K. (2017). MATLAB Deep Learning: With Machine Learning, Neural Networks andArtificial Intelligence. Seoul, Soul-t’ukpyolsi, Korea: Apress.
[6] Bengio, Y. (2009). Learning Deep Architectures for AI. Foundations and Trends in Machine Learning, 2, 1–127. doi: 10.1561/2200000006
[7] Song, H. A., and Lee, S.Y. (2013). International Conference on Neural Information Processing. Hierarchical Representation Using NMF, 466–473. Daegu, South Korea.
[8] Goodfellow, I., Bengio, Y., and Courville, A. (2016). Deep Learning. MIT Press. http://www.deeplearningbook.org
[9] Savaş, S. (2019), Karotis Arter Intima Media Kalınlığının Derin Öğrenme ile Sınıflandırılması, Gazi Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Ana Bilim Dalı, Doktora Tezi, Ankara.
Hiç yorum yok:
Yorum Gönder