Günümüzde bilgi çok hızlı bir şekilde çoğalmaktadır ve bu bilgilerin içerisinde işe yarayacak ve yaramayacak olanları ayırt etmek zorlaşmaktadır. Bu bilgi yığınları arasından, işe yarayacak olanlarını elde etme işi için kullanılan yöntem ise veri madenciliğidir.
Veri madenciliğinin tarihsel gelişimi [1]
Geçmişten günümüze veriler her zaman yorumlanmış, bilgi edinilmek istenmiş ve bunun için de donanımlar oluşturulmuştur. Bu sayede bilgi geçmişten günümüze taşınır hale gelmiştir.
1950‟li yıllarda ilk bilgisayarlar sayımlar için kullanılmaya başlanmıştır.
1960‟larda ise veri tabanı ve verilerin depolanması kavramı teknoloji dünyasında yerini almıştır. Ayrıca 1960'ların sonunda bilim adamları basit öğrenmeli bilgisayarlar geliştirebilmişlerdir.
1970‟lerde ilişkisel Veri Tabanı Yönetim Sistemleri uygulamaları kullanılmaya başlanmıştır. Bilgisayar uzmanları bununla beraber basit kurallara dayanan uzman sistemler geliştirmişler ve basit anlamda makine öğrenimini sağlamışlardır.
1980‟lerde Veri Tabanı Yönetim Sistemleri yaygınlaşmış ve bilimsel alanlarda, mühendisliklerde vb. alanlarda uygulanmaya başlanmıştır. Bu yıllarda şirketler müşterileri, rakipleri ve ürünleri ile ilgili verilerden oluşan veri tabanları oluşturmuşlardır. Bu veri tabanlarının içerisinde çok büyük miktarlarda veri bulunmakta ve bunlara SQL veri tabanı sorgulama dili ya da benzeri diller kullanılarak ulaşılabilmektedir.
1990‟larda içindeki veri miktarı katlanarak artan veri tabanlarından, faydalı bilgilerin nasıl bulunabileceği düşünülmeye başlanmıĢtır. 1989, KDD (IJCAI)-89 Veri Tabanlarında Bilgi Keşfi Çalışma Grubu toplantısı ve 1991, KDD (IJCAI)-89‟un sonuç bildirgesi sayılabilecek “Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop” makalesinin KDD ile ilgili temel tanım ve kavramları ortaya koyması ile süreç daha da hızlanmıştır. 1992 yılında veri madenciliği için ilk yazılım gerçekleştirilmiştir.
2000‟li yıllarda veri madenciliği sürekli gelişmiş ve hemen hemen tüm alanlara uygulanmaya başlanmıştır. Alınan sonuçların faydaları görüldükçe bu alana yönelik çalışmalar ve uygulamalar sürekli artmaktadır.
2010"lu yıllar Büyük Veri kavramının gittikçe yaygınlaştığı zaman dilimi olarak tarihte yerini almıştır. Buna en büyük etkiyi sosyal medya sitelerinin yaygınlaşması ve mobil yaşam sağlamıştır.
2020artık; Nesnelerin Interneti, Bulut Bilişim, Derin Öğrenme gibi disiplinlerle birlikte artan veri çeşitliliğine paralel olarak veriyi işleme algoritmaları da çeşitlenmiştir.
Veri Madenciliğinin Kullanıldığı Alanlar
Büyük hacimde veri bulunan her yerde veri madenciliğini kullanmak mümkündür. Günümüzde karar verme sürecine ihtiyaç duyulan birçok alanda veri madenciliği uygulamaları yaygın olarak kullanılmaktadır. Örneğin, eğitim, biyoloji, finans, borsa, genetik, sağlık, sigorta, endüstri, istihbarat vb. birçok dalda başarılı uygulamaları görülmektedir. Son 30 yıldır tüm bu belirtilen sektörlerde başarılı Veri Madenciliği uygulamalarının yapıldığı bilinmektedir.
Veri madenciliğini kullanan alanlar ve kullandıkları uygulamalar Ģöyle belirtilebilir:
Pazarlama
- Müşterilerin satın alma örüntülerinin belirlenmesi,
- Müşterilerin demografik özellikleri arasındaki bağlantıların bulunması,
- Posta kampanyalarında cevap verme oranının artırılması,
- Mevcut müşterilerin elde tutulması, yeni müşterilerin kazanılması,
- Pazar sepeti analizi,
- Müşteri ilişkileri yönetimi,
- Müşteri değerlendirmesi,
- Satış tahmini,
- Müşteri dağılımı,
- Çeşitli pazarlama kampanyaları,
- Pazarlama stratejilerinin oluşturulması,
- Çapraz satış analizleri [2].
Bankacılık, Sigortacılık ve Borsa
- Farklı finansal göstergeler arasında gizli korelasyonların bulunması,
- Kredi kartı dolandırıcılıklarının tespiti,
- Kredi kartı harcamalarına göre müşteri gruplarının belirlenmesi,
- Kredi taleplerinin değerlendirilmesi,
- Müşteri dağılımı,
- Usulsüzlük tespiti,
- Risk analizleri,
- Risk yönetimi,
- Yeni poliçe talep edecek müşterilerin tahmin edilmesi,
- Sigorta dolandırıcılıklarının tespiti,
- Hisse senedi fiyat tahmini,
- Hileli hesapların ve dolandırıcılıkların ortaya çıkarılması [3].
Perakendecilik
- Satış noktası veri analizleri,
- Alışveriş sepeti analizleri,
- Tedarik ve mağaza yerleşim optimizasyonu,
- Genel piyasa analizleri,
- Alım-satım stratejilerinin optimizasyonu.
Telekomünikasyon
- Kalite ve iyileştirme analizleri,
- Hatların yoğunluk tahminleri,
- Web sitesi ziyaretçilerinin profil analizi.
Bilim ve Mühendislik
- Laboratuar veya bilgisayar ortamında sistemlerin simülasyonu ve analizi sürecinde üretilen yüksek miktarda bilimsel verilerin anlamlandırılması [4].
Sağlık, Biyoloji ve Genetik
- Gen araştırmaları,
- Yeni virüs türlerinin keşfi ve sınıflandırılması,
- Hastalıkların özelliklerinin belirlenerek teşhislerin kolaylaştırılması,
- Birlikte kullanılan ilaçların yan etkilerinin araştırılması,
- Test sonuçlarının tahmini,
- Ürün geliştirme,
- Tedavi sürecinin belirlenmesi,
- Tıbbi teşhis.
Kriminoloji
- Suç eğilimlerinin tanımlanması,
- İstihbarat birimleri.
Veri madenciliğinin kullanıldığı yukarıda belirtilen alanlarda araştırmacılara, firma yöneticilerine ve idarecilerine sağladığı yararlar şu şekilde sıralanabilir [3]:
- Tıp, verilerin en çok tutulduğu alanların başında bulunmaktadır. Özellikle son yıllarda genetiğin inanılmaz hızda ilerlemesi sonucun oluşan gen haritaları ile hastalıklar sınıflandırılmaya başlanmıştır. Hangi genlere sahip bireylerin hangi hastalıklara yakalanma olasılığı olduğuna dair çalışmaları gerçekleştirmek artık mümkündür.
- Gen bilimi ile ortaklaşa çalışma sayesinde hangi bireylerin suç işlemeye eğilimli olduklarına dair tahminleme çalışmaları yapılarak bu olayların daha ortaya çıkmadan önlenmesinden, kullanıcıların yazım karakterlerinden yola çıkarak birçok olasılığın hesaplanmasına kadar pek çok kriminoloji bilgisi elde edilebilir.
- Simülasyon ortamlarındaki verileri kullanarak mühendislik alanında, üretim veya problem çözme konularında öngörüler oluşturulabilir ve çözümler üretilebilir.
- Veri madenciliği algoritmalarıyla yapılan değerlendirmeler, çok uzun zamanlar alabilecek deney ve test olaylarına gerek kalmadan, güvenilir ve daha kısa zaman alan sonuçlar elde etme imkanı sağlayabilir.
- Bankacılık faaliyetlerinde, küçük işletmelere yönelik olarak makine ve donanım satışı yapan dağıtıcı firmalarla ortak hareket ederek oluşturulacak satış paketleri ile pazarlama stratejileri geliştirilebilir.
- Mevcut müşterilerin yöneticiler tarafından daha iyi tanınmasını sağlayabilir.
- Özellikle finans sektöründe mevcut müşteriler bölümlere ayrılıp, kredi risk davranış modelleri oluşturularak, yeni başvuruda bulunan müşterilere karşı riskin minimize edilmesi sağlanabilir.
- Mevcut müşterilerin ödeme performansları incelenip kötü ödeme performansı gösteren müşterilerin ortak özellikleri belirlenerek, benzer özelliklere sahip tüm müşteriler için yeni risk yönetim politikaları oluşturulabilir.
Ülkemizde en çok kullanıldığı alanlar bankacılık, sigortacılık ve borsa olarak sıralanabilir. Kaynaklar incelendiğinde ise veri madenciliğinin en çok kullanıldığı alanlar olarak tıp, biyoloji ve genetik olarak görülmektedir.
KAYNAKLAR
[1] Aldana, W.A., “Data mining industry: emerging trends and new opportunities”, Yüksek Lisans Tezi, Massachusetts Institute of Technology, Massachusetts, 11 (2000).
[2] İnan, O., “Veri madenciliği”, Yüksek Lisans Tezi, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Konya, 1–50 (2003).
[3] Albayrak, M., “EEG sinyallerindeki epileptiform aktivitenin veri madenciliği süreci ile tespiti”, Doktora Tezi, Sakarya Üniversitesi Fen Bilimleri Enstitüsü, Sakarya, 56–70 (2008).
[4] Akgöbek, Ö. ve Çakır, F., “Veri madenciliğinde bir uzman sistem tasarımı”, Akademik Bilişim 09, Harran Üniversitesi, ġanlıurfa, 801–806 (2009).
Hiç yorum yok:
Yorum Gönder