Çok büyük miktardaki verilerin otomatik veya yarı otomatik bir biçimde çözümlenip kullanılabilir bilgi haline dönüştürülmesi işlemine literatürde pek çok terim karşılık gelmektedir. Bunlardan biri de veri madenciliğidir [1]. Veri madenciliği, veri yığınları arasında kalmış gizli bilgilere ulaşma işidir. Burada madencilik terimi kullanılmasının sebebi, çok büyük veri ortamlarında uygun olan verinin aranarak ortaya çıkarılma işlemine benzetilmesidir.
Günümüzde günlük ve tarihi veriler veri ambarlarında saklanmaktadır. Saklanan bu verilerin boyutları her geçen gün daha da artmaktadır. Bu sebeple gittikçe artan veri tabanlarını kullanarak karar vermekte zorluklar yaşanmaktadır. Ek olarak veri, birçok kaynaktan da gelmekte olabilir. Sonuçta planlamayı ve kurumun başka fonksiyonlarını desteklemek için veriyi analiz etmek gerekmektedir [2]. Veri madenciliği, büyük miktarlardaki verinin içinden geleceği tahmin edilmesinde yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların bilgisayar programlarının aracılığıyla aranması ve analizidir [3].
Veri madenciliğinin uygulama alanı oldukça geniştir. Bu alanlar içerisinde, Veri Tabanı Sistemleri, Veri Görselliği, Yapay Sinir Ağları, İstatistik, Yapay Öğrenme, vb. gibi disiplinler bulunmaktadır.
Veri madenciliği yerine pek çok terim kullanılmıştır. Bazıları veri madenciliğinin belli olmayan bilgileri çıkarma anlamına ve bazıları toplanan bilgilerden bir sonuç çıkarmak anlamına gelmekte olduğunu belirtmektedirler. Belirli bir tekniğin veri madenciliği tekniği olmasını fark etmek ve belirlemek zordur. Örneğin, bazıları istatistiğe ait analiz tekniklerini veri madenciliğinin tekniklerine ait olduğunu söyleyerek tartışırlar diğerleri buna karşı çıkarlar. Örneğin, veri madenciliğiyle, tıp mallarını satan şirket reklamcılığında belli skorlara baskı yaparak kendi ürünlerinin satışını artırabilir ve bir kredi bürosu uygun ve ödemelerinde kusur olmayan adayları seçerek kendi kayıplarını sınırlayabilir. Veri madenciliği ayrıca anormal davranışı bulmak için kullanılabilir. Örneğin, bir casus ajansı bu teknolojiyi kullanarak onun çalışanları arasında anormal davranışı belirleyebilir [2].
Veri madenciliği araçları kullanılarak, işletmelerin daha etkin kararlar almasına yönelik karar destek sistemlerinde gerekli olan eğilimlerin ve davranış kalıplarının ortaya çıkarılması mümkün olmaktadır. Geçmişteki klasik karar destek sistemlerinin kullanıldığı araçlardan farklı olarak, veri madenciliğinde çok daha kapsamlı ve otomatikleştirilmiş analizler yapmaya yönelik birçok farklı özellik bulunmaktadır.
Veri madenciliğinin işletmelere sunduğu en önemli özellik, veri grupları arasındaki benzer eğilimlerin ve davranış kalıplarının belirlenmesidir. Bu fonksiyon özellikle hedef pazarlara yönelik pazarlama faaliyetlerinde yoğun olarak kullanılmaktadır [1].
Veri madenciliğinin başka bir özelliği ise daha önceden bilinmeyen bilgilerin ortaya çıkarılabilmesidir. Veri madenciliği sayesinde, veri ambarları içerisinde bulunan ancak ilk etapta görülemeyen bilgilerin ortaya çıkarılması mümkündür. Örneğin, bir firma sattığı ürünleri analiz ederek, ilerideki kampanyalarını şekillendirebilir ya da sattığı ürünler arasındaki bağları keşfedebilir. Burada amaç daha önceden fark edilmeyen veri kümelerinin bulunabilmesidir.
Veri tabanlarındaki veri kümelerinin olasılıklarını araştırmada veri madenciliğinde, istatistik alanındaki birçok yöntemin kullanılmasına rağmen nesnelerin niteliksel değerlerine bağlı çıkarım yapmada bilinen istatistiksel yöntemlerden ayrılmaktadır [1]. Özellikle veri boyutlarının ulaştığı seviye göz önüne alındığında, istatistiksel yöntemleri kullanmanın veri madenciliği algoritmalarıyla karşılaştırıldığında daha zor olduğu söylenebilir.
Veri madenciliği aslında, bilgi teknolojilerinin doğal gelişim sürecinin sonucu olarak da değerlendirilebilir çünkü bu gelişim sürecinde, bilgisayar ağları ve İnternet kullanımının artmasıyla birlikte çoğalan veriler, veri tabanlarının da gelişimini hızlandırmış ve toplanan verilerin amaçlı bilgi seviyesine ulaştırılması zorlaşmıştır. Günümüzün ekonomik koşulları ve yaşanan hızlı değişim ortamlarında, iş deneyimi ve önsezilere dayanarak alınan kararlarda, yanlış karar alma riski çok yüksektir. Riski azaltmanın tek yolu bilgiye dayalı yönetimi öngören karar destek çözümleridir. Veri madenciliği gereçleri gerçek anlamda bir karar destek sistemi oluşturmada olmazsa olmaz araçlardır. Bu noktada bilgi teknolojilerinden yararlanmak kaçınılmaz olmuştur.
Tüm bu bilgilerden yola çıkarak veri madenciliği için şöyle bir tanım yapmak mümkündür: Veri madenciliği, çok büyük miktarda bilginin depolandığı veri tabanlarından, amacımız doğrultusunda, gelecek ile ilgili tahminler yapmamızı sağlayacak, anlamlı olan veriye ulaşma ve veriyi kullanma işidir.
KAYNAKLAR:
[1]: İnan, O., “Veri madenciliği”, Yüksek Lisans Tezi, Selçuk Üniversitesi Fen Bilimleri Enstitüsü, Konya, 1–50 (2003).
[2]. Thuarisingham, B.M., “Web Data Mining and Applications in Business Intelligence and Counter Terrorism”, CRC Press LLC, Boca Raton FL USA, 35 (2003).
[3] Akpınar, H., “Veri tabanlarında bilgi keĢfi ve veri madenciliği”. İ.Ü. İşletme Fakültesi Dergisi, 29(1): 1–22 (2000).
Hiç yorum yok:
Yorum Gönder