Günümüzün en önemli başlıklarından biri veri konusudur.
Veri, veri yönetimi, veri yönetişimi, büyük veri, veri analitiği, veri madenciliği, veri bilimi, veri....
Bu kadar önemli bir kavram olur da bunun bir stratejisi olmaz mı? Elbette olur.
Bugün özetini yapacağım kitap da tam bunu anlatıyor. Bernard Marr tarafından kaleme alınmış Veri Stratejisi kitabını incelemeye çalışacağız.
Kısa bir süre önceye kadar veri elektronik tablolarla veya veri tabanları ile sınırlıydı. Bu sebeple de tablolarla ifade edilemeyen veriler göz ardı ediliyordu. Ancak bugün depolama ve analitik alanlardaki ilerlemeler sayesinde çok farklı veri türlerini toplayabiliyor, depolayabiliyor ve üzerlerinde çalışabiliyoruz. Sonuç olarak bugün veri, elektronik tablolardan fotoğraflara, videolara ses kayıtlarına, yazılı metinlere veya sensör verilerine kadar her şeyi kapsayabiliyor.
Verinin bu kadar çeşitli olması oldukça önemli imkanlar ortaya koyuyor ama ne kadar çok veriye sahip olmanızın bir önemi yok, sahip olduğunuz veriyi ne kadar iyi kullandığınız önemli oluyor. Bu durum da veriden nasıl bir içgörü çıkartabileceğimizi amaçlamamızın önemli olduğunu gösteriyor. Örneğin araç sürücüsü verilerini toplamak ve bunları sigorta primlerinin düşürülmesi veya yükseltilmesinde kullanmak güzel bir amaç olabiliyor. Fakat sürücü verilerini nasılsa ileride kullanacak bir şey buluruz diye toplamak sadece verinin maliyetini arttırıyor.
Verilerin farklı şirketler veya cihazlar ile toplanması da bir sorun olarak ortada duruyor. Çünkü bunların bir araya getirilmesi ve ortak bir değer oluşturması için çalışma yapılması gerekiyor. Örneğin bir insanın Fitbit cihazı ile toplanan günlük verileri ile diğer tıbbi verilerinin bir araya getirilmesi çok daha önemli değer önerilerini ortaya çıkarabiliyor.
Verilerin eskiye göre daha fazla olmasının da ardında nesnelerin interneti kavramı var. Birçok şeyin üzerine yerleştirilebilen sensörler ve kameralar ile nesneler ile insanlar takip edilebiliyor ve buradan sağlanan veriler birçok alanda kullanılabiliyor. Bu veriler sadece ölçme ve değerlendirme amacı ile değil yapay zeka modelleri ile karar aşamalarında da kullanılabiliyor.
İş dünyasında veriyi kullanmanın üç önemli alanı vardır:
- Karar verme sürecini geliştirme: Şirketler veriler ile daha iyi pazar ve müşteri içgörüsü toplamaya çalışıyor. Böylece müşterilerin ne istediği, neyi kullandığı, ürünleri nasıl satın aldıkları vb. bilgilere erişilip ilerleyen dönemlerde yeni kampanya, ürün vb tasarımları yapılabiliyor.
- Faaliyetleri geliştirme: Şirketler verileri analiz ederek verimlilik noktasında çalışmalar gerçekleştiriyorlar. Makine performansları, raf optimizasyonları vb. hep bu şekilde yapılıyor. Örneğin sigorta formları çok hızlı doldurulduysa arkada çalışan bir model bunun sahte bir form olabileceğini düşünüp alarm çalıyor.
- Veriyi parasallaştırma: Şirketler müşterilerin verilerinden yine müşterilerin faydalanabilmesi için ortamlar sunuyorlar. Örneğin çiftçiler toprağın durumu konusunda bilgiler edinip ona göre ekim, söküm, sulama vb. yapabiliyor. Bu da onların verimini arttırabiliyor. Ayrıca bazı şirketler satın almaları veri üzerinden düşünüyor. Mesela Microsoft, Linkedin firmasını bu kapsamda satın almıştı. Sadece şirket satın almasını değil aynı zamanda şirketlerin faaliyet konusunu da düşündüğümüzde son zamanlarda değerlemesi en yüksek yapılan şirketler hep veri şirketleridir. Apple, Facebook veya Google çok önemli seviyelerde değerlemeler ile piyasada faaliyetlerini sürdürüyorlar.
İş dünyasında yapılan en büyük hatalardan biri de verinin ve analitiğin bir BT konusu olduğunu düşünmektir. BT tarafından yapılan veri stratejilerinde şirketin uzun vadeli stratejik hedeflerinden ve verinin bu hedeflere ulaşmasına nasıl yardımcı olabileceğinden ziyade, veri depolama, veri sahipliği ve veri entegrasyonu üzerine odaklanma eğilimi gösteriyor.
Büyük şirketler kurum çapında bir değer olarak veriden sorumlu olacak bir CDO (chief data officer) işe almanın faydasını görebilirler. Gartner'a göre 2019 yılında büyük kuruluşların %90'ında CDO olması planlanıyor. İdeal olarak bir CDO hem teknik hem de iş deneyimine sahip olmalıdır.
İşletmeler stratejik veri ihtiyaçlarını da tespit etmelidir. Bir işletme açısından faydalı olabilmek için verinin bir işle ilgili bir ihtiyacı karşılıyor olması gerekiyor. İşletmenin stratejik hedefine ulaşmasına yardımcı oluyor, değer oluşturuyor olması lazım. Aksi takdirde gerçek ihtiyacınız olmayacak büyük veri yığınları toplamak iyi bir fikir değildir. büyük verinin gücü verinin kendisinde değil, onu nasıl kullandığınızdadır.
Bir karar alabilmek için de bazı konuları öğrenmeye çalışırız. Hedefler ve işle ilgili temel soruları keşfedebilmek için kurumun dört alanına bakmak gerekiyor. Bunlar; müşteriler, iç işleyiş, finans ve çalışanlar. Bu alanlar ile ilgili sorular sorup, bunların verilerini analiz edip, bazı içgörülere ulaşmaya çalışırız. Sonra karar almak daha kolay olur.
Bu kararları daha kolay almak için veri üzerinde çalışma yapmak sadece bir birimin kontrolünde olmaması gerekir. Bu nedenle vatandaş veri bilimcisi ya da data citizen diye bir kavram ortaya atılmıştır. Veriyi kullanan en başarılı şirketler herkesin veriye emek ve zaman harcaması sayesinde başarılı oluyorlar. Bunu devam ettirebilmek için de data citizen lerin sayısını arttırmak istiyorlar.
Büyük veri denilince de karşımıza literatürde üç kavram çıkıyor. Hız, çeşitlilik ve hacim. Fakat bunun yanına doğruluk ve değer de kitapta karşımıza çıkıyor. Hız; verilerin özellikle sosyal medyada hızlı hareket etmesini, çeşitlilik; birçok veri tipine sahip olunmasını, hacim; verilerin kapladığı depolama alanını ve miktarını, doğruluk; verilerin karışıklığı ve dağınıklığını ama buradan bir sonuç üretebileceğimizi, değer ise verilerden elde etmeye çalıştığımız faydayı ortaya koyuyor.
Burada değer tarafı önem kazanıyor. Çünkü aslında diğer kavramları temelde değer üretmek için yapıyoruz. Buna analitik de diyoruz. İş yapma sürecimizi geliştirmeye yardımcı olacak veri toplama, işleme ve analiz etme sürecinin tamamını analitik olarak adlandırıyoruz. Farklı analitik türleri de karşımıza çıkıyor. Metin analitiği, duygu analitiği, görüntü analitiği, video analitiği, ses analitiği gibi...
İleri analitik ise makine öğrenmesi olarak karşımıza çıkıyor. Makine öğrenmesi ve bunun bir alt dalı olan derin öğrenme ile bir yazılımcı, bir bilgisayara bir sorunu nasıl çözeceğini söylemek yerine kendi kendine sorunu nasıl çözeceğini öğrenmeyi öğretiyor.
Veri ile yapmaya çalıştığımız bir yolculuksa;
- Önce veri ile ne yapacağımızı belirlememiz gerekiyor. Amacımızı tanımlamalıyız.
- Sonra veri toplamaya başlamalıyız. Bunu nasıl yapacağımıza dair planlar yapmalı ve donanımlar geliştirmeliyiz.
- Sonra bu verileri nerede tutacağımıza karar vermeliyiz. Bu da altyapı meselesini gözler önüne seriyor.
- Bunun ardından veriyi analiz etmeli, buradan bir içgörü elde etmeliyiz.
- Tüm yukarıdakileri yaparken veri konusundaki yetkinliklerimizi de geliştirmemiz lazım. Bu alanda çalışan insan kaynağının beş temel becerisinin olması gerekiyor. İş bilgisi, analitik, bilgisayar, istatistik ve matematik, yaratıcılık...
- Veri yönetişimindeki eksikleri gidermeliyiz. Bu aşamada; veri sahipliği, veri yetkilendirmesi, veri güvenliği, verilerin gizliliği gibi konular tartışılmalı, uygun yetkilendirmeler ve planlamalar yapılmalıdır.
Kitap elbette çok daha fazlasını içeriyor. müsait bir zamanınızda okumanızı temenni ederim.