veri etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
veri etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

12 Ocak 2021 Salı

2017 Cambridge Analytica Skandalı

Whatsapp’ın kullanıcı verilerini ticari amaçlar için izin istemesi ile tüm dünya çapında Whatsapp’a karşı büyük bir tepki oluştu. İnsanlar verilerinin bu şekilde kullanılmasını istemiyorlardı. Aslında işin ne boyutlara varacağı hakkında endişeleri vardı. Bir de şirketin sahibi Facebook firmasının 2017 yılında yaşamış olduğu Cambridge Analytica skandalı halen hafızalarda.

2019 yılında vizyona giren Great Hack ve 2020 yılında izleyici ile buluşan Social Dilemma filmleri bu konuyu ele alıyor. Temel soru şu; verilerimiz ile neler yapılıyor?

Şimdi bu konulara biraz daha yakından bakalım.

Cambridge Analytica bir veri şirketi. Şirket, insanların sosyal medyada yer alan verilerinden yola çıkarak kullandıkları analitik modeller ile kullanıcıların siyasi eğilimlerini anlamaya çalışıyordu. Şirket, insanların tercihlerini değiştirmesini veya oy vermeyecek olanların oy vermesini sağlamaya gayret ediyordu.

Böyle tanımlandığında veriden yola çıkarak bir kampanya politikası izlendiği anlaşılıyor. Masum gibi görünüyor ama aslında öyle mi?

Buradaki en çarpıcı konulardan biri, insanların 5.000 ayrı veri noktasından izlenmesidir. Facebook üzerinden insanların beğenilerini izleyerek veri toplamışlar. Bunun sonrasında tercihini değiştirebileceklerine inandıkları insanlara farklı sosyal medya platformlarında özel kampanyalar tasarlamışlar. Onların kişisel yargılarını seçim davranışına dönüştürmeye çalışmışlar.

Verilerinin kullanılmasına izin veren insanları değil onların tüm arkadaşları ile birlikte yaklaşık 50 milyon ABD vatandaşının verisini toplamışlar.

Peki, bunu nasıl bir süreç ile gerçekleştirmişler? 

Cambridge Üniversitesi'nde bir veri bilimcisi olan Aleksandr Kogan, buisyourdigitallife adında bir uygulama geliştirdi. Uygulamayı Cambridge Analytica'ya verdi. Cambridge Analytica, birkaç yüz bin Facebook kullanıcısından yalnızca akademik kullanım için bir anketi tamamlamasını istedi. Ancak Facebook'un tasarımı bu uygulamayı yalnızca ankete katılmayı kabul eden kişilerin kişisel bilgilerini değil, aynı zamanda bu kullanıcıların Facebook sosyal ağındaki tüm kişilerin kişisel bilgilerini de toplamasına izin verdi. Bu şekilde Cambridge Analytica, 50 milyon Facebook kullanıcısı hakkında veri topladı.

Peki, bunları nerede kullanmışlar?

Ted Cruz’un 2015 yılındaki kampanyası, 2016 yılındaki Brexit oylaması ve 2016 yılındaki Amerikan seçimleri en öne çıkan uygulamalar.

Tam olarak neler oldu? Kayıtsız kalanların oy vermesini sağladılar. İnsanların eyleme geçmelerini sağlayacak nedenleri bulup onların psikolojilerine oynayıp, kampanyanın hedeflerine göre tercihlerini yapmalarını sağlamışlar. Böylece bir anlamda oy verenlerin seçim özgürlüklerine müdahalede bulunmuşlar.

Kaynaklarının çoğunu kararlarını değiştirebileceklerine harcamışlar. Bu insanlara özel videolar, yazılar vb hazırlamışlar. Daha sonra da kararı değiştirmiş mi diye bakmışlar. Bir post gönderip beğenip beğenmediğini kontrol etmişler.

İnsanlar bu olay ortaya çıkınca, kendileri üzerinde yapılanları kabul edememişler. Çünkü siyasi tercihlerinin değiştirildiğine inanamamışlar. Demokrasinin böylece yara almasını akılları almamış.

Sadece ABD mi? Trinidad ve Tobago’da kampanya yapıp oy verme demişler. Litvanya, Gana, Malezya, Nijerya gibi yerlerde de çalışmışlar. Dünyanın birçok ülkesinde analitik çalışmalar ile kampanyalar düzenlemişler. Rusya’nın ABD’nin içerisindeki çeşitli gösteri ve olayları arttırmak için Cambridge Analytica'yı kullandığı iddiası bile ortaya atılmış.

Kampanyadan sonra Facebook verilerini sileceklerini söylemişler ama silmemişler.

Great Hack filminde şöyle bir anektod vardı. Savaşmanın iki yolu vardır. Ya askeri operasyon yaparsın ya da karşı tarafın liderinin iyi olmadığına onları inandırırsın.

Burada şöyle bir hikayeyi de aktarmadan geçemeyeceğim.

Cengiz Han yaklaşan ordusunun önünde bazı casusları düşman devletlerin şehirlerine gönderirdi. Sıradan köylüler gibi giyinen bu casuslar, sessizce düşman kamplarına sızar ve oranın liderine bağlılıklarını sunarlardı. Bir kez Han’ın düşmanları tarafından kabul edildiler mi, Han’ın ordusunun büyüklüğü, yenilmezliği ve gücü hakkında etrafta ürkütücü öyküler yayarlardı. Bu öyküleri dinleyen askerler ve komutanlar Cengiz Han’a teslim olmaktan başka çareleri olmadığını düşünürdü. Han da savaşmadan zafer kazanmış olurdu. Bu firmanın yaptığı da aslında buydu. İnsanların arasında söylenti yayarak kendi liderlerine olan güvenin azalmasına sebep oluyorlar ve ülke içerisinde kargaşa çıkmasına ortam hazırlıyorlardı.

Bu ve buna benzer işler gösteriyor ki eğer bir uygulamayı ücretsiz kullanıyorsanız o zaman ürün sizsiniz. Bunu hiçbir zaman aklımızdan çıkarmamamız gerekiyor. 

2 Ekim 2020 Cuma

Veri Stratejisi Kitap Özeti

Günümüzün en önemli başlıklarından biri veri konusudur. 

Veri, veri yönetimi, veri yönetişimi, büyük veri, veri analitiği, veri madenciliği, veri bilimi, veri....

Bu kadar önemli bir kavram olur da bunun bir stratejisi olmaz mı? Elbette olur.

Bugün özetini yapacağım kitap da tam bunu anlatıyor. Bernard Marr tarafından kaleme alınmış Veri Stratejisi kitabını incelemeye çalışacağız.


Kısa bir süre önceye kadar veri elektronik tablolarla veya veri tabanları ile sınırlıydı. Bu sebeple de tablolarla ifade edilemeyen veriler göz ardı ediliyordu. Ancak bugün depolama ve analitik alanlardaki ilerlemeler sayesinde çok farklı veri türlerini toplayabiliyor, depolayabiliyor ve üzerlerinde çalışabiliyoruz. Sonuç olarak bugün veri, elektronik tablolardan fotoğraflara, videolara ses kayıtlarına, yazılı metinlere veya sensör verilerine kadar her şeyi kapsayabiliyor.

Verinin bu kadar çeşitli olması oldukça önemli imkanlar ortaya koyuyor ama ne kadar çok veriye sahip olmanızın bir önemi yok, sahip olduğunuz veriyi ne kadar iyi kullandığınız önemli oluyor. Bu durum da veriden nasıl bir içgörü çıkartabileceğimizi amaçlamamızın önemli olduğunu gösteriyor. Örneğin araç sürücüsü verilerini toplamak ve bunları sigorta primlerinin düşürülmesi veya yükseltilmesinde kullanmak güzel bir amaç olabiliyor. Fakat sürücü verilerini nasılsa ileride kullanacak bir şey buluruz diye toplamak sadece verinin maliyetini arttırıyor. 

Verilerin farklı şirketler veya cihazlar ile toplanması da bir sorun olarak ortada duruyor. Çünkü bunların  bir araya getirilmesi ve ortak bir değer oluşturması için çalışma yapılması gerekiyor. Örneğin bir insanın Fitbit cihazı ile toplanan günlük verileri ile diğer tıbbi verilerinin bir araya getirilmesi çok daha önemli değer önerilerini ortaya çıkarabiliyor.

Verilerin eskiye göre daha fazla olmasının da ardında nesnelerin interneti kavramı var. Birçok şeyin üzerine yerleştirilebilen sensörler ve kameralar ile nesneler ile insanlar takip edilebiliyor ve buradan sağlanan veriler birçok alanda kullanılabiliyor. Bu veriler sadece ölçme ve değerlendirme amacı ile değil yapay zeka modelleri ile karar aşamalarında da kullanılabiliyor. 

İş dünyasında veriyi kullanmanın üç önemli alanı vardır:

- Karar verme sürecini geliştirme: Şirketler veriler ile daha iyi pazar ve müşteri içgörüsü toplamaya çalışıyor. Böylece müşterilerin ne istediği, neyi kullandığı, ürünleri nasıl satın aldıkları vb. bilgilere erişilip ilerleyen dönemlerde yeni kampanya, ürün vb tasarımları yapılabiliyor.

- Faaliyetleri geliştirme: Şirketler verileri analiz ederek verimlilik noktasında çalışmalar gerçekleştiriyorlar. Makine performansları, raf optimizasyonları vb. hep bu şekilde yapılıyor. Örneğin sigorta formları çok hızlı doldurulduysa arkada çalışan bir model bunun sahte bir form olabileceğini düşünüp alarm çalıyor. 

- Veriyi parasallaştırma: Şirketler müşterilerin verilerinden yine müşterilerin faydalanabilmesi için ortamlar sunuyorlar. Örneğin çiftçiler toprağın durumu konusunda bilgiler edinip ona göre ekim, söküm, sulama vb. yapabiliyor. Bu da onların verimini arttırabiliyor. Ayrıca bazı şirketler satın almaları veri üzerinden düşünüyor. Mesela Microsoft, Linkedin firmasını bu kapsamda satın almıştı. Sadece şirket satın almasını değil aynı zamanda şirketlerin faaliyet konusunu da düşündüğümüzde son zamanlarda değerlemesi en yüksek yapılan şirketler hep veri şirketleridir. Apple, Facebook veya Google çok önemli seviyelerde değerlemeler ile piyasada faaliyetlerini sürdürüyorlar.  

İş dünyasında yapılan en büyük hatalardan biri de verinin ve analitiğin bir BT konusu olduğunu düşünmektir. BT tarafından yapılan veri stratejilerinde şirketin uzun vadeli stratejik hedeflerinden ve verinin bu hedeflere ulaşmasına nasıl yardımcı olabileceğinden ziyade, veri depolama, veri sahipliği ve veri entegrasyonu üzerine odaklanma eğilimi gösteriyor.

Büyük şirketler kurum çapında bir değer olarak veriden sorumlu olacak bir CDO (chief data officer) işe almanın faydasını görebilirler. Gartner'a göre 2019 yılında büyük kuruluşların %90'ında CDO olması planlanıyor. İdeal olarak bir CDO hem teknik hem de iş deneyimine sahip olmalıdır. 

İşletmeler stratejik veri ihtiyaçlarını da tespit etmelidir. Bir işletme açısından faydalı olabilmek için verinin bir işle ilgili bir ihtiyacı karşılıyor olması gerekiyor. İşletmenin stratejik hedefine ulaşmasına yardımcı oluyor, değer oluşturuyor olması lazım. Aksi takdirde gerçek ihtiyacınız olmayacak büyük veri yığınları toplamak iyi bir fikir değildir. büyük verinin gücü verinin kendisinde değil, onu nasıl kullandığınızdadır.

Bir karar alabilmek için de bazı konuları öğrenmeye çalışırız. Hedefler ve işle ilgili temel soruları keşfedebilmek için kurumun dört alanına bakmak gerekiyor. Bunlar; müşteriler, iç işleyiş, finans ve çalışanlar. Bu alanlar ile ilgili sorular sorup, bunların verilerini analiz edip, bazı içgörülere ulaşmaya çalışırız. Sonra karar almak daha kolay olur. 

Bu kararları daha kolay almak için veri üzerinde çalışma yapmak sadece bir birimin kontrolünde olmaması gerekir. Bu nedenle vatandaş veri bilimcisi ya da data citizen diye bir kavram ortaya atılmıştır. Veriyi kullanan en başarılı şirketler herkesin veriye emek ve zaman harcaması sayesinde başarılı oluyorlar. Bunu devam ettirebilmek için de data citizen lerin sayısını arttırmak istiyorlar. 

Büyük veri denilince de karşımıza literatürde üç kavram çıkıyor. Hız, çeşitlilik ve hacim. Fakat bunun yanına doğruluk ve değer de kitapta karşımıza çıkıyor. Hız; verilerin özellikle sosyal medyada hızlı hareket etmesini, çeşitlilik; birçok veri tipine sahip olunmasını, hacim; verilerin kapladığı depolama alanını ve miktarını, doğruluk; verilerin karışıklığı ve dağınıklığını ama buradan bir sonuç üretebileceğimizi, değer ise verilerden elde etmeye çalıştığımız faydayı ortaya koyuyor. 

Burada değer tarafı önem kazanıyor. Çünkü aslında diğer kavramları temelde değer üretmek için yapıyoruz. Buna analitik de diyoruz. İş yapma sürecimizi geliştirmeye yardımcı olacak veri toplama, işleme ve analiz etme sürecinin tamamını analitik olarak adlandırıyoruz. Farklı analitik türleri de karşımıza çıkıyor. Metin analitiği, duygu analitiği, görüntü analitiği, video analitiği, ses analitiği gibi...

İleri analitik ise makine öğrenmesi olarak karşımıza çıkıyor. Makine öğrenmesi ve bunun bir alt dalı olan derin öğrenme ile bir yazılımcı, bir bilgisayara bir sorunu nasıl çözeceğini söylemek yerine kendi kendine sorunu nasıl çözeceğini öğrenmeyi öğretiyor.  

Veri ile yapmaya çalıştığımız bir yolculuksa;

- Önce veri ile ne yapacağımızı belirlememiz gerekiyor. Amacımızı tanımlamalıyız.

- Sonra veri toplamaya başlamalıyız. Bunu nasıl yapacağımıza dair planlar yapmalı ve donanımlar geliştirmeliyiz.

- Sonra bu verileri nerede tutacağımıza karar vermeliyiz. Bu da altyapı meselesini gözler önüne seriyor.  

- Bunun ardından veriyi analiz etmeli, buradan bir içgörü elde etmeliyiz. 

-  Tüm yukarıdakileri yaparken veri konusundaki yetkinliklerimizi de geliştirmemiz lazım. Bu alanda çalışan insan kaynağının beş temel becerisinin olması gerekiyor. İş bilgisi, analitik, bilgisayar, istatistik ve matematik, yaratıcılık...

- Veri yönetişimindeki eksikleri gidermeliyiz. Bu aşamada; veri sahipliği, veri yetkilendirmesi, veri güvenliği, verilerin gizliliği gibi konular tartışılmalı, uygun yetkilendirmeler ve planlamalar yapılmalıdır.

Kitap elbette çok daha fazlasını içeriyor. müsait bir zamanınızda okumanızı temenni ederim.