Veri Bilimi (Data Science) Nedir? Nasıl Öğrenilebilir ve Kullanılan Diller Nelerdir?

Cansu Candan
3 min readDec 17, 2020

Yapay Zeka trendlerinden ve alt dallarından biri olan Veri Bilimi günümüzde popülerliği oldukça artmıştır. Zaman zaman yapay zeka ve bunun yanı sıra Veri Bilimi hakkında bir çok sitede, sunumlarda, kurslarda pek çok şey duymuşuzdur. Günden güne geleceğin bir parçası olan Veri Bilimi’ni öğrenmek isteyen ve bu bilim nedir diye merak edenlerin sayısı her geçen gün artmaktadır. Peki veri bilimi nedir, nasıl öğrenebiliriz?

Ayrıca Yapay zeka nedir? İş olanakları ve uygulama örneklerini bir önceki bloğumdan okuyabilirsiniz.

Veri Bilimi Nedir?

Veri bilimi yapay zekanın alt dallarından biridir. Yani bu demek oluyor ki geleceğin meslekleri arasında yer almaktadır. Veri günümüzde gerek şirketler gerekse işletmelerde çok büyük bir öneme sahiptir. Teknoloji geliştikçe ve verilerimiz dijital ortama aktarıldıkça veriler bir insanın sayamayacağı kadar büyük miktarda olabilmektedir. Bu verileri ise işlemeden ham bir şekilde tutmak ise çok büyük bir iş yükü gerektirir ve ham bir veri çok bir işimize yaramaz. Veriyi etkili ve yerinde kullanabilmek önemlidir.

Veri Bilimi, istatiksel ve sayısal becerileri kullanarak, güvenli ve verimli bir şekilde toplanan verilerden faydalı bilgiler çıkarmaktır. Yani verilerimizi sınıflandırarak ve görselleştirerek verilerden anlam çıkartırız. Bu anlamlar neticesinde kurumlar ve şirketler kendilerine en yüksek derecede fayda sağlayabilecek kararlar alabilirler.

Peki Veri’yi nasıl etkili kullanabiliriz?

Veri günümüzde çok önemlidir dedik. Veri’yi etkili bir biçimde kullanmaya girmeden önce verinin neden bu kadar önemli olduğundan bahsedelim. Günlük yaşantımızda her şey dijital ortama aktarılır, alışveriş ve sosyalleşme gibi ihtiyaçlarımızı teknoloji üzerinden gerçekleştiririz. Tıkladığınız her site, her bir ürün hatta internet üzerindeki her bir hareketiniz bir veridir. Bu verilerden yola çıkarak kişilerin hangi ürünü incelediği, hangi sitede ne kadar süre geçirdiği verileri tutularak bunlar üzerinden işlem yapılır. Buna bir örnek vermek gerekirse bir online alışveriş sitesinden baktığınız bir ürünün ertesi günü benzeri ürünler göstermesidir.

Veri’yi etkili kullanmaya gelirsek bir önceki paragraftan verinin önemini anlamışızdır. Biraz daha detayına inersek büyük markaların verilerden yola çıkarak kararlar vermesinde, kurumların veriler üzerinden hareket etmeleri ileride alacağı kararlarda büyük öneme sahip olabiliyor. Verilerden yola çıkarak gelecek tahminlerimizi veriler üzerinden yapabiliriz. Peki verileri nasıl etkili kullanabiliriz?

  1. Verilerinizi depolayın
  2. Verilerinizi bütünleştirin
  3. Analizler yapın
  4. Verilerinizi anlamlı hale getirin
  5. Ve son olarak verilerinizi işleyin

Bu adımları gerçekleştirerek verilerinizi anlamlı hale getirebilirsiniz. Unutmayın ki bu adımlardan her biri çok önemlidir. Verileriniz var olabilir ancak veriyi işleme aşamasını gerçekleştiremezseniz verilerinizin bir anlamı olmaz veya verileriniz yeterli değilse ileride vereceğiniz kararlarda yanılma durumunuz olabilir. Bu durum büyük şirketler ve veri ile ilgilenen kişiler için oldukça önemlidir.

Veri Bilimi’ni öğrenmek için neler yapılmalıdır?

Temel olarak problem belirlenir. Yani hangi veriyle ne tür bir sonuca ulaşacağız, hedeflerimizde neler var bu konular belirlenir. Analiz edeceğimiz veriyi toplayıp bunu anlamlı hale getiririz. Burada verilerimizi anlamaya çalışacağız. Daha sonra topladığımız verileri modellemeden önce hazırlamamız gerekebilir. Veri seti olarak adlandırdığımız verilerimizi yapısal bozukluklar ve düzenlememiz gereken kısımlar olabilir. Bu veri setini hazırladıktan sonra modelleme aşamasına geçebiliriz. Modelleme aşaması ise kısaca verilerimizi fonksiyonlara, algoritmalarla eğitmektir. Modelleme tekniklerinden birisi de “çoklu doğrusal regresyon modeli”dir. Modelleme aşamasını bitirdikten sonra kurduğumuz modelin değerlendirilmesi gerekir. Yani oluşturduğumuz modelin başarılı olup olmadığını irdeleriz. Modelimizin başarı aralığı örneğin 0 ile 1 aralığındadır. Hedeflediğimiz modelin çıktı durumunda 1'e ne kadar çok yakınsa o kadar çok başarılı bir modeldir. 1'e yakın değilse farklı modeller de denenebilir. Son olarak elde ettiğimiz değerler ve modellerimizi ilişkilendirmek istediğimiz sisteme dahil ederek gerçek hayata geçirebiliriz.

Veri Bilimi’nde hangi programlama dilleri kullanılır?

Veri Bilimcilerin kullandığı bazı popüler dillerden bahsedelim. Tabi her Veri Bilimci’nin farklı dil kullanmasının nedenlerinden bazıları her programlama dilinin avantajı ve dezavantajının olmasıdır. Performans ve verimliliğin olması o programlama dilinin tercih edilmesini sağlar. Ayrıca kaynak da bir o kadar önemlidir. Geliştiriciler program yazarken karşılaştığı sıkıntılar veya yaptığı araştırmalarda kaynağa kolay ulaşabilmesi de o dilin popülerliğini arttırmaktadır.

● R

● Python

● SQL

● JAVA

● MATLAB

● Julia

● Scala

Buraya kadar geldiğiniz için teşekkürler 🤗Görüşlerinizi yorumlarda lütfen bildirin. 😊

“Yapay Zeka nedir” başlıklı bloğumu okumak için 👇

https://cansucandan.medium.com/yapay-zeka-nedir-2cfe9aae4331

Yapay Zeka(Artificial Intelligence) Uygulama Örnekleri ve İş Olanaklarıbaşlıklı bloğumu okumak için 👇

https://cansucandan.medium.com/yapay-zeka-artificial-intelligence-uygulama-%C3%B6rnekleri-ve-i%CC%87%C5%9F-olanaklar%C4%B1-34542ee916a3

--

--