Derin Öğrenme (Deep Learning) Nedir ve Nasıl Çalışır?

Derin Öğrenme (Deep Learning) bir makine öğrenme yöntemidir. Verilen bir veri kümesi ile çıktıları tahmin edecek yapay zekâyı eğitmemize olanak sağlar. Yapay zekâyı eğitmek için hem denetimli hem de denetimsiz öğrenme kullanılabilir.

Derin öğrenme, esasen üç veya daha fazla katmana sahip bir sinir ağı olan makine öğreniminin bir alt kümesidir. Bu sinir ağları, insan beyninin davranışını simüle etmeye çalışır - her ne kadar onun yeteneğiyle eşleşmekten uzak olsa da - onun büyük miktarda veriden "öğrenmesine" olanak tanır. Tek katmanlı bir sinir ağı yine de yaklaşık tahminler yapabilirken, ek gizli katmanlar doğruluk için optimizasyona ve iyileştirmeye yardımcı olur.

Yapay Sinir Ağları (Neural Networks)

Yapay sinir ağları tıpkı insan beyni gibi nöronlardan oluşur. Tüm nöronlar birbirine bağlıdır ve çıktıyı etkilemektedir.

Nöronlar üç farklı katmana ayrılır:

     1. Giriş Katmanı
     2. Gizli Katman(lar)
     3. Çıkış Katmanı

Giriş katmanı giriş verilerini alır. Bizim örneğimizde, giriş katmanında dört nöron var: Kalkış Havaalanı, Varış Havaalanı, Kalkış Tarihi ve Firma. Giriş katmanı, girişleri ilk gizli katmana gönderir.

Gizli katmanlar girdilerimizde matematiksel hesaplamalar yapar. Yapay sinir ağları oluşturmadaki zorluklardan biri, her bir katman için nöronların sayısının yanı sıra gizli katmanların sayısına da karar vermektir. Derin Öğrenmedeki “Derin”, birden fazla gizli katmana sahip olmayı ifade eder.

Çıktı katmanı, çıktı verilerini döndürür. Bizim örneğimizde, bize fiyat tahmini verir.

Derin Öğrenmenin Gerçek Dünyadan Örnekleri

Google'da her arama yaptığınızda derin öğrenme uygulamaları ile karşılaşırsınız. Ayrıca sürücüsüz araçlar ve kanser teşhisi gibi daha karmaşık senaryolarda da kullanılır. Bu senaryolarda makine neredeyse her zaman düzensizlikleri arar. Makinenin verdiği kararlar, en olası sonucu tahmin etmek için olasılığa dayanmaktadır. Açıkçası, otonom sürüş veya tıbbi test durumunda doğruluk daha önemlidir, bu nedenle bilgisayarlar eğitim verileri ve öğrenme teknikleri açısından titizlikle test edilir.

Derin öğrenmenin günlük örnekleri, nesne tanıma için bilgisayarlı görme ve ses aktivasyonu için doğal dil işleme ile zenginleştirilmiştir. Konuşma tanıma, Siri veya Alexa gibi sesle etkinleştirilen asistanların kullanımıyla aşina olduğumuz bir işlevdir, ancak bir makinenin doğal dili tanıma yeteneği, şaşırtıcı şekillerde yardımcı olabilir. Replika "Yapay Zekâ Arkadaşım" olarak da anılan, aslında kullanıcıyı sorgulayarak tanıyan bir sohbet robotudur. Bilgi toplamak amacıyla kullanıcıyla sürekli bire bir görüşme yapmak için bir sinir ağını kullanır. Replika zamanla kullanıcı gibi konuşmaya başlayarak duygu ve empati izlenimi veriyor. Nisan 2020'de, salgının zirvesinde, yarım milyon kişi Replika'yı indirdi; bu, yapay zekâya olan merakı ve aynı zamanda insan özelliklerini yansıtsa bile yapay zekâya ihtiyaç duyulduğunu gösteriyor. Bu yeni bir fikir değil, çünkü 1966'da bilgisayar bilimcisi Joseph Weizenbaum, bilgisayar terapisti ELIZA programıyla sohbet robotunun öncüsünü yarattı.

ÖZETLE…

- Derin Öğrenme, hayvan zekâsını taklit etmek için Yapay Sinir Ağlarını kullanır.
- Bir sinir ağında üç tür nöron katmanı vardır: Giriş Katmanı, Gizli Katmanlar ve Çıkış Katmanı.
- Nöronlar arasındaki bağlantılar, giriş değerinin önemini belirleyen bir ağırlıkla ilişkilendirilir.
- Nöronlar, nörondan çıkan çıktıyı “standartlaştırmak” için verilerde bir Aktivasyon Fonksiyonu kullanırlar.
- Yapay sinir ağını eğitmek için büyük bir veri kümesine ihtiyaç vardır.
- Veri kümesi boyunca yineleme yapmak ve çıktıları karşılaştırmak, yapay zekânın gerçek çıktılardan ne kadar uzakta olduğunu gösteren   bir Maliyet Fonksiyonu üretecektir.
- Veri kümesindeki her yinelemeden sonra, maliyet fonksiyonunu azaltmak için nöronlar arasındaki ağırlıklar Gradient Descent   kullanılarak ayarlanır.

Derin öğrenme donanım gereksinimleri

Derin öğrenme muazzam miktarda bilgi işlem gücü gerektirir. Yüksek perfonmanslı grafik işlem birimleri (GPU’lar) idealdir çünkü bol miktarda belleğe sahip birden çok çekirdekte büyük hacimli hesaplamaları işleyebilirler. Ancak şirket içinde birden fazla GPU'yu yönetmek, dahili kaynaklar üzerinde büyük bir talep yaratabilir ve ölçeklendirmesi inanılmaz derecede maliyetli olabilir.