DeepSeek, belirli görevler ve alanlar için optimize edilmiş, daha hafif ve hızlı bir model olarak tasarlandı ve bu durum onu daha verimli ve özelleşmiş kullanımlarda ChatGPT'den daha etkili hale getiriyor.
1950'li yıllardan itibaren yapay zeka üzerine konuşulmaya başladığını biliyoruz. Ancak kabul edelim ki yapay zeka elimizin altına hatta avuçlarımızın içine girene kadar ulaşılamayacak bir hayal gibi geliyordu. O tarihlerde yapay zekaya büyük bütçeler aktarılsa bile işin çözümlenebileceğini düşünmek güçtü. Şu anda hep birlikte teknolojinin baş döndürücü süratiyle birlikte olmaz denen birçok hayalin gerçekleştiğini görmeye başladığımız, birer kullanıcı olarak farklı seçeneklerden kendimize uygun olanı seçme lüksüne sahip olduğumuz bir dönemi yaşıyoruz. Bundan birkaç sene önce birisi bunların olabileceğini ve bizzat kendimizin yapabileceğini söylese güler geçerdik ama şu an bu teknolojiye sahip olmanın bizi paha biçilemez bir dünyaya götürdüğünü kabul etmemiz gerekir. İşte tam da bu noktada yapay zekanın "paha biçilemez" eşiğini geçip bize ne kadara mal olduğunu sorgular ve ne kadarlık paha biçmemizin "cebimiz için daha uygun" olacağını masaya yatırır haldeyiz. Bu analizde bu soruya yanıt ararken konuyu farklı açılardan ele alalım istiyorum.
DeepSeek neden farklı?
2015'de Elon Musk ve Sam Altman tarafından kurulan Open AI ve ChatGPT uygulaması herkes tarafından bilinmeye başlandı ve bu markalar yapay zeka denildiğinde akla ilk gelen uygulamalar oldu. Her sektörde olabileceği gibi OpenAI ve ChatGBT'nin hemen rakipleri çıkmaya başladı. Bu rakipler tahmin edebileceğiniz gibi yine Amerikan menşeili Microsoft'un Co Pilot'ı, Alphabet'in Gemini'yı, Meta'nın Llama'sıydı. Bu uygulamalar, 2025'in Ocak ayı bitmeden bir anda büyük patlama yaparak trend olan ve indirme listelerinde tüm bu rakiplerini geride bırakan Çin menşeili DeepSeek gündeme gelene kadar Büyük Dil Modelleri (LLM) pazarına hakimdi. DeepSeek'in Kurucusu Liang Wenfen 2023'te DeepSeek'i alternatiflerine göre çok daha ucuz bir fiyatla hizmete sunmuştu. Wenfen ana amacını, "Çin'in yapay zeka sektöründe takipçi, kopyalayıcı ya da taklit edici olmadan üreten konumda yer alması" olarak belirtmişti.
DeepSeek'in mühendislik kısmındaki farklılığına değinmeden geçmek istemiyorum zira uygulama rakiplerine göre inovasyonun temeli olarak içerisinde Çok Başlı Gizli Dikkat (Multi-Head Latent Attention) mekanizması bulunduruyor. Bu mekanizma, modelin farklı temsilleri aynı anda öğrenmesine ve bu temsiller üzerinden daha etkili bir şekilde odaklanmasına olanak tanıyor. Peki, bu durumu herkesin anlayabileceği şekle indirgersek DeepSeek bunu nasıl yapıyor? Bu mekanizmayı bir otomobilde farklı sensörlerin aynı anda farklı veriler toplaması ya da bir projede farklı mühendislerin her birinin kendi uzmanlık alanında çalışması ve sonunda tüm bilgiyi bir araya getirmesi gibi basitçe tanımlayabiliriz.
DeepSeek'i en önemli rakibi ChatGPT ile kıyasladığımızda karşımıza şu sonuç çıkıyor. DeepSeek, belirli görevler ve alanlar için optimize edilmiş, daha hafif ve hızlı bir model olarak tasarlandı ve bu durum onu daha verimli ve özelleşmiş kullanımlarda ChatGPT'den daha etkili hale getiriyor. Bu noktada, ChatGPT ise genel amaçlı bir model olarak daha geniş bir kullanım alanı sunuyor ancak bu genişlik modelin belirli görevlerde verimlilikten ödün vermesine neden olabilir.
Yapay zeka artık daha ucuza mı üretilecek?
DeepSeek'in düşük maliyetle ve az sayıda çip kullanarak yapay zeka modelleri geliştirmesi, üretim maliyetlerini önemli ölçüde düşürebilecek bir gelişmedir. Özellikle Amerika Birleşik Devletleri (ABD) Başkanı Donald Trump ve Sam Altman da benzer yönde açıklama yaptı. Tabii ki bu durumun geniş çapta bir maliyet düşüşüne yol açıp açmayacağı birkaç faktöre bağlıdır.
Büyük ölçekli yapay zeka modelleri genel olarak yüksek enerji tüketen grafik işlem birimleri (GPU) veya özel yapay zeka çipleri (Tensor Processing Unit) gerektirirken DeepSeek'in bu konuya daha optimize çözümler ürettiği görülüyor. Donanım maliyeti ve pazar etkisiyle NVIDIA gibi büyük çip üreticilerinin yapay zeka modelleri için yüksek performanslı ve oldukça yüksek fiyatlı ürettiği çipler yerine daha az çiple benzer performans sunabiliyorsa donanım üreticileri üzerindeki baskı artabilir ve fiyatlarda düşüş görülebilir. Bu noktada, DeepSeek fırtınasının NVIDIA'ya bir günde yaklaşık 600 milyar dolar kayıp yaşattığını göz ardı etmemek gerekir.
DeepSeek'in geliştirdiği teknoloji, yalnızca kendi şirketine özel kalırsa yapay zeka üretim maliyetleri küresel ölçekte düşmeyebilir. Ancak bu tür verimli yapılar yaygınlaşır ve açık kaynak olarak paylaşılırsa yapay zeka üretiminde genel bir maliyet düşüşü yaşanabilir. Bu durumda araştırma ve geliştirme (AR-GE) ve model eğitim maliyetleri de ucuzlamada yer alacak en önemli etkenlerden biri ve geliştirilmesi genellikle büyük bir maliyet gerektirir. Daha az çip kullanarak verimli modeller oluşturmak büyük teknoloji şirketlerinin maliyetlerini azaltabilir ancak bu uzun vadede sürdürülebilir olmazsa yapay zeka herkes için ucuz hale gelmeyebilir. Eğer diğer şirketler de benzer teknikleri benimserse yapay zeka çözümlerinin fiyatlarında kademeli bir düşüş görmek mümkün olabilir.
Deepseek'in piyasaya sürülmesi sonrası yapay zeka şirketleri arasındaki rekabetin kızışacağını tahmin etmek zor değil. Yukarıda belirttiğimiz bayrağı taşıyan ve bilinen şirketler, daha güçlü ve verimli yapay zeka modelleri geliştirerek yanıt verebilirken özellikle Çin merkezli bir şirketin global çapta hızla yayılması Batılı şirketleri stratejilerini gözden geçirmeye itecektir. Bu noktada, Batılı şirketler yapay zeka hizmet modellerini çeşitlendirerek daha fazla ücretsiz abonelik uygulamalarıyla modellerini toplumla daha entegre hale getirebilir.
Konuyu uygulama bazında değerlendirmemiz gerekirse şirketler, genel amaçlı yapay zeka modellemeleri yerine finans, sağlık, hukuk gibi belirli sektörlere özel modeller geliştirmeye yönelebilir. Daha fazla açık kaynak yapay zeka modeli piyasaya sürülerek bağımsız geliştiricilere ve şirketlere alternatifler sunulabilir.
Kullanıcı açısından fiyatı bir kenara bırakıp kullanıma odaklandığımızda yapay zeka şirketleri daha doğal ve sezgisel ara yüzler geliştirmeye odaklanarak son kullanıcının yapay zekayı kendi ihtiyaçlarına göre özelleştirebileceği platformları popülerleştirebilir.
ABD ve Çin arasındaki ticaret rekabetini teknoloji bazında yapay zekaya ölçeklendirecek olursak Çin hükümetinin yapay zeka şirketlerine verdiği destek sayesinde DeepSeek, pazar payını hızla artırabilirken ABD, Çin'in yapay zeka gelişim hızını sınırlamak için çip ihracatı gibi kısıtlamalarını artırabilir. Bu tespitlerin içerisinde yelpazeyi genişletecek bir diğer önemli konu ise Avrupa'nın bu yarışa nasıl dahil olacağıdır.
DeepSeek yapay zeka devlerine ne öğretti?
DeepSeek büyük yapay zeka modellerinin aksine daha az çiple ve daha düşük maliyetle çalışıyor ancak şunu da kabul etmek gerekir ki, nasıl Amerikan firmaları kendi bilgilerinin diğer ülkeler tarafından kullanımının ya da değer çıkarımının minimumda olmasına özen gösteriyorlar ve bu doğrultuda yerli malı kullanıyorlarsa aynı mantık Çinli firmalar için de geçerlidir.
Bu aşamada, her ülke kendi ürününü kullanmayı hedefliyorsa burada karşımıza Çin'in 1,5 milyara yaklaşan nüfusuyla süreci kendi lehine çevirebileceğine dair önemli bir ipucu karşımıza çıkıyor. Global pazarda kendi ürünlerinizi diğer ülkelerin kamu, kurum ve bireylerine ne kadar kullandırabilirseniz o kadar büyüyorsunuz. Trilyon dolarlık firmaların çoğu benzer şekilde dünya üzerindeki her cihaza erişebilir ve haliyle bunun kaymağını yer durumda. Bu açıdan baktığımızda da esas başarının global bazda yayılma sonucunda geleceği aşikar.
Son olarak, halihazırda henüz çok başlarında olduğumuz ve deneyimlemediğimiz Yapay Genel Zeka (AGI) ve Yapay Süper Zeka (ASI) adımlarını, olabildiğince hızlı gelişen bu teknolojik düzlemde ilk kimin atacağı ve bu aşamalarda öncü olacağı unutulmaması gereken önemli noktalardan biridir. Rekaberlik kavramı burada da karşımıza çıkıyor ve insanlık her geçen gün süreçlere daha adapte olmaya devam ediyor.