28.01.2025 - 07:20 | Son Güncellenme:
Deepseek nedir sorusunun yanıtı araştırma konusu olmaya devam ediyor. 2023 yılında kurulan Çinli bir yapay zeka alanında faaliyet gösteren bir şirket olan Deepseek, en geliştirdiği model ile piyasaları alt üst etti. Kısa süre içerisinde milyonlarca kişi tarafından indirilen Deepseel R1 yapay zeka platformu hakkında bilgiler sorgulanmaya devam ediyor. Peki Deepseek nedir, kaç farklı modeli var? Neden piyasaları alt üst etti?
DeepSeek, 2023 yılında Çin'de kurulan ve yapay zeka alanında faaliyet gösteren bir şirkettir. Şirket, özellikle büyük dil modelleri (LLM) geliştirerek, kodlama, matematik ve mantıksal akıl yürütme gibi alanlarda uzmanlaşmıştır. DeepSeek'in en son modeli olan DeepSeek-V3, 600 milyar parametreye sahip olup, kodlama ve mantıksal akıl yürütme görevlerinde yüksek performans sergilemektedir. Bu model, açık kaynaklı olarak sunulmuş ve geliştiricilerin erişimine açılmıştır.
DeepSeek'in geliştirdiği modeller, yüksek performanslarına rağmen daha az işlem gücü ve maliyetle çalışabilmektedir. Bu durum, yapay zeka sektöründe maliyet etkinliği açısından önemli bir avantaj sağlamaktadır.
DEEPSEEK PİYASALARI NEDEN ALT ÜST ETTİ?
Reuters'ta yer alan habere göre Çin'in indirimli yapay zeka modelinin popülaritesinin artmasıyla birlikte dünya genelindeki teknoloji hisseleri, yatırımcıların yapay zeka sektörünün yüksek teknoloji çiplerine olan yoğun talebine olan güveninin sarsılmasıyla düşüş yaşadı.
Girişim şirketi DeepSeek, daha düşük maliyetli çipler ve daha az veri kullandığını söylediği ücretsiz bir asistanı piyasaya sürdü. Bu, finans piyasalarında yapay zekanın çip üreticilerinden veri merkezlerine kadar uzanan bir tedarik zinciri boyunca talebi artıracağı yönündeki yaygın iddiaya meydan okuyor gibi görünüyor, ifadelerine yer verildi.
DeepSeek Coder (Kasım 2023): Araştırmacılar ve ticari kullanıcılar için ücretsiz olarak sunulan bu model, özellikle kodlama görevlerine odaklanmıştır ve MIT lisansı altında açık kaynaklı olarak yayımlanmıştır.
DeepSeek LLM (Kasım 2023): 67 milyar parametreye sahip bu model, GPT-4 gibi diğer büyük dil modelleriyle rekabet edecek şekilde tasarlanmıştır. Ancak, hesaplama verimliliği ve ölçeklenebilirlik konusunda bazı zorluklarla karşılaşmıştır. Bu modelin sohbet botu versiyonu olan DeepSeek Chat de piyasaya sürülmüştür.
DeepSeek-V2 (Mayıs 2024): Bu model, rakiplerine göre daha düşük bir maliyetle (milyon çıktı tokenı başına 2 RMB) piyasaya sürülmüştür. University of Waterloo Tiger Lab'ın sıralamasında yedinci sırada yer almıştır.
DeepSeek-V3 (Aralık 2024): 671 milyar parametreye sahip bu model, yaklaşık 55 gün süren bir eğitim süreciyle 5,58 milyon ABD dolarına mal olmuştur. 14,8 trilyon tokenlık bir veri seti üzerinde eğitilmiştir ve Llama 3.1 ve Qwen 2.5 gibi modelleri geride bırakarak GPT-4o ve Claude 3.5 Sonnet ile eşdeğer performans sergilemiştir.
DeepSeek R1-Lite-Preview (Kasım 2024): Mantıksal çıkarım, matematiksel akıl yürütme ve gerçek zamanlı problem çözme yeteneklerine sahip bu model, OpenAI'nin o1 modeline benzer performans göstermiştir.