DEEPSEEK TARAFINDAN GELİŞTİRİLEN MODELLER
DeepSeek Coder (Kasım 2023): Araştırmacılar ve ticari kullanıcılar için ücretsiz olarak sunulan bu model, özellikle kodlama görevlerine odaklanmıştır ve MIT lisansı altında açık kaynaklı olarak yayımlanmıştır.
DeepSeek LLM (Kasım 2023): 67 milyar parametreye sahip bu model, GPT-4 gibi diğer büyük dil modelleriyle rekabet edecek şekilde tasarlanmıştır. Ancak, hesaplama verimliliği ve ölçeklenebilirlik konusunda bazı zorluklarla karşılaşmıştır. Bu modelin sohbet botu versiyonu olan DeepSeek Chat de piyasaya sürülmüştür.
DeepSeek-V2 (Mayıs 2024): Bu model, rakiplerine göre daha düşük bir maliyetle (milyon çıktı tokenı başına 2 RMB) piyasaya sürülmüştür. University of Waterloo Tiger Lab'ın sıralamasında yedinci sırada yer almıştır.
DeepSeek-V3 (Aralık 2024): 671 milyar parametreye sahip bu model, yaklaşık 55 gün süren bir eğitim süreciyle 5,58 milyon ABD dolarına mal olmuştur. 14,8 trilyon tokenlık bir veri seti üzerinde eğitilmiştir ve Llama 3.1 ve Qwen 2.5 gibi modelleri geride bırakarak GPT-4o ve Claude 3.5 Sonnet ile eşdeğer performans sergilemiştir.
DeepSeek R1-Lite-Preview (Kasım 2024): Mantıksal çıkarım, matematiksel akıl yürütme ve gerçek zamanlı problem çözme yeteneklerine sahip bu model, OpenAI'nin o1 modeline benzer performans göstermiştir.