Çin merkezli yapay zeka teşebbüsü DeepSeek, kısa müddet içinde piyasaya sürmeyi planladığı yeni büyük lisan modeli (LLM) DeepSeek-R2 ile tekrar gündeme geldi.
DAHA GENİŞ MANTIKSAL DÜŞÜNME
Huawei’nin Ascend 910B çip kümesiyle çalışan modelin 15-30 Ağustos ortasında tanıtılması bekleniyor. 512 PetaFLOPS süreç gücüne ulaşan sistem, evvelki R1 modeline nazaran daha gelişmiş mantıksal düşünme, karşılık verme ve vazife verimliliği sunacak. Şirket, maliyet aktifliği, açık kaynak yapısı ve verimliliği müdafaayı hedefliyor.
NVIDIA PAYLARINDA TARİHİ BEDEL KAYBONA YOL AÇMIŞTI
DeepSeek, ocak ayında tanıttığı R1 modeliyle ABD teknoloji dünyasında şok tesiri yaratmıştı. Apple’ın ABD uygulama mağazasında en çok indirilen fiyatsız uygulama olan DeepSeek-R1, geliştirme maliyeti olarak sırf 5,6 milyon dolar harcandığını argüman ederek OpenAI’nin milyarlarca dolarlık GPT modellerine rakip olmuştu. Bu durum, Nvidia paylarında tarihin en büyük tek günlük bedel kaybına yol açmıştı.
ABD’DE GÜVENLİK ENDİŞELERİ
R1’in başarısı, “büyüğün her vakit daha uygun olduğu” anlayışını sorgulatmış, daha küçük lakin verimli modellerin de yüksek performans sunabileceğini göstermişti. Lakin şirket, Çin’deki bilgi merkezleri ve Pekin idaresiyle muhtemel kontakları nedeniyle ABD’de güvenlik telaşlarıyla karşı karşıya kalmıştı.
Uzmanlara nazaran DeepSeek, R2 ile tekrar global rekabete dahil olmak istese de yüksek performanslı çip tedarikinde yaşanan meşakkatler ve hem ABD hem de Çin’de artan rekabet, şirketin ivmesini sürdürmesini zorlaştırıyor.