Perusahaan rintisan kecerdasan buatan asal Tiongkok, DeepSeek, telah mengumumkan rencana untuk membuka kode sumber beberapa model AI mereka kepada publik. Langkah ini menegaskan komitmen DeepSeek terhadap pengembangan AI berbasis open-source, yang diharapkan dapat mendorong inovasi dan kolaborasi lebih lanjut dalam komunitas AI global.
Sebelumnya, DeepSeek telah merilis model DeepSeek-R1, sebuah model penalaran yang dirancang untuk meningkatkan efisiensi dalam pelatihan dan inferensi konteks panjang. Model ini telah menarik perhatian industri karena kemampuannya yang kompetitif meskipun menggunakan sumber daya yang lebih terbatas dibandingkan dengan model AI lainnya.
Pendiri DeepSeek, Liang Wenfeng, menekankan bahwa keputusan untuk membuka kode sumber ini lebih didorong oleh nilai-nilai budaya daripada pertimbangan komersial. Menurutnya, pendekatan open-source dapat meningkatkan rasa hormat dan mendorong inovasi di kalangan pengembang dan peneliti AI.
Selain itu, DeepSeek juga telah memperkenalkan algoritma baru bernama Native Sparse Attention, yang bertujuan meningkatkan efisiensi dalam pelatihan dan inferensi untuk konteks yang panjang. Inovasi ini sejalan dengan upaya perusahaan untuk menyediakan solusi AI yang lebih hemat sumber daya namun tetap berkinerja tinggi.
Also Read
Langkah DeepSeek untuk membuka kode sumber model AI mereka merupakan langkah signifikan dalam lanskap AI global, terutama mengingat banyak perusahaan AI besar di Tiongkok dan Amerika Serikat yang cenderung mempertahankan model mereka sebagai proprietary. Dengan pendekatan ini, DeepSeek berharap dapat mendorong kolaborasi yang lebih luas dan mempercepat kemajuan teknologi AI secara keseluruhan.