Bagaimana AI Chinese Start-Up Deepseek bersaing dengan Openai dan Google

Sehari setelah Natal, start-up kecil Cina bernama Deepseek meluncurkan sistem AI baru yang dapat menyamai kemampuan chatbot mutakhir dari perusahaan seperti Openai dan Google.
Itu saja akan menjadi tonggak sejarah. Tetapi tim di belakang sistem, yang disebut Deepseek-V3, menggambarkan langkah yang lebih besar. Di sebuah Makalah Penelitian Menjelaskan bagaimana mereka membangun teknologi, insinyur Deepseek mengatakan mereka hanya menggunakan sebagian kecil dari chip komputer yang sangat khusus yang diandalkan oleh perusahaan AI terkemuka untuk melatih sistem mereka.
Keripik ini berada di pusat kompetisi teknologi yang tegang antara Amerika Serikat dan Cina. Ketika pemerintah AS bekerja untuk mempertahankan keunggulan negara dalam ras AI global, ia berusaha membatasi jumlah chip yang kuat, seperti yang dibuat oleh perusahaan Lembah Silikon Nvidia, yang dapat dijual ke Cina dan saingan lainnya.
Tetapi kinerja model Deepseek menimbulkan pertanyaan tentang konsekuensi yang tidak diinginkan dari pembatasan perdagangan pemerintah Amerika. Kontrol telah memaksa para peneliti di Cina untuk menjadi kreatif dengan berbagai alat yang tersedia secara bebas di internet.
The Deepseek Chatbot menjawab pertanyaan, menyelesaikan masalah logika dan menulis program komputer sendiri sebanyak yang sudah ada di pasaran, menurut tes benchmark yang telah digunakan perusahaan AI Amerika.
Dan itu dibuat dengan harga murah, menantang gagasan yang berlaku bahwa hanya perusahaan terbesar industri teknologi – semuanya yang berbasis di Amerika Serikat – mampu membuat sistem AI paling canggih. Para insinyur Cina mengatakan mereka hanya membutuhkan sekitar $ 6 juta dalam kekuatan komputasi mentah untuk membangun sistem baru mereka. Itu sekitar 10 kali lebih sedikit dari raksasa teknologi yang dihabiskan untuk membangun teknologi AI terbarunya.
“Jumlah perusahaan yang memiliki $ 6 juta untuk dibelanjakan jauh lebih besar dari jumlah perusahaan yang memiliki $ 100 juta atau $ 1 miliar untuk dibelanjakan,” kata Chris V. Nicholson, seorang investor dengan perusahaan modal ventura Page One Ventures, yang fokus pada fokus Teknologi AI.
Karena Openai memicu booming AI pada tahun 2022 dengan rilis ChatGPT, banyak ahli dan investor telah menyimpulkan bahwa tidak ada perusahaan yang dapat bersaing dengan para pemimpin pasar tanpa menghabiskan ratusan juta dolar untuk chip khusus.
Perusahaan AI terkemuka di dunia melatih chatbot mereka menggunakan superkomputer yang menggunakan sebanyak 16.000 chip, jika tidak lebih. Insinyur Deepseek, di sisi lain, mengatakan mereka hanya membutuhkan sekitar 2.000 chip komputer khusus dari Nvidia.
Kendala pada chip di Cina memaksa para insinyur Deepseek untuk “melatihnya lebih efisien sehingga masih bisa kompetitif,” kata Jeffrey Ding, asisten profesor di Universitas George Washington yang berspesialisasi dalam teknologi yang muncul dan hubungan internasional.
Awal bulan ini, pemerintahan Biden mengeluarkan aturan baru yang bertujuan untuk menjaga China dari mendapatkan chip AI canggih melalui negara lain. Aturan dibangun di atas beberapa putaran pembatasan sebelumnya yang mencegah perusahaan Cina dapat membeli atau membuat chip komputer mutakhir. Presiden Trump belum mengindikasikan apakah dia akan menjaga aturan atau membatalkannya.
Pemerintah AS telah mencoba menjauhkan chip canggih dari tangan perusahaan Cina atas kekhawatiran yang dapat mereka gunakan untuk tujuan militer. Sebagai tanggapan, beberapa perusahaan di Cina telah menimbun ribuan chip, sementara yang lain mengambilnya dari pasar bawah tanah yang berkembang pesat.
Deepseek dijalankan oleh perusahaan perdagangan saham kuantitatif bernama High Flyer. Pada tahun 2021, ia telah menyalurkan keuntungannya untuk memperoleh ribuan chip Nvidia, yang digunakan untuk melatih model sebelumnya. Perusahaan, yang tidak menanggapi permintaan komentar, telah dikenal di Cina karena meraup bakat yang baru dari universitas terkemuka dengan janji gaji tinggi dan kemampuan untuk mengikuti pertanyaan penelitian yang paling menarik minat mereka.
Zihan Wang, seorang insinyur komputer yang bekerja pada model Deepseek sebelumnya, mengatakan perusahaan juga mempekerjakan orang tanpa latar belakang ilmu komputer untuk membantu teknologi memahami dan dapat menghasilkan pertanyaan puisi dan ace tentang ujian masuk perguruan tinggi Tiongkok yang terkenal sulit.
Deepseek tidak membuat produk apa pun bagi konsumen, membuat para insinyurnya fokus sepenuhnya pada penelitian. Itu berarti bahwa teknologinya tidak dikeluarkan oleh aspek paling ketat dari peraturan Tiongkok tentang AI, yang membutuhkan teknologi yang menghadap konsumen untuk mematuhi kontrol pemerintah pada informasi.
Perusahaan -perusahaan Amerika terkemuka terus memajukan keadaan seni di AI pada bulan Desember, Openai meluncurkan sistem “penalaran” baru yang disebut O3 yang melebihi kinerja teknologi yang ada, meskipun belum tersedia secara luas di luar perusahaan. Tapi Deepseek terus menunjukkan bahwa itu tidak jauh di belakang. Bulan ini, merilis model penalaran yang mengesankan sendiri.
(The New York Times telah menggugat Openai dan mitranya, Microsoft, menuduh mereka melakukan pelanggaran hak cipta atas konten berita yang terkait dengan sistem AI. Openai dan Microsoft telah membantah klaim tersebut.)
Bagian penting dari pasar global yang berubah dengan cepat ini adalah ide lama: perangkat lunak open source. Seperti banyak perusahaan lain, Deepseek telah membuka sistem AI terbarunya, yang berarti bahwa ia telah berbagi kode yang mendasari dengan bisnis dan peneliti lain. Ini memungkinkan orang lain untuk membangun dan mendistribusikan produk mereka sendiri menggunakan teknologi yang sama.
Sementara karyawan di perusahaan teknologi Cina besar terbatas untuk berkolaborasi dengan kolega, “Jika Anda bekerja di open source, Anda bekerja dengan bakat di seluruh dunia,” kata Yineng Zhang, insinyur perangkat lunak utama di Baseten di San Francisco yang bekerja di open source sglang proyek. Dia membantu orang lain dan perusahaan membangun produk menggunakan sistem Deepseek.
Ekosistem open source untuk AI mengumpulkan uap pada tahun 2023 ketika meta dengan bebas berbagi sistem AI yang disebut llama. Banyak yang berasumsi bahwa komunitas ini akan berkembang hanya jika perusahaan seperti meta – raksasa teknologi dengan pusat data besar yang diisi dengan chip khusus – terus membuka sumber teknologi mereka. Tetapi Deepseek dan yang lainnya telah menunjukkan bahwa mereka juga dapat memperluas kekuatan teknologi open source. ”
Banyak eksekutif dan pakar berpendapat bahwa perusahaan besar AS tidak boleh membuka sumber teknologi mereka karena mereka dapat digunakan untuk menyebarkan disinformasi atau menyebabkan kerusakan serius lainnya. Beberapa anggota parlemen AS telah mengeksplorasi kemungkinan mencegah atau mencekik praktik.
Tetapi yang lain berpendapat bahwa jika regulator menahan kemajuan teknologi open source di Amerika Serikat, Cina akan mendapatkan keunggulan yang signifikan. Jika teknologi open source terbaik berasal dari Cina, mereka berpendapat, pengembang AS akan membangun sistem mereka di atas teknologi tersebut. Dalam jangka panjang, itu bisa menempatkan Cina di jantung penelitian dan pengembangan AI.
“Pusat gravitasi komunitas open source telah pindah ke Cina,” kata Ion Stoica, seorang profesor ilmu komputer di University of California, Berkeley. “Ini bisa menjadi bahaya besar bagi AS,” karena memungkinkan Cina untuk mempercepat pengembangan teknologi baru.
Beberapa jam setelah pelantikannya, Presiden Trump membatalkan perintah eksekutif administrasi Biden yang mengancam akan mengekang teknologi sumber terbuka.
Stoica dan murid-muridnya baru-baru ini membangun sistem AI bernama Sky-T1 yang menyaingi kinerja sistem terbaru Openai, yang disebut OpenAI O1, pada tes benchmark tertentu. Mereka hanya membutuhkan daya komputasi $ 450.
Mereka melakukan ini dengan membangun di atas dua teknologi open source yang dirilis oleh raksasa teknologi Cina Alibaba.
Sistem $ 450 mereka tidak sekuat teknologi Openai atau sistem baru Deepseek. Dan teknik yang mereka gunakan tidak mungkin menghasilkan sistem yang melebihi kinerja teknologi terkemuka. Tetapi proyek menunjukkan bahwa bahkan operasi dengan sumber daya yang sangat kecil dapat membangun sistem kompetitif.
Reuven Cohen, seorang konsultan teknologi di Toronto, telah menggunakan Deepseek-V3 sejak akhir Desember. Dia mengatakan itu sebanding dengan sistem terbaru dari Openai, Google dan antropik start-up San Francisco-dan jauh lebih murah untuk digunakan.
“Deepseek adalah cara bagi saya untuk menghemat uang,” katanya. “Ini adalah jenis teknologi yang ingin saya gunakan.”