Berita

Terobosan Deepseek Menghasilkan model AI open-source seperti Meta’s Llama

Omer Taha Cetin | Anadolu | Gambar getty

Model intelijen buatan baru Deepseek yang kuat bukan hanya kemenangan bagi Cina-ini adalah kemenangan untuk versi open-source dari teknologi dari orang-orang seperti MetaDatabricks, Mistral dan memeluk wajah, menurut para pakar industri yang berbicara dengan CNBC.

Bulan lalu, Deepseek merilis R1, An model penalaran open-source yang mengklaim menyaingi kinerja model O1 Openai Menggunakan proses yang lebih murah dan intensif energi.

Perkembangan ini menyebabkan nilai-nilai pasar NVIDIA dan pembuat chip lainnya merosot kekhawatiran bahwa hal itu dapat menyebabkan pengurangan pengeluaran untuk infrastruktur komputasi berkinerja tinggi.

Deepseek adalah laboratorium AI Cina yang berfokus pada pengembangan model bahasa besar dengan tujuan akhir untuk mencapai kecerdasan umum buatan, atau AGI. Didirikan pada tahun 2023 oleh Liang Wenfeng, salah satu pendiri dana lindung nilai kuantitatif yang berfokus pada AI.

Agi secara longgar mengacu pada gagasan AI yang sama dengan atau melampaui kecerdasan manusia pada berbagai tugas.

Apa itu AI open-source?

Sejak chatgpt Openai meledak ke tempat kejadian pada bulan November 2022, para peneliti AI telah bekerja keras untuk memahami dan meningkatkan kemajuan teknologi model bahasa besar dasar yang mendukungnya.

Salah satu bidang fokus untuk banyak laboratorium adalah AI open-source. Open Source mengacu pada perangkat lunak yang kode sumbernya tersedia secara bebas di web terbuka untuk kemungkinan modifikasi dan redistribusi.

Banyak perusahaan dari raksasa teknologi seperti meta hingga startup scrappier seperti Mistral dan Hugging Face telah bertaruh pada sumber terbuka sebagai cara untuk meningkatkan teknologi sambil juga berbagi perkembangan penting dengan komunitas riset yang lebih luas.

Seberapa Deepseek memberdayakan open source

Terobosan teknologi Deepseek hanya membuat kasus untuk model AI open-source lebih kuat, menurut beberapa eksekutif teknologi.

Seena Rejal, kepala petugas komersial AI Startup Netmind, mengatakan kepada CNBC bahwa keberhasilan perusahaan Cina menunjukkan bahwa AI open-source adalah “bukan lagi hanya inisiatif penelitian non komersial tetapi alternatif yang layak dan dapat diskalakan untuk model tertutup” seperti Openai’s GPT.

“Deepseek R1 telah menunjukkan bahwa model open-source dapat mencapai kinerja canggih, menyaingi model kepemilikan dari Openai dan lainnya,” kata Rejal kepada CNBC. “Ini menantang keyakinan bahwa hanya model sumber tertutup yang dapat mendominasi inovasi di ruang ini.”

Rejal tidak sendirian. Yann Lecun, Kepala Ilmuwan AI Meta, mengatakan keberhasilan Deepseek merupakan kemenangan bagi model AI open-source, tidak harus menang bagi China atas Amerika Serikat. Meta berada di belakang model AI open-source populer yang disebut Llama.

“Kepada orang -orang yang melihat kinerja Deepseek dan berpikir: ‘China melampaui AS di AI.’ Anda membaca ini salah.

Baca lebih lanjut liputan Deepseek

“Deepseek telah mendapat untung dari penelitian terbuka dan open source (misalnya Pytorch dan Llama dari meta). Mereka datang dengan ide -ide baru dan membangunnya di atas pekerjaan orang lain. Karena pekerjaan mereka diterbitkan dan open source, semua orang dapat mengambil untung darinya. Itulah kekuatan penelitian terbuka dan open source. “

AI open-source menjadi global

Dipotong oleh Washington dari mengakses chip canggih yang diperlukan untuk melatih dan menjalankan model AI, Cina telah beralih ke teknologi open-source untuk meningkatkan daya tarik model AI-nya. Banyak perusahaan Cina – termasuk Deepseek – mengejar model open source sebagai cara untuk meningkatkan inovasi dan menyebarkan penggunaannya.

Tetapi tren perusahaan yang beralih ke teknologi open-source untuk sukses di AI tidak terbatas pada Cina. Di Eropa, aliansi akademisi, perusahaan, dan pusat data telah bermitra dalam pengembangan keluarga model bahasa besar berkinerja tinggi, multibahasa, yang disebut Openeurollm.

Aliansi ini dipimpin oleh Jan Hajič, ahli bahasa komputasi terkenal di Charles University, Czechia, dan Peter Sarlin, salah satu pendiri Silo AI, sebuah laboratorium AI yang dibeli oleh pembuat chip AS AMD tahun lalu.

Inisiatif ini merupakan bagian dari dorongan yang lebih luas untuk “kedaulatan AI,” di mana negara -negara mendorong investasi di laboratorium AI domestik mereka sendiri dan pusat data untuk mengurangi ketergantungan pada Lembah Silikon.

Apa tangkapannya?

Namun, ada kerugian untuk AI open-source. Para ahli memperingatkan bahwa, meskipun teknologi open-source adalah hal yang baik untuk inovasi, itu juga lebih rentan terhadap eksploitasi cyber. Itu karena dapat dikemas ulang dan dimodifikasi oleh siapa saja.

Perusahaan cybersecurity telah menemukan kerentanan dalam model AI Deepseek. Penelitian yang dirilis Cisco minggu lalu mengungkapkan bahwa R1 berisi kelemahan keamanan kritis.

Menggunakan “teknik jailbreaking algoritmik,” tim peneliti AI Safety AI Cisco mengatakan R1 memberikan respons afirmatif terhadap serangkaian petunjuk berbahaya dari Harmbench populer “dengan tingkat keberhasilan serangan 100%.”

“Deepseek R1 konon dilatih dengan sebagian kecil dari anggaran yang dihabiskan penyedia model perbatasan lainnya untuk mengembangkan model mereka. Namun, itu datang dengan biaya yang berbeda: keselamatan dan keamanan,” tulis peneliti Cisco Paul Kassianik dan Amin Karbasi.

Kebocoran data juga menjadi perhatian. Data yang diproses oleh model R1 Deepseek melalui situs web atau aplikasi dikirim langsung ke Cina. Perusahaan teknologi Tiongkok telah lama dirundung oleh tuduhan bahwa Beijing menggunakan sistem mereka untuk memata -matai entitas dan individu Barat.

“Deepseek, seperti platform AI generatif lainnya, menyajikan pedang bermata dua untuk bisnis dan individu,” kata Matt Cooke, ahli strategi cybersecurity EMEA di Proofpoint. “Meskipun potensi inovasi tidak dapat disangkal, risiko kebocoran data adalah masalah serius.”

“Deepseek relatif baru, dan akan membutuhkan waktu untuk belajar tentang teknologi; namun, yang kita tahu adalah memberi makan data perusahaan yang sensitif atau informasi pribadi ke dalam sistem ini seperti menyerahkan senjata yang dimuat oleh penyerang,” tambah Cooke.

Netmind’s Rejal mengatakan kepada CNBC bahwa model AI open-source memperkenalkan risiko keamanan siber yang perlu dipertimbangkan oleh bisnis, termasuk serangan rantai pasokan perangkat lunak, peristiwa yang segera terjadi dan disebut “keracunan data” yang mencoba memperkenalkan bias atau output berbahaya.

JAM TANGAN: Mengapa Deepseek Tiongkok menempatkan AI Amerika memimpin dalam bahaya

Mengapa Deepseek Tiongkok menempatkan AI Amerika memimpin dalam bahaya

Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button