Kesehatan

Rilis Antropik CLAUDE 3.7 Sonnet AI Model dengan kemampuan penalaran, memperkenalkan kode Claude

Antropik Dirilis versi yang ditingkatkan dari model Claude 3.5 Sonnet Sonnet Artificial Intelligence (AI) pada hari Senin. Dubbed Claude 3.7 Sonnet, itu tersedia untuk semua pengguna Claude. Perusahaan AI menggambarkan 3,7 soneta sebagai model paling cerdas yang mampu melakukan penalaran lanjutan. Fokus utama dari Model Bahasa Besar (LLM) baru adalah pengkodean, dan untuk mendukung kemampuannya, perusahaan juga memperkenalkan kode Claude, alat pengkodean agen pertama Anthropic yang dapat menangani berbagai macam tugas pengkodean backend.

Antropik merilis model AI baru dan agen AI pertamanya

Di ruang redaksi posperusahaan mengumumkan rilis model Sonnet Claude 3.7. Ini adalah model AI hibrida pertama oleh perusahaan dan dapat melakukan baik sebagai model bahasa standar maupun model penalaran. Model penalaran biasanya menggunakan fungsi komputasi uji-waktu untuk meningkatkan waktu yang dihabiskan untuk kueri. Selama waktu ini, ini menebak output, mencari solusi alternatif, dan memverifikasi informasi.

Dengan Claude 3.7 Sonnet, pengguna dapat menggunakan model AI yang sama untuk mendapatkan fungsi standar dan penalaran. Menjelaskan alasan di balik memilih model hybrid, Anthropic mengatakan, “Kami percaya penalaran harus menjadi kemampuan terintegrasi dari model perbatasan daripada model yang terpisah sepenuhnya.”

Anggota staf Gadgets 360 dapat mengakses model AI pada tingkat gratis, dan tanggapannya tampaknya lebih canggih dibandingkan dengan model soneta yang lebih tua. Namun, perbaikannya marjinal, yang biasanya terjadi pada sebagian besar model AI berulang.

Pengguna sekarang dapat mengakses mode berpikir baru di menu Model Picker Claude, dan memilih antara normal dan diperluas. Sementara mode normal akan menghasilkan respons hampir instan, mode yang diperluas akan memicu respons berbasis penalaran. Khususnya, mode yang diperluas saat ini hanya tersedia untuk pelanggan Pro.

Pengembang Anthropic mengatakan yang mengakses model melalui Application Programming Interface (API) akan dapat mengontrol waktu yang dipikirkan model sebelum menghasilkan output. Ini dapat dikontrol dengan menentukan nilai token spesifik untuk Claude. Jumlah ini dapat mencapai 1.28.000 token, yang merupakan langit -langit atas untuk model ini. Perusahaan AI menyoroti bahwa kontrol granular ini akan memungkinkan pengembang membangun produk yang lebih terfokus.

Datang ke kinerja, Claude 3.7 Sonnet mencetak 62,3 persen dalam benchmark terverifikasi SWE-Bench, mengungguli 3,5 soneta dan Openai’s O1, sesuai dengan pengujian internal perusahaan. Ini juga mengungguli O1 di tolok ukur tau-bench untuk penggunaan alat agen.

Selain itu, perusahaan AI juga memperkenalkan kode Claude, alat pengkodean agen pertama dalam pratinjau penelitian terbatas. Ini dapat melakukan berbagai tugas pengkodean termasuk kode pencarian dan membaca, mengedit file, menulis dan menjalankan tes, melakukan dan mendorong kode ke GitHub, dan menggunakan alat baris perintah.

Dalam pengujian internal Anthropic, alat agen dapat menyelesaikan tugas kompleks yang lebih dari 45 menit pekerjaan manual dalam satu upaya. Individu yang tertarik dapat mengakses pratinjau Di Sini. Perusahaan AI menyoroti bahwa alat ini sedang digunakan secara internal.

Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button