Openai mengungkap agen chatgpt baru untuk ‘riset mendalam’

Openai mengumumkan yang baru Anda memiliki “agen” Dirancang untuk membantu orang melakukan penelitian yang mendalam dan kompleks menggunakan Chatgptplatform chatbot bertenaga AI perusahaan.
Cukup tepat, ini disebut penelitian mendalam.
Openai mengatakan masuk posting blog Diterbitkan pada hari Minggu bahwa kemampuan baru ini dirancang untuk “orang -orang yang melakukan pekerjaan pengetahuan intensif di bidang -bidang seperti keuangan, sains, kebijakan, dan teknik dan perlu penelitian yang menyeluruh, tepat, dan andal.” Ini juga bisa bermanfaat, tambah perusahaan, bagi siapa pun yang melakukan “pembelian yang biasanya memerlukan penelitian yang cermat, seperti mobil, peralatan, dan furnitur.”
Pada dasarnya, ChatGpt Deep Research dimaksudkan untuk contoh di mana Anda tidak hanya menginginkan jawaban atau ringkasan cepat, tetapi sebaliknya perlu dengan tekun mempertimbangkan informasi dari beberapa situs web dan sumber lainnya.
Openai mengatakan itu membuat riset mendalam tersedia untuk pengguna ChatGPT Pro hari ini, terbatas pada 100 pertanyaan per bulan, dengan dukungan untuk Plus dan pengguna tim yang akan datang berikutnya, diikuti oleh Enterprise. (Openai menargetkan peluncuran plus dalam waktu sekitar satu bulan dari sekarang, kata perusahaan itu.) Ini adalah peluncuran yang ditargetkan geo; Openai tidak memiliki garis waktu rilis untuk dibagikan bagi pelanggan ChatGPT di Inggris, Swiss, dan Area Ekonomi Eropa.
Untuk menggunakan riset mendalam chatgpt, Anda hanya akan memilih “riset mendalam” di komposer dan kemudian memasukkan kueri, dengan opsi untuk melampirkan file atau spreadsheet. (Ini adalah pengalaman khusus web untuk saat ini, dengan integrasi aplikasi seluler dan desktop akan datang akhir bulan ini.) Penelitian mendalam kemudian dapat memakan waktu di mana saja dari 5 hingga 30 menit untuk menjawab pertanyaan, dan Anda akan mendapatkan pemberitahuan ketika pencarian selesai .
Saat ini, output Chatgpt Deep Research hanya teks. Tetapi Openai mengatakan bahwa mereka bermaksud untuk menambahkan gambar tertanam, visualisasi data, dan output “analitik” lainnya segera. Juga di peta jalan adalah kemampuan untuk menghubungkan “sumber data yang lebih khusus,” termasuk “berbasis langganan” dan sumber daya internal, tambah OpenAI.
Pertanyaan besarnya adalah, seberapa tepat riset mendalam chatgpt? Lagipula AI tidak sempurna. Itu rentan halusinasi dan jenis kesalahan lainnya Itu bisa sangat berbahaya dalam skenario “penelitian mendalam”. Mungkin itulah sebabnya Openai mengatakan setiap output penelitian mendalam chatgpt akan “sepenuhnya didokumentasikan, dengan kutipan yang jelas dan ringkasan [the] Berpikir, membuatnya mudah untuk merujuk dan memverifikasi informasi. “
Juri keluar tentang apakah mitigasi itu akan cukup untuk memerangi kesalahan AI. Fitur pencarian web bertenaga AI Openai di chatgpt, pencarian chatgpt, tidak jarang membuat kesalahan dan memberikan jawaban yang salah untuk pertanyaan. Pengujian TechCrunch menemukan bahwa pencarian chatgpt menghasilkan hasil yang kurang berguna dari pencarian Google untuk pertanyaan tertentu.
Untuk meningkatkan akurasi penelitian mendalam, Openai menggunakan Versi khusus dari model AI “penalaran” O3 yang baru -baru ini diumumkan Itu dilatih melalui pembelajaran penguatan pada “tugas-tugas dunia nyata yang membutuhkan penggunaan alat peramban dan python.” Pembelajaran penguatan pada dasarnya “mengajarkan” model melalui percobaan dan kesalahan untuk mencapai tujuan tertentu. Ketika model semakin dekat ke tujuan, ia menerima “penghargaan” virtual yang, idealnya, membuatnya lebih baik pada tugas ke depan.
Openai mengklaim bahwa, berkat model O3 yang disesuaikan, penelitian mendalam dapat melakukan penelitian multi-langkah, mundur dan bereaksi terhadap informasi waktu-nyata, menghasilkan grafik, dan secara khusus mengutip “ratusan” sumber dan bagian.
“[This] Versi model Openai O3 mendatang [is] Dioptimalkan untuk penelusuran web dan analisis data, ”kata Openai di blog. “[I]T memanfaatkan penalaran untuk mencari, menafsirkan, dan menganalisis sejumlah besar teks, gambar, dan PDF di internet, berputar sesuai kebutuhan dalam reaksi terhadap informasi yang ditemui yang ditemui […] Model ini juga dapat menelusuri file yang diunggah pengguna, plot dan mengulangi grafik menggunakan alat Python, menanamkan grafik yang dihasilkan dan gambar dari situs web dalam tanggapannya, dan mengutip kalimat atau bagian tertentu dari sumbernya. “

Perusahaan mengatakan bahwa mereka menguji riset mendalam chatgpt menggunakan Ujian terakhir umat manusiaEvaluasi yang mencakup lebih dari 3.000 pertanyaan tingkat ahli dalam berbagai bidang akademik. Model O3 Powering Deep Research mencapai akurasi 26,6%, yang mungkin terlihat seperti nilai yang gagal – tetapi ujian terakhir umat manusia dirancang untuk lebih tangguh daripada tolok ukur lainnya untuk tetap berada di depan kemajuan model. Menurut Openai, model O3 penelitian yang mendalam datang jauh di depan Pemikiran Gemini (6,2%), Grok-2 (3,8%), dan Openai sendiri GPT-4O (3,3%).
Namun, Openai mencatat bahwa Chatgpt Deep Research memiliki keterbatasan, kadang -kadang membuat kesalahan dan kesimpulan yang salah. Penelitian yang mendalam mungkin berjuang untuk membedakan informasi otoritatif dari rumor, kata perusahaan, dan sering gagal menyampaikan ketika tidak pasti tentang sesuatu – dan juga dapat membuat kesalahan pemformatan dalam laporan dan kutipan.
Bagi siapa pun yang khawatir tentang dampak AI generatif pada siswa, atau pada siapa pun yang mencoba menemukan informasi secara online, jenis output yang mendalam dan dikutip ini mungkin terdengar lebih menarik daripada ringkasan chatbot sederhana yang menipu tanpa kutipan. Tetapi kita akan melihat apakah sebagian besar pengguna akan benar-benar membuat output ke analisis nyata dan periksa ganda, atau jika mereka hanya memperlakukannya sebagai teks yang lebih profesional untuk menyalin-paste.
Dan jika ini semua terdengar familiar, Google sebenarnya mengumumkan fitur AI serupa dengan nama yang sama persis kurang dari dua bulan lalu.