Claude 3.7 Sonet dirilis pada 25 Februari 2025.
Claude 3.7 Sonet sekarang tersedia untuk semua pelanggan dengan paket Copilot berbayar. Model Sonet baru ini mendukung mode berpikir dan tidak berpikir dari Copilot. Pengujian awal telah menunjukkan peningkatan yang sangat kuat dalam skenario agen.
Dalam evaluasi internal kami di GitHub, model ini menunjukkan peningkatan dibandingkan model sebelumnya dalam hal kemampuannya untuk mengikuti instruksi, memecah tugas-tugas yang rumit, dan membangun ulasan manusia (UI) baru.
Kami menghabiskan waktu berbulan-bulan menggunakan Sonnet 3.5 dan 3.6 untuk meningkatkan kode pada beberapa proyek berbasis Java dan JavaScript, dan 3.7 segera memberikan kode yang lebih baik, lebih modern, dan lebih baik.
Sebelumnya, Sonnet 3.5 memberikan potongan-potongan kecil kode dengan respons yang lebih pendek dan kami selalu diingatkan untuk memberikan kode lengkap, respons yang lebih panjang, tidak ada respons yang hilang, dll. Respons 3.7 memandu kami melalui struktur folder, instalasi ketergantungan, pengaturan proyek awal, dan cara membuat pustaka, dan kemudian Sonnet 3.7 bekerja dengan setiap halaman JSX kami, yang masing-masing memiliki ribuan baris kode, dan bekerja tanpa bug atau masalah referensi atau pustaka.
Jika Anda bukan seorang pengembang, jangan takut, sekarang Anda hanya membutuhkan waktu kurang dari 3 menit untuk membuat situs web yang indah dengan CSS yang tepat, animasi, warna, dan UI yang modern.
Artikel ini telah ditulis ulang dari artikel yang awalnya diterbitkan di situs web Anthropic.
Untuk membaca artikel yang ditulis sebelumnya tentang "ChatGPT vs Claude," klik di sini.

Claude 3.7 Soneta merupakan sebuah langkah maju yang besar, terutama untuk pengkodean dan pengembangan web front-end. Bersamaan dengan model ini, kami juga memperkenalkan Claude Code, sebuah alat baris perintah untuk agen pengkodean. Claude Code tersedia sebagai pratinjau penelitian terbatas dan memungkinkan pengembang untuk mendelegasikan tugas-tugas teknik yang signifikan kepada Claude langsung dari terminal. Claude Code tersedia sebagai pratinjau penelitian terbatas dan memungkinkan pengembang untuk mendelegasikan tugas-tugas teknik yang signifikan kepada Claude langsung dari terminal.
Claude 3.7 Soneta sekarang tersedia di semua paket Claude - Gratis, Pro, Tim, dan Enterprise - dan di API Anthropic, Amazon Bedrock, danVertex AI di Google Cloud. Mode pemikiran yang diperluas tersedia di semua paket kecuali tingkat Claude gratis.
Untuk mode berpikir standar dan diperpanjang, Claude 3.7 Soneta memiliki harga yang sama dengan versi sebelumnya: $3 per 1 juta token input dan $15 per 1 juta token output (termasuk token insiden).
Claude 3.7 Soneta: Penalaran frontier menjadi praktis
Claude mengembangkan Claude 3.7 Soneta dengan filosofi yang berbeda dari model inferensi lain di pasaran: sama seperti manusia yang menggunakan satu otak untuk reaksi cepat dan otak yang lain untuk perenungan yang dalam, kami percaya bahwa inferensi harus menjadi fitur yang terintegrasi dengan model Frontier, daripada model yang sepenuhnya terpisah. Pendekatan terintegrasi ini memberikan pengalaman yang lebih mulus bagi pengguna.
Claude 3.7 Soneta mengimplementasikan filosofi ini dalam beberapa cara.
- Pertama, Claude 3.7 Soneta memiliki fungsionalitas LLM biasa dan model inferensi. Anda dapat memilih kapan Anda ingin model menjawab secara normal dan kapan Anda ingin model berpikir lebih lama sebelum menjawab. Dalam mode standar, Claude 3.7 Soneta adalah versi upgrade dari Claude 3.5. Dalam mode berpikir yang diperpanjang, Anda dapat melakukan lebih baik dalam matematika, fisika, mengikuti arahan, pengkodean, dan banyak tugas lainnya karena Anda merenung sebelum menjawab. Secara umum, petunjuk untuk model bekerja sama di kedua mode.
- Kedua, ketika menggunakan Claude 3.7 Soneta melalui API, pengguna dapat mengontrol anggaran untuk pemikiran mereka: Mereka dapat memberi tahu Claude untuk tidak melebihi N token, di mana N dapat berupa nilai apa pun hingga batas output 128.000 token. Hal ini memungkinkan Anda untuk menukar kecepatan dan biaya dengan kualitas jawaban.
Ketiga, dalam mengembangkan model inferensi, kami tidak terlalu banyak mengoptimalkan untuk pertanyaan kompetisi matematika dan ilmu komputer, melainkan berfokus pada tugas-tugas dunia nyata yang lebih mencerminkan bagaimana perusahaan benar-benar menggunakan LLM.
Pengujian awal menunjukkan bahwa kemampuan coding Claude secara umum baik. Cursor mengonfirmasi bahwa Claude sekali lagi berada di puncak permainannya dalam tugas-tugas coding di dunia nyata, menunjukkan peningkatan yang signifikan di berbagai bidang mulai dari menangani basis kode yang kompleks hingga menggunakan alat canggih. Cognition menganggapnya jauh lebih unggul daripada model lain dalam hal perencanaan perubahan kode dan penanganan pembaruan full-stack; Vercel menyoroti akurasi superior Claude untuk alur kerja agen yang kompleks; dan Replit berhasil menggunakan Claude di mana model lain terhenti, membangun aplikasi web dan dasbor yang canggih dari nol. Dalam evaluasi Canva, Claude secara konsisten menghasilkan kode yang siap diproduksi dengan bakat desain yang hebat dan secara dramatis mengurangi kesalahan.

Claude 3.7 Sonnet mencapai kinerja canggih dalam SWE-bench Verified, yang mengevaluasi kemampuan model AI untuk memecahkan masalah perangkat lunak di dunia nyata.

Claude 3.7 Sonnet mencapai kinerja tercanggih di TAU-bench, sebuah kerangka kerja untuk menguji agen AI pada tugas-tugas dunia nyata yang kompleks dengan interaksi pengguna dan alat.

Claude 3.7 Sonnet unggul dalam mengikuti instruksi, penalaran umum, kemampuan multi-modal, dan pengkodean agen, sementara pemikiran yang diperluas memberikan keuntungan yang luar biasa dalam matematika dan sains. Di luar tolok ukur tradisional, ini mengungguli semua model sebelumnya dalam pengujian permainan Pokémon.
Kode Claude
Sejak Juni 2024, Sonnet telah menjadi model pilihan bagi para pengembang di seluruh dunia. Untuk lebih memberdayakan para pengembang, kami merilis Claude Code, alat pengkodean agen pertama kami, sebagai pratinjau penelitian terbatas.
Claude Code adalah alat kolaborasi aktif yang memungkinkan Anda untuk mencari dan membaca kode, mengedit file, menulis dan menjalankan pengujian, melakukan komit dan mendorong kode ke GitHub, dan menggunakan alat baris perintah.
Claude Code adalah produk awal, tetapi akan menjadi sangat diperlukan, terutama untuk pengembangan yang digerakkan oleh pengujian, debugging masalah yang kompleks, dan refactoring skala besar.
Dalam pengujian awal, Claude Code telah mengurangi waktu dan biaya pengembangan dengan menyelesaikan tugas-tugas dalam sekali jalan yang biasanya membutuhkan waktu 45 menit atau lebih untuk pekerjaan manual.
Dalam beberapa minggu ke depan, mereka akan terus melakukan perbaikan berdasarkan penggunaan (meningkatkan keandalan pemanggilan alat, menambahkan dukungan untuk perintah yang sudah berjalan lama, meningkatkan rendering dalam aplikasi, dan memperluas pemahaman mereka sendiri tentang kemampuan Claude).
Tujuan Claude dengan Claude Code adalah untuk lebih memahami bagaimana pengembang menggunakan Claude untuk pengkodean, yang akan menginformasikan perbaikan model di masa depan.
Ketersediaan dan harga
Bagi pengembang yang ingin membangun solusi AI khusus menggunakan Claude 3.7 Sonnet, tersedia di Anthropic API, Amazon Bedrock, dan Vertex AI di Google Cloud.
Untuk pengguna bisnis dan konsumen yang ingin berkolaborasi dengan Claude 3.7 Sonnet melalui pengalaman chatting yang sederhana, Claude 3.7 Sonnet tersedia di Claude.ai untuk semua pengguna di web, iOS, dan Android.
Harga untuk Claude 3.7 Sonnet mulai dari $3 per 1 juta token input dan $15 per 1 juta token output, dengan penghematan hingga 90% dengan instant caching dan 50% dengan batch processing. Lihat halaman harga kami untuk lebih jelasnya.
Mengerjakan basis kode Anda dengan Claude
Kami juga telah meningkatkan pengalaman pengkodean di Claude.ai: Integrasi GitHub sekarang tersedia di semua paket Claude. Pengembang dapat menghubungkan repositori kode mereka secara langsung ke Claude.
Claude 3.7 Soneta adalah model pengkodean terbaik yang pernah dikembangkan. Karena memperdalam pemahamannya tentang proyek-proyek pribadi, profesional, dan open source, ini akan menjadi mitra yang lebih kuat dalam perbaikan bug, pengembangan fitur, dan dokumentasi di seluruh proyek GitHub Anda yang paling penting.
Pengembangan yang bertanggung jawab
Claude telah bekerja sama dengan para ahli eksternal untuk melakukan pengujian dan evaluasi ekstensif terhadap Claude 3.7 Sonnet guna memastikan bahwa versi ini memenuhi standar keamanan, keselamatan, dan keandalan. Claude 3.7 Sonnet juga membuat perbedaan yang lebih baik antara permintaan yang berbahaya dan tidak berbahaya, sehingga menghasilkan penolakan yang tidak perlu sebanyak 45% lebih sedikit dibandingkan versi sebelumnya. Claude 3.7 Sonnet juga membuat perbedaan yang lebih baik antara permintaan yang berbahaya dan tidak berbahaya, sehingga menghasilkan penolakan yang tidak perlu sebanyak 45% lebih sedikit dibandingkan versi sebelumnya.
Kartu sistem mencakup hasil keamanan baru dalam beberapa kategori dan memberikan analisis terperinci tentang evaluasi kebijakan penskalaan yang bertanggung jawab yang dapat diterapkan oleh laboratorium dan peneliti AI lainnya pada pekerjaan mereka. Kartu ini juga membahas risiko baru yang terkait dengan penggunaan komputer, terutama serangan injeksi yang cepat, dan menjelaskan bagaimana kami menilai kerentanan ini dan melatih Claude untuk menolak dan memitigasinya. Kami juga menyelidiki potensi manfaat keamanan dari model inferensi, yaitu kemampuan untuk memahami bagaimana sebuah model mengambil keputusan dan apakah penalarannya benar-benar dapat dipercaya dan dapat diandalkan.
Melihat ke masa depan
Claude 3.7 Sonet dan Claude mengambil langkah penting menuju sistem AI yang benar-benar dapat meningkatkan kemampuan manusia. Dengan kemampuan mereka untuk berpikir secara mendalam, bekerja secara mandiri, dan berkolaborasi secara efektif, mereka membawa kita lebih dekat ke masa depan di mana AI memperkaya dan memperluas apa yang dapat dicapai manusia.

Saya sangat antusias untuk mengeksplorasi kemampuan baru dan melihat apa yang bisa kita ciptakan dengan mereka. Claude selalu mencari umpan balik dari penggunauntuk terus meningkatkan dan mengembangkan model ini.
Terima kasih.