Alibaba Cloud Perkuat Kemampuan AI dengan Inovasi Terbaru
📅 Kamis, 10 Apr 2025, 21:15 WIB | Oleh: Haryo Brono
Doc: Alibaba Cloud
JAKARTA – Alibaba Cloud, tulang punggung teknologi digital dan kecerdasan buatan dari Alibaba Group, hari ini meluncurkan serangkaian model kecerdasan buatan (AI) dan perangkat lunak Software-as-a-Service (SaaS) terbaru, serta pembaruan infrastruktur dalam acara “Spring Launch 2025” yang digelar secara daring. Inisiatif ini disebut sebagai komitmen Alibaba Cloud dalam mendorong inovasi AI di seluruh dunia.
“Kami meluncurkan serangkaian pembaruan Platform-as-a-Service (PaaS) dan kapabilitas AI untuk menjawab meningkatnya kebutuhan transformasi digital di berbagai belahan dunia. Peningkatan ini bertujuan untuk memberi layanan yang lebih aman dengan performa yang optimal guna mendukung bisnis berinovasi di era dunia berbasis AI,” ucap President of International Business, Alibaba Cloud Intelligence, Selina Yuan melalui siaran pers pada hari Kamis (10/4).
Menanggapi peran penting dari komputasi awan (cloud) dan AI, Alibaba Cloud berkomitmen untuk menyempurnakan produk utamanya agar selaras dengan kebutuhan pelanggan yang terus berkembang. Selain itu juga mengumumkan sejumlah penawaran terbaru untuk pelanggan internasional dengan memberikan akses lebih luas ke lini model fondasi Alibaba, serta pembaruan dalam infrastruktur cloud.
Seluruh model ini tersedia di zona ketersediaan Alibaba Cloud di Singapura, termasuk lini ekslusif large language model (LLM), Qwen, seperti Qwen-Max, model skala besar berbasis Mixture of Experts (MoE); QwQ-Plus, model dengan kemampuan penalaran; QVQ-Max, model penalaran visual; Qwen2.5-Omni-7b, model multimodal end-to-end generasi terbaru.
QwQ-Plus adalah model penalaran tingkat lanjut yang dirancang untuk analisa permasalahan kompleks secara mendalam mulai dari kemampuan pintar dalam tanya-jawab hingga penyelesaian rumit soal matematika dengan pendekatan algoritma yang tepat.
Sebaiknya Anda baca juga:
Sementara itu, QVQ-Max adalah model penalaran visual yang dapat menyelesaikan berbagai persoalan multimodal dengan akurasi yang tinggi dan kemampuan penalaran lebih luas guna menghasilkan input visual dan output chain-of-thought.
Untuk memperkuat dukungan terhadap model AI di lini Platform-as-a-Service (PaaS), Alibaba Cloud secara signifikan memperbarui Platform for AI (PAI) miliknya demi menyediakan solusi generatif AI dan LLM yang skalabel, hemat biaya, dan mudah digunakan. Kini, PAI-Elastic Algorithm Service (EAS) dibekali dengan fitur distributed inference melalui arsitektur multi-node untuk memenuhi kebutuhan komputasi model yang sangat besar.
Hal tersebut dilakukan seiring meningkatnya kebutuhan MoE dan pemrosesan teks ultra-panjang teknologi ini mampu mengatasi keterbatasan pendekatan node tunggal tradisional yang menjadi hambatan.
Sebaiknya Anda baca juga:
Sebagai upaya untuk meningkatkan performa sekaligus efisiensi biaya, PAI-EAS juga diperkenalkan dengan fungsi prefill-decode disaggregation, yang secara nyata mampu meningkatkan concurrency hingga 92 persen dan kecepatan pemrosesan token (TPS) sebesar 91 persen saat dijalankan dengan model Qwen2.5-72B, menjadikan sistem ini tangguh untuk meningkatkan skalabilitas dan efisiensi.
PAI-Model Gallery diperbarui untuk dapat memberi akses kepada lebih dari 300 model open-source termutakhir secara komprehensif mencakupi seluruh lini model milik Alibaba Cloud, yaitu lini Qwen dan Wan. Seluruh model dapat diakses dengan mudah oleh pengguna, melalui proses pemindahan dan pengelolaan data tanpa kode (no-code).
“Platform ini juga memberikan fleksibilitas dalam pilihan metode deployment, fitur baru seperti model untuk evaluasi performa dan model distillation, sehingga dapat mengurangi biaya dengan pemindahan pengetahuan model dari skala besar ke yang lebih kecil,” kata Selina.
Untuk meningkatkan efisiensi pengelolaan data di era AI, Alibaba Cloud kini telah mengintegrasikan kemampuan inferensi AI bawaan yang didukung oleh model Qwen dalam PolarDB, database relasional andalan mereka yang berbasis cloud andalannya.
Dengan menghadirkan kemampuan machine learning langsung di dalam database, proses inferensi kini dapat dilakukan langsung di dalam database tanpa perlu memindahkan data tersebut. Hal ini berdampak pada pengurangan latensi pemrosesan secara signifikan, sekaligus meningkatkan efisiensi dan keamanan data.
“Fitur baru ini dirancang khusus untuk menangani beban kerja berbasis teks dan cocok dalam berbagai skenario seperti mengembangkan agen RAG (Retrieval-Augmented Generation), pembuatan text embedding, serta pencarian kesamaan dalam analisis semantic,” terang Selina.
Website kami bergantung pada iklan untuk terus dapat menghadirkan jurnalisme berkualitas.
Dukung kami dengan mengijinkan iklan tampil di browser anda.
- Klik ikon AdBlock pada area ekstensi browser (di bagian pojok kanan atas).
- Lalu klik pilihan untuk menonaktifkan atau pilihan "Don't run on this website / on this page".
Setelah itu Refresh / Muat Ulang halaman ini.
Komentar (0)
Belum ada komentar.
Silakan login via Google untuk dapat memberi komentar!