22.2 C
New York
Saturday, May 17, 2025

Buy now

Alibaba Cloud Perkuat Kemampuan AI dengan Inovasi Terbaru

TEKNOBUZZ – Alibaba Cloud meluncurkan serangkaian model kecerdasan buatan (AI) dan perangkat lunak Software-as-a-Service (SaaS) terbaru, serta pembaruan infrastruktur dalam acara “Spring Launch 2025” yang digelar secara daring. Inisiatif ini menegaskan komitmen Alibaba Cloud dalam mendorong inovasi AI di seluruh dunia.

“Kami meluncurkan serangkaian pembaruan Platform-as-a-Service (PaaS) dan kapabilitas AI untuk menjawab meningkatnya kebutuhan transformasi digital di berbagai belahan dunia. Peningkatan ini bertujuan untuk memberi layanan yang lebih aman dengan performa yang optimal guna mendukung bisnis berinovasi di era dunia berbasis AI,” ucap Selina Yuan, President of International Business, Alibaba Cloud Intelligence.

Alibaba Cloud mengumumkan sejumlah penawaran terbaru untuk pelanggan internasional dengan memberikan akses lebih luas ke lini model fondasi Alibaba, serta pembaruan dalam infrastruktur cloud.

Seluruh model ini tersedia di zona ketersediaan Alibaba Cloud di Singapura, termasuk lini ekslusif large language model (LLM), Qwen, seperti Qwen-Max, model skala besar berbasis Mixture of Experts (MoE); QwQ-Plus, model dengan kemampuan penalaran; QVQ-Max, model penalaran visual; Qwen2.5-Omni-7b, model multimodal end-to-end generasi terbaru.

QwQ-Plus adalah model penalaran tingkat lanjut yang dirancang untuk analisa permasalahan kompleks secara mendalam—mulai dari kemampuan pintar dalam tanya-jawab hingga penyelesaian rumit soal matematika dengan pendekatan algoritma yang tepat.

Sementara itu, QVQ-Max adalah model penalaran visual yang dapat menyelesaikan berbagai persoalan multimodal dengan akurasi yang tinggi dan kemampuan penalaran lebih luas guna menghasilkan input visual dan output chain-of-thought.

Untuk memperkuat dukungan terhadap model AI di lini Platform-as-a-Service (PaaS), Alibaba Cloud secara signifikan memperbarui Platform for AI (PAI) miliknya demi menyediakan solusi generatif AI dan LLM yang skalabel, hemat biaya, dan mudah digunakan.

Kini, PAI-Elastic Algorithm Service (EAS) dibekali dengan fitur distributed inference melalui arsitektur multi-node untuk memenuhi kebutuhan komputasi model yang sangat besar seiring meningkatnya kebutuhan MoE dan pemrosesan teks ultra-panjang — teknologi ini mampu mengatasi keterbatasan pendekatan node tunggal tradisional yang menjadi hambatan.

Sebagai upaya untuk meningkatkan performa sekaligus efisiensi biaya, PAI-EAS juga diperkenalkan dengan fungsi prefill-decode disaggregation, yang secara nyata mampu meningkatkan concurrency hingga 92% dan kecepatan pemrosesan token (TPS) sebesar 91% saat dijalankan dengan model Qwen2.5-72B, menjadikan sistem ini tangguh untuk meningkatkan skalabilitas dan efisiensi.

PAI-Model Gallery diperbarui untuk dapat memberi akses kepada lebih dari 300 model open-source termutakhir secara komprehensif—mencakupi seluruh lini model milik Alibaba Cloud, yaitu lini Qwen dan Wan.

Seluruh model dapat diakses dengan mudah oleh pengguna, melalui proses pemindahan dan pengelolaan data tanpa kode (no-code). Platform ini juga memberikan fleksibilitas dalam pilihan metode deployment, fitur baru seperti model untuk evaluasi performa dan model distillation, sehingga dapat mengurangi biaya dengan pemindahan pengetahuan model dari skala besar ke yang lebih kecil.

Untuk meningkatkan efisiensi pengelolaan data di era AI, Alibaba Cloud kini telah mengintegrasikan kemampuan inferensi AI bawaan—yang didukung oleh model Qwen— dalam PolarDB, database relasional andalan mereka yang berbasis cloud andalannya.

Dengan menghadirkan kemampuan machine learning langsung di dalam database, proses inferensi kini dapat dilakukan langsung di dalam database tanpa perlu memindahkan data tersebut. Hal ini berdampak pada pengurangan latensi pemrosesan secara signifikan, sekaligus meningkatkan efisiensi dan keamanan data.

Fitur baru ini dirancang khusus untuk menangani beban kerja berbasis teks dan cocok dalam berbagai skenario seperti mengembangkan agen RAG (Retrieval-Augmented Generation), pembuatan text embedding, serta pencarian kesamaan dalam analisis semantik.

Alibaba Cloud juga mengintegrasikan AnalyticDB—data warehouse miliknya—ke dalam Model Studio, platform untuk pengembangan model dan aplikasi AI generatif, sebagai vector database yang direkomendasikan untuk solusi RAG.

Pembaruan ini memungkinkan organisasi dapat langsung menghubungkan basis pengetahuan internal ke model dan alat AI di Model Studio, sehingga pengembangan aplikasi kontekstual yang cerdas dapat lebih cepat.

Related Articles

- Advertisement -spot_img

Latest Articles