Google Cloud Next '23: Infrastruktur yang Dioptimalkan untuk AI

4.9.23

CLOUD TPU v5e, akselerator AI khusus Google Cloud yang paling hemat biaya, serbaguna, dan skalabilitas hingga saat ini, akan tersedia dalam pratinjau publik di wilayah Google Cloud di Singapura akhir tahun 2023 ini. Google Cloud dan NVIDIA memperluas kemitraan mereka untuk membantu organisasi memanfaatkan teknologi NVIDIA yang juga digunakan oleh tim riset Google DeepMind dan Google selama dua tahun terakhir.

Bisnis di Asia Tenggara sekarang dapat membangun aplikasi gen AI yang lebih baik dalam melayani pengguna lokal, dengan bahasa Mandarin Sederhana, Mandarin Tradisional, Indonesia, Thailand, dan Vietnam tersedia untuk PaLM 2 untuk Text dan Chat. Google Cloud menjadi penyedia cloud skala besar pertama yang memungkinkan pembuatan watermark tidak terlihat dan tahan tamper pada gambar yang dihasilkan AI.

Di Google Cloud Next '23, Google Cloud mengumumkan serangkaian kemitraan baru dan inovasi produk untuk memberdayakan setiap bisnis dan organisasi sektor publik di Asia Tenggara untuk dengan mudah bereksperimen dan membangun dengan model bahasa besar (LLM) dan model generative AI (gen AI), menyesuaikannya dengan data perusahaan, dan dengan mudah mengintegrasikan dan menyebarkannya ke aplikasi dengan fitur built-in privasi, keamanan, dan AI yang bertanggung jawab.

Peningkatan portofolio infrastruktur AI khusus Google Cloud
Kemampuan dan aplikasi yang membuat gen AI begitu revolusioner menuntut infrastruktur yang paling canggih dan mumpuni. Google Cloud telah berinvestasi di data center dan jaringannya selama 25 tahun, dan sekarang memiliki jaringan global 38 cloud region, dengan tujuan beroperasi sepenuhnya dengan energi bebas karbon 24/7 pada tahun 2030.
Jaringan global ini mencakup cloud region di Indonesia dan Singapura, dengan cloud region baru akan datang ke Malaysia dan Thailand. Infrastruktur AI yang dioptimalkan Google Cloud adalah pilihan utama untuk melatih dan melayani model gen AI, dengan lebih dari 70% unicorn gen AI yang sudah membangun di Google Cloud, termasuk AI21, Anthropic, Cohere, Jasper, Replit, Runway, dan Typeface.

Untuk membantu organisasi di Asia Tenggara menjalankan beban kerja AI mereka yang paling berat dengan biaya efektif dan skalabilitas, Google Cloud hari ini meluncurkan peningkatan signifikan pada portofolio infrastruktur AI yang dioptimalkan mereka: Cloud TPU v5e—tersedia dalam pratinjau publik—dan ketersediaan umum dari A3 VM dengan GPU NVIDIA H100.

Cloud TPU v5e adalah akselerator AI khusus Google Cloud yang paling hemat biaya, serbaguna, dan skalabilitas hingga saat ini. Sekarang, customer dapat menggunakan platform Cloud Tensor Processing Unit (TPU) tunggal untuk menjalankan pelatihan AI skala besar dan inferensi.

Cloud TPU v5e memberikan kinerja pelatihan hingga 2 kali lebih tinggi per dolar dan kinerja inferensi hingga 2,5 kali lebih tinggi per dolar untuk LLM dan model gen AI dibandingkan dengan Cloud TPU v4, sehingga memungkinkan lebih banyak organisasi untuk melatih dan menyebarkan model AI yang lebih besar dan lebih kompleks.

Cloud TPU v5e saat ini tersedia dalam pratinjau publik di cloud region Las Vegas dan Columbus Google Cloud, dengan rencana untuk diperluas ke wilayah lain, termasuk cloud region Singapura Google Cloud tahun ini.

Baca yang Ini Bos

A3 VM, superkomputer yang ditenagai oleh Unit Pemrosesan Grafis (GPU) NVIDIA H100, akan tersedia secara umum bulan depan, memungkinkan organisasi mencapai kinerja pelatihan 3 kali lebih cepat dibandingkan dengan A2, generasi sebelumnya. A3 VM dirancang khusus untuk melatih dan melayani beban kerja LLM dan gen AI yang sangat demanding.

Di Google Cloud Next '23, Google Cloud dan NVIDIA juga mengumumkan integrasi baru untuk membantu organisasi memanfaatkan teknologi NVIDIA yang sama yang digunakan oleh tim riset Google DeepMind dan Google selama dua tahun terakhir.

Google Cloud juga mengumumkan penyempurnaan infrastruktur utama lainnya, termasuk:

1. Google Kubernetes Engine (GKE) Enterprise: Memungkinkan skalabilitas horizontal multi-cluster yang diperlukan untuk beban kerja AI dan machine learning (ML) paling berat dan misi-kritis. Customer sekarang dapat meningkatkan produktivitas pengembangan AI dengan memanfaatkan GKE untuk mengelola beban kerja AI skala besar di Cloud TPU v5e. Selain itu, dukungan GKE untuk A3 VM dengan GPU NVIDIA H100 sekarang tersedia secara umum.
2. Cross-Cloud Network: Ini adalah platform jaringan global yang membantu customer menghubungkan dan mengamankan aplikasi antara cloud dan lokasi on-premises. Ini terbuka, workload-optimized – yang penting untuk kinerja end-to-end saat organisasi mengadopsi gen AI, dan menawarkan keamanan yang diberdayakan oleh ML untuk memberikan zero trust.

3. Penawaran AI baru untuk Google Distributed Cloud (GDC): GDC dirancang untuk memenuhi tuntutan unik organisasi yang ingin menjalankan beban kerja di edge atau di data center mereka. Portofolio GDC akan membawa AI ke edge, dengan integrasi Vertex AI dan penawaran terkelola baru AlloyDB Omni on GDC Hosted.

Mark Lohmeyer, Vice President and General Manager, Compute and ML Infrastructure, Google Cloud, mengatakan: selama dua dekade, Google telah membangun beberapa kemampuan AI terdepan di industri: dari penciptaan arsitektur Transformer Google yang memungkinkan gen AI, hingga infrastruktur AI yang dioptimalkan, yang dirancang untuk memberikan skala global dan kinerja yang dibutuhkan oleh produk Google yang melayani miliaran pengguna seperti YouTube, Gmail, Google Maps, Google Play, dan Android.

"Kami senang membawa inovasi selama beberapa dekade dan penelitian ke customer Google Cloud saat mereka mengejar peluang transformatif dalam AI. Kami menawarkan solusi lengkap untuk AI, dari infrastruktur komputasi yang dioptimalkan untuk AI hingga perangkat lunak dan layanan end-to-end yang mendukung siklus penuh pelatihan model, penyesuaian, dan penayangan di skala global,” katanya.

CEO Google dan Alphabet Sundar Pichai naik ke panggung di Google Cloud Next '23 untuk berbagi cara perusahaan membuat AI lebih bermanfaat bagi semua orang.

Di atas infrastruktur kelas dunia Google Cloud, perusahaan menghadirkan Vertex AI, platform AI komprehensif yang memungkinkan pelanggan mengakses, menyetel, dan menyebarkan model first-party, third-party, dan open-source, serta membangun dan menskalakan aplikasi AI kelas perusahaan.

Setelah peluncuran gen AI di Vertex AI, Google Cloud sekarang memperluas kemampuan Vertex AI secara signifikan. Ini termasuk:

1. Penyempurnaan PaLM 2: 38 bahasa, termasuk Bahasa Mandarin Sederhana, Bahasa Mandarin Tradisional, Bahasa Indonesia, Bahasa Thai, dan Bahasa Vietnam, sekarang tersedia secara umum untuk PaLM 2 untuk Text dan Chat – model first-party untuk meringkas dan menerjemahkan teks, dan mempertahankan percakapan yang berkelanjutan. PaLM 2 untuk Text dan Chat dapat diakses melalui Model Garden Vertex AI bersama dengan kemampuan adapter tuning.

Ini memungkinkan organisasi di Asia Tenggara untuk membangun aplikasi gen AI yang lebih baik melayani pengguna dalam bahasa lokal sambil meneguhkan respons dengan data perusahaan mereka sendiri atau korpus pribadi. Google Cloud juga berencana untuk hosting PaLM 2 untuk Text dan Chat di cloud region Singapura akhir tahun ini.

Untuk mendukung obrolan tanya jawab yang lebih lama dan meringkas serta menganalisis dokumen besar seperti makalah penelitian, buku, dan naskah hukum, PaLM 2 untuk Text dan Chat sekarang juga akan mendukung jendela konteks 32.000 token (cukup untuk menyertakan dokumen 85 halaman dalam prompt).

2. Peningkatan Codey: Peningkatan telah dilakukan pada kualitas Codey, model first-party Google Cloud untuk menghasilkan dan memperbaiki kode perangkat lunak, hingga 25% dalam bahasa yang didukung utama untuk generasi kode dan obrolan kode. Perusahaan dapat mengakses Codey melalui Model Garden Vertex AI bersama dengan kemampuan adapter tuning. Google Cloud juga berencana untuk hosting Codey di cloud region Singapura akhir tahun ini.

3. Peningkatan Imagen: Google Cloud memperkenalkan Style Tuning untuk Imagen, kemampuan baru untuk membantu perusahaan lebih menyelaraskan gambar mereka dengan pedoman merek mereka dengan 10 gambar atau kurang. Imagen adalah model first-party Google Cloud untuk membuat gambar studio-grade dari deskripsi teks. Perusahaan dapat mengakses Imagen melalui Model Garden Vertex AI.

Google Cloud juga meluncurkan watermark digital di Vertex AI, sekarang dalam ketersediaan eksperimental, untuk memberi perusahaan kemampuan untuk memverifikasi gambar yang dihasilkan AI oleh Imagen. Ketersediaan eksperimental watermark digital di Vertex AI menjadikan Google Cloud penyedia cloud skala besar pertama yang memungkinkan pembuatan watermark tidak terlihat dan tahan tamper pada gambar yang dihasilkan AI.

Teknologi ini didukung oleh Google DeepMind SynthID, teknologi terdepan yang menanamkan watermark digital langsung ke dalam gambar piksel, membuatnya tidak terlihat oleh mata manusia dan sangat sulit untuk dirusak tanpa merusak gambar.

4. Model baru: Llama 2 dan Code Llama dari Meta, Falcon LLM dari Technology Innovative Institute—model open-source yang populer—sekarang tersedia di Model Garden Vertex AI. Google Cloud juga mengumumkan ketersediaan Claude 2 dari Anthropic di Model Garden Vertex AI. Google Cloud akan menjadi satu-satunya penyedia cloud yang menawarkan adapter tuning dan pembelajaran penguatan dari umpan balik manusia (RLHF) untuk Llama 2.

5. Ekstensi Vertex AI: Pengembang dapat mengakses, membangun, dan mengelola ekstensi yang memberikan informasi real-time, memasukkan data perusahaan, dan mengambil tindakan atas nama pengguna.

6. Vertex AI Search and Conversation: Sekarang tersedia secara umum, alat ini memungkinkan organisasi membuat aplikasi pencarian dan obrolan canggih menggunakan data mereka hanya dalam hitungan menit dengan sedikit coding, dan manajemen dan keamanan kelas enterprise yang built-in.

7. Grounding: Google Cloud mengumumkan layanan grounding enterprise pada Vertex AI Search dan Conversation, dan model dasar di Model Garden Vertex AI, memberikan organisasi kemampuan untuk meneguhkan respons dalam data perusahaan mereka sendiri untuk memberikan respons yang lebih akurat. Perusahaan juga bekerja dengan beberapa customer untuk menguji grounding dengan teknologi yang memberi daya pada Google Search.

Google secara ketat mengevaluasi modelnya untuk memastikan mereka memenuhi Prinsip AI Bertanggung Jawab. Saat menggunakan Vertex AI, customer mempertahankan kendali penuh atas data mereka: data tersebut tidak perlu meninggalkan tenant cloud pelanggan, dienkripsi selama transit dan saat istirahat, dan tidak dibagikan atau digunakan untuk melatih model Google.

Thomas Kurian, CEO, Google Cloud, mengatakan: sama pentingnya dengan menemukan dan melatih model yang tepat adalah mengendalikan data. Sejak awal, merancang Vertex AI untuk memberi Anda kontrol penuh dan pemisahan data, kode, dan kekayaan intelektual, dengan nol kebocoran data.

Saat Anda menyesuaikan dan melatih model Anda dengan Vertex AI—dengan dokumen dan data pribadi dari aplikasi SaaS, database, atau sumber kepemilikan lainnya—Anda tidak mengekspos data itu ke model dasar.

"Kami mengambil snapshot model, memungkinkan Anda melatih dan merangkumnya bersama dalam konfigurasi pribadi, memberi Anda kontrol penuh atas data Anda. Prompt dan data Anda, serta masukan pengguna saat waktu inferensi, tidak digunakan untuk meningkatkan model kami dan tidak dapat diakses oleh pelanggan lain,” ujarnya.

Organisasi di berbagai industri dan di seluruh dunia sudah menggunakan Vertex AI untuk membangun dan menyebarkan aplikasi AI, termasuk affable.ai, Aruna, Bank Raykat Indonesia, FOX Sports, GE Appliances, HCA Healthcare, HSBC, Jiva, Kasikorn Business-Technology Group Labs, KoinWorks, The Estée Lauder Companies, the Singapore Government, Mayo Clinic, Priceline, Shopify, Wendy’s, dan banyak lagi.

Sejak mengumumkan dukungan gen AI di Vertex AI kurang dari enam bulan lalu, perusahaan sangat senang dan tersanjung melihat kasus penggunaan inovatif dari customer berbagai industri – dari perusahaan seperti GE Appliances, yang aplikasi konsumen SmartHQ-nya menawarkan pengguna kemampuan untuk menghasilkan resep khusus berdasarkan makanan di dapur mereka, hingga startup unicorn seperti Typeface, yang membantu organisasi memanfaatkan AI untuk brand storytelling yang menarik.

"Kami melihat permintaan yang kuat, dengan jumlah akun customer Vertex AI tumbuh lebih dari 15 kali dalam kuartal terakhir,” tambah Kurian.

Tentang Google Cloud
Google Cloud mempercepat kemampuan setiap organisasi untuk mentransformasi digital bisnis dan industrinya. Kami memberikan solusi kelas enterprise yang memanfaatkan teknologi mutakhir Google, dan alat yang membantu pengembang membangun secara lebih berkelanjutan. Customer di lebih dari 200 negara dan wilayah menjadikan Google Cloud sebagai mitra tepercaya mereka untuk mendorong pertumbuhan dan menyelesaikan masalah bisnis paling kritis mereka.

harisatiman

Widget HTML #1

Google Cloud Next '23: Infrastruktur yang Dioptimalkan untuk AI

Widget HTML #3