Raksasa teknologi seperti Google DeepMind, Meta, dan Nvidia tengah mengalihkan fokus dari model bahasa besar (LLM) ke “world models”, sistem AI yang belajar dari video dan data robotik untuk memahami serta berinteraksi dengan dunia fisik. Pergeseran ini dipicu oleh perlambatan inovasi LLM dan potensi ekonomi yang diperkirakan mencapai US$100 triliun, terutama di sektor manufaktur, kesehatan, hingga keuangan.
Fokus Utama:
1. Batas LLM Mulai Terlihat – Lompatan kinerja LLM seperti ChatGPT mulai melambat meski investasi mencapai puluhan miliar US$.
2. World Models: AI yang Belajar dari Dunia Nyata – Raksasa teknologi mengembangkan AI yang mampu memahami fisika, ruang, dan interaksi, bukan hanya teks.
3. Potensi Ekonomi Raksasa – Nvidia memperkirakan nilai pasar world models bisa menembus US$100 triliun, dengan aplikasi di robotika, kendaraan otonom, gaming, kesehatan, hingga keuangan.
Raksasa teknologi dunia beralih dari LLM ke “world models” yang mampu memahami dunia fisik. Potensi pasarnya diperkirakan tembus US$100 triliun, membuka peluang baru bagi robotika, kesehatan, manufaktur, hingga sektor keuangan.
Setelah euforia besar-besaran pada model bahasa raksasa (LLM), kini perhatian industri teknologi global bergeser. Google DeepMind, Meta, dan Nvidia tengah mengucurkan miliaran dolar untuk mengembangkan “world models”—AI yang tak hanya paham bahasa, tapi juga mampu memahami dunia fisik.
Perkembangan ini muncul di tengah keraguan akan masa depan LLM, yang melahirkan chatbot populer seperti ChatGPT. Meski investasi mencapai US$30–40 miliar, peningkatan performa tiap generasi LLM semakin mengecil. Elon Musk lewat xAI, OpenAI, hingga Google sama-sama menghadapi “tembok pertumbuhan” serupa.
Sebagai jawaban, para raksasa teknologi kini mengincar world models—sistem yang dilatih dengan data video, robotik, hingga simulasi lingkungan. Ambisinya jelas: menciptakan kecerdasan buatan yang dapat bernavigasi, berinteraksi, bahkan membuat keputusan di dunia nyata.
Rev Lebaredian, VP Omniverse Nvidia, menyebut peluangnya luar biasa. “Apa peluang dari world foundation models? Pada dasarnya… US$100 triliun jika kita bisa membuat kecerdasan yang memahami dunia fisik dan beroperasi di dunia nyata,” ujarnya.
Dari Laboratorium ke Industri
Google DeepMind baru saja merilis Genie 3, model video generatif yang belajar dari interaksi masa lalu, bukan sekadar merangkai gambar. Meta, lewat laboratorium FAIR yang dipimpin ilmuwan AI Yann LeCun, melatih model V-JEPA dengan cara “meniru anak-anak” yang belajar dari pengamatan. Sementara startup seperti Runway hingga World Labs menjajal penerapan world models untuk industri hiburan, mulai dari film hingga gim 3D interaktif.
Tak ketinggalan, Niantic—pengembang Pokémon Go—telah memetakan 10 juta lokasi di dunia nyata melalui interaksi 30 juta pemain bulanan. Data ini menjadi bahan bakar berharga untuk membangun model dunia berskala global.
Dampak pada Ekonomi dan Keuangan
Mengapa pergeseran ini penting untuk sektor finansial? Dengan world models, perbankan dan industri keuangan bisa melampaui sekadar chatbot layanan nasabah. Bayangkan AI yang mampu menganalisis risiko kredit dengan mensimulasikan kondisi dunia nyata, atau robot perbankan otonom yang melayani pelanggan di cabang fisik.
Riset McKinsey (2025) menilai penerapan AI fisik dapat meningkatkan produktivitas global hingga 1,5% per tahun. Bagi sektor keuangan, itu berarti otomatisasi proses risiko, keamanan biometrik yang lebih akurat, hingga simulasi pasar yang lebih realistis.
Namun, pengembangannya bukan tanpa tantangan. World models memerlukan data fisik dalam jumlah masif, komputasi superbesar, dan bisa memakan waktu hingga satu dekade sebelum mencapai kecerdasan menyerupai manusia.
Tetapi, seperti dikatakan Jensen Huang, CEO Nvidia: “Pertumbuhan besar Nvidia berikutnya akan datang dari ‘physical AI’, yang akan merevolusi robotika dan dunia nyata.”
Digionary:
● AI (Artificial Intelligence): Kecerdasan buatan yang dibuat untuk meniru kemampuan berpikir manusia.
● Chatbot: Program komputer berbasis AI yang bisa berinteraksi lewat teks atau suara.
● Genie 3: Model AI generatif video dari Google DeepMind.
● LLM (Large Language Model): Model bahasa besar yang dilatih dari jutaan data teks untuk memahami dan menghasilkan bahasa alami.
● Omniverse: Platform simulasi virtual milik Nvidia.
● Physical AI: AI yang mampu beroperasi di dunia fisik, bukan hanya digital.
● Pokémon Go: Gim realitas tertambah (AR) yang menjadi sumber data spasial bagi Niantic.
● Superintelligence: Kecerdasan buatan yang melampaui kecerdasan manusia.
● V-JEPA: Model AI Meta yang belajar dari pengamatan video untuk memahami dunia.
● World Models: Sistem AI yang dilatih dengan data dunia nyata (video, robotik, simulasi) untuk memahami fisika, ruang, dan interaksi.
#ArtificialIntelligence #WorldModels #GoogleDeepMind #MetaAI #Nvidia #PhysicalAI #FutureOfAI #Superintelligence #LLM #Robotika #Fintech #PerbankanDigital #AIinFinance #KecerdasanBuatan #Teknologi #Data #Simulasi #TransformasiDigital #McKinsey #FinancialInnovation
