‘Godmother of AI’ Fei-Fei Li Bilang, AI Tak Akan Pernah Utuh Tanpa Kecerdasan Spasial

- 19 Desember 2025 - 16:03

Fei-Fei Li, sosok yang dijuluki “godmother of AI”, kembali mengguncang arah pengembangan kecerdasan buatan global. Melalui startup barunya, World Labs, ia mendorong lompatan besar dari AI berbasis bahasa menuju spatial intelligence—kemampuan mesin memahami dan membangun dunia tiga dimensi. Model terbarunya, Marble, membuka babak baru bagi industri kreatif, robotika, gim, hingga riset psikologi, sekaligus menegaskan bahwa AI masa depan tak cukup hanya bisa “berbicara”, tetapi juga harus mampu “memahami ruang”.


Fokus Utama:

■ Fei-Fei Li mendorong AI melampaui bahasa menuju kecerdasan spasial.
■ Marble membuka era baru dunia 3D untuk kreator, gim, dan robotika.
■ AI diposisikan sebagai penguat kreativitas manusia, bukan pengganti.


Fei-Fei Li menilai AI tak akan lengkap tanpa kecerdasan spasial. Lewat World Labs dan Marble, ia membuka era baru AI dunia 3D.


Selama dua dekade terakhir, kecerdasan buatan belajar memahami kata, kalimat, dan makna. Namun menurut Fei-Fei Li, itu belum cukup. Tanpa kemampuan memahami ruang fisik—jarak, bentuk, gerak, dan konteks dunia nyata—AI masih setengah jadi. Lewat World Labs, profesor Stanford yang merintis ImageNet itu kini berupaya mengajarkan mesin untuk “melihat” dan “hidup” di dunia tiga dimensi.

Nama Fei-Fei Li hampir tak terpisahkan dari sejarah modern kecerdasan buatan. Database ImageNet yang ia kembangkan hampir 20 tahun lalu menjadi fondasi revolusi computer vision dan melahirkan generasi AI yang mampu mengenali objek visual. Kini, Li melangkah lebih jauh.

Startup barunya, World Labs, membangun apa yang ia sebut sebagai spatial intelligence—kemampuan AI untuk memahami, menalar, dan menciptakan dunia fisik. Produk pertamanya, Marble, dirilis pada November lalu dan langsung menarik perhatian industri kreatif dan teknologi.

“World Labs adalah perusahaan frontier model. Kami benar-benar mendorong batas terdepan AI,” kata Fei-Fei Li seperti dikutip Financial Times. “Bagi saya, AI tidak akan lengkap tanpa cakupan dan kedalaman kecerdasan spasial seperti yang dimiliki manusia.”

Marble dan Dunia 3D

Berbeda dari model bahasa besar yang hanya memproses teks, Marble dirancang untuk menghasilkan dunia tiga dimensi. Pengguna bisa mengangkat foto atau video dunia nyata menjadi lingkungan virtual, atau menciptakan dunia imajiner sepenuhnya.

“Baik dunia nyata maupun imajiner, kemampuan menghasilkan dunia 3D dan mendukung alur kerja kreator adalah tujuan Marble,” ujar Li. “Namun yang terpenting, ini pendekatan model-first. Produk hanyalah pintu masuk untuk memahami bagaimana orang menggunakan model kami.”

World Labs memosisikan Marble bukan sebagai alat pengganti kreativitas manusia, melainkan penguatnya. “Saya sangat percaya kreativitas manusia tidak bisa digantikan,” kata Li. “Ia bisa diperkuat. Marble adalah kolaborasi yang memperkuat kreator, desainer, dan pengembang.”

Dari Film hingga Robot

Aplikasi Marble meluas lintas industri. Di industri efek visual dan film, Marble digunakan untuk memvisualisasikan ide, merancang set virtual, hingga produksi film berbasis virtual production. Dunia 3D yang dihasilkan bisa diekspor ke berbagai format dan diintegrasikan ke alur kerja profesional.

Arsitek dan desainer interior memanfaatkan Marble untuk menjelajah rancangan bangunan seolah sedang berjalan di dalamnya. Pengembang gim menggunakan struktur mesh dan collider Marble untuk membangun gameplay dengan cepat. Peneliti bahkan memanfaatkannya sebagai lingkungan imersif untuk studi psikologi dan kondisi klinis.

“Satu benang merah dari semua penggunaan ini adalah efisiensi waktu,” kata Li. Proses ideasi yang sebelumnya memakan waktu lama kini bisa dilakukan dalam hitungan menit. Seorang pelaku industri VFX bahkan menyebut Marble mempercepat pengembangan ide hingga 40 kali.

Kreativitas Tak Berbatas

Efisiensi ini memunculkan pertanyaan klasik: apakah teknologi akan memangkas tenaga kerja? Li menepis anggapan itu.

“Ini tergantung apakah Anda percaya kreativitas itu terbatas atau tidak,” katanya. “Saya percaya kreativitas manusia tak terbatas.”

Dengan waktu yang dihemat, kreator justru bisa mengeksplorasi lebih banyak gagasan. “Sebagai kreator, Anda tidak hanya punya satu ide. Kadang 10 ide memicu 10 ide lainnya. Proses itu mahal dan memakan waktu. Marble memangkas hambatan tersebut.”

Gim, Transmedia, dan Disrupsi

Dalam industri gim, Li melihat potensi disrupsi besar. Mesin gim dan simulasi neuro-inspiratif dinilai perlu berevolusi agar lebih ramah bagi kreator. Marble dan model dunia sebelumnya, RTFM, disebut sebagai bagian dari gelombang baru GenAI.

“Gim kini bukan sekadar gim,” kata Li. “Ia menyatu dengan pengalaman, edukasi, dan produktivitas. Inilah era transmedia—dan AI generatif seperti Marble akan menjadi fondasinya.”

Di tengah maraknya pengembangan world models oleh raksasa teknologi, Li menegaskan posisi unik World Labs. “Kami adalah perusahaan pertama yang sejak dua tahun lalu sepenuhnya berfokus pada kecerdasan spasial,” ujarnya.

Jika large language models mewakili kecerdasan linguistik, maka world models adalah jalan menuju kecerdasan spasial—kemampuan agen berwujud, baik manusia, avatar, maupun robot, untuk memahami dan berinteraksi dengan dunia.

Jembatan ke Robotika

Bagi Li, kecerdasan spasial adalah kunci masa depan robotika. Pelatihan robot membutuhkan kombinasi data dunia nyata, data web, dan data sintetis dari simulasi. “Kita masih sangat jauh dari memecahkan robotika,” katanya. “Masalah data masih sangat besar.”

Pengalaman mobil otonom menjadi pelajaran penting. Jika mobil tanpa pengemudi saja membutuhkan dekade untuk mengatasi tantangan data, robot yang harus memanipulasi objek di dunia nyata menghadapi kompleksitas jauh lebih besar. Di sinilah lingkungan simulasi berbasis dunia 3D menjadi krusial.

Apakah ini langkah menuju superintelligence? Li memilih fokus yang lebih membumi. “Bintang utara kami adalah kecerdasan yang membawa kebaikan bagi manusia,” katanya. “AI, apa pun namanya, harus melayani kemanusiaan.”


Digionary:

● Computer Vision: Cabang AI yang memungkinkan mesin memahami gambar dan video
● GenAI: AI generatif yang mampu menciptakan konten baru
● ImageNet: Database visual yang menjadi fondasi modern computer vision
● Large Language Model (LLM): Model AI berbasis pemrosesan bahasa
● Spatial Intelligence: Kemampuan memahami dan menalar ruang fisik
● Transmedia: Pendekatan konten lintas platform dan format
● Virtual Production: Teknik produksi film berbasis lingkungan digital
● World Model: Model AI yang merepresentasikan dunia 3D secara utuh

#FeiFeiLi #ArtificialIntelligence #SpatialIntelligence #WorldModels #GenAI #AI3D #MarbleAI #TeknologiMasaDepan #Robotika #GameDevelopment #VFX #CreativeAI #AIInnovation #StanfordAI #DigitalCreativity #VirtualWorlds #FutureOfAI #AIResearch #TechLeaders #WorldLabs

Comments are closed.