Goldman Sachs: AI Sudah Kehabisan Bahan Bakar Data!

- 4 Oktober 2025 - 07:08

Ledakan kecerdasan buatan (AI) menghadapi tantangan serius: dunia sudah kehabisan data segar untuk melatih model. Perusahaan kini beralih ke data sintetis dan basis data eksklusif, tetapi keduanya menyimpan risiko besar terhadap kualitas, kepercayaan, dan arah perkembangan AI di masa depan.


Fokus Utama:

1. Krisis Data AI: Goldman Sachs menyebut dunia telah kehabisan data segar, memaksa industri beralih ke data sintetis.
2. Peran Data Korporasi: Dataset eksklusif perusahaan dipandang sebagai “tambang emas” berikutnya bagi pengembangan AI.
3. Risiko Serius: Ketergantungan pada data sintetis berisiko memicu “AI slop” atau luapan konten murahan, sementara data korporasi menimbulkan persoalan privasi dan etika.


Industri AI menghadapi krisis data setelah seluruh internet “diperas” habis. Goldman Sachs menyebut masa depan AI kini bertumpu pada data sintetis dan basis data korporasi, tetapi keduanya membawa risiko besar terhadap kualitas, etika, dan privasi.


Gelombang kecerdasan buatan yang selama tiga tahun terakhir mendominasi lanskap teknologi global kini menghadapi tembok besar: krisis data. Menurut Goldman Sachs, dunia telah menguras hampir seluruh data publik yang tersedia di internet untuk melatih AI, dan ini bisa menjadi titik balik penting. Dari Silicon Valley hingga Beijing, para pengembang mulai melirik data sintetis dan basis data korporasi sebagai jalan keluar, tetapi keduanya menghadirkan dilema baru: kualitas rendah dan risiko bias.

“Kita sudah kehabisan data,” ujar Neema Raphael, Chief Data Officer Goldman Sachs, dalam podcast Exchanges yang dirilis pekan ini. Menurut Raphael, kelangkaan data ini mulai mengubah cara sistem AI dibangun, termasuk munculnya tren pelatihan model berbasis keluaran model lama, bukan lagi dari sumber manusia asli.

China, lewat perusahaan DeepSeek, diduga sudah menggunakan strategi ini untuk memangkas biaya pelatihan. Namun, konsekuensinya bisa berbahaya: model AI yang hanya dilatih dari keluaran AI lain berpotensi menciptakan lingkaran kualitas rendah tanpa inovasi baru.

Data Sintetis: Solusi atau Masalah Baru?

Dengan internet hampir habis “diperas”, para pengembang kini beralih ke data sintetis—teks, gambar, atau kode yang dihasilkan mesin. Keuntungannya, pasokan tak terbatas. Kekurangannya, kualitas merosot. Istilah “AI slop” (lumpur AI) pun muncul untuk menggambarkan banjir konten murahan yang justru bisa merusak model.

Kondisi ini sejalan dengan peringatan Ilya Sutskever, salah satu pendiri OpenAI, yang awal 2025 lalu menegaskan bahwa “era perkembangan pesat AI akan tak terhindarkan berakhir” karena semua data bernilai tinggi sudah habis digunakan.

Raphael menilai jalan keluar terbesar justru ada di data korporasi yang belum tergarap. Dari alur perdagangan, interaksi klien, hingga data transaksi finansial, perusahaan besar duduk di atas “tambang emas” data yang bisa memperkuat AI.

“Tantangannya bukan sekadar menemukan data, tetapi memahami konteks bisnisnya, lalu menormalisasi agar bisa dipakai dengan benar,” jelas Raphael.

Bagi bank sekelas Goldman Sachs, ini berarti AI bisa digunakan bukan hanya untuk analitik, tetapi juga prediksi pasar dan manajemen risiko. Namun, pemanfaatan data korporasi juga menimbulkan perdebatan etis: sejauh mana privasi konsumen bisa dijaga jika data internal perusahaan dijadikan bahan bakar AI?

Risiko Filosofis: AI Tanpa Sentuhan Manusia

Raphael mengingatkan, jika data sintetis mendominasi, dunia bisa menghadapi “creative plateau” — titik jenuh kreativitas. “Jika semua data dihasilkan mesin, berapa banyak lagi data manusia yang bisa dimasukkan?” ujarnya. Pertanyaan ini bukan hanya teknis, tapi juga filosofis: apakah AI masih mencerminkan kreativitas manusia, atau hanya bayangan dari mesin sebelumnya?

Digionary:

● AI Slop: Konten berkualitas rendah yang dihasilkan AI secara berulang dan berisiko merusak kualitas model.
● ChatGPT: Model AI populer buatan OpenAI yang menjadi pemicu revolusi AI sejak 2022.
● Creative Plateau: Titik jenuh kreativitas saat AI hanya dilatih dari data buatan mesin, bukan manusia.
● Data Korporasi (Proprietary Data): Data eksklusif yang dimiliki perusahaan, misalnya data transaksi, interaksi pelanggan, atau alur produksi.
● Data Sintetis: Data buatan mesin (teks, gambar, kode) yang dipakai sebagai pengganti data asli.
● DeepSeek: Perusahaan AI asal Tiongkok yang diduga melatih model dengan keluaran AI lain untuk mengurangi biaya.
● Generative AI: AI yang mampu menciptakan konten baru seperti teks, gambar, atau musik.
● Goldman Sachs: Bank investasi global asal AS yang aktif di bidang riset data dan pengembangan teknologi.
● Ilya Sutskever: Cofounder OpenAI, dikenal sebagai salah satu tokoh utama dalam riset AI.
● OpenAI: Perusahaan riset AI asal AS yang menciptakan ChatGPT dan GPT-4.

#ArtificialIntelligence #AI #DataCrisis #SyntheticData #GoldmanSachs #AITrends #ChatGPT #OpenAI #DeepSeek #MachineLearning #BigData #DataPrivacy #AIethics #AIinnovation #DigitalTransformation #TechNews #FutureOfAI #AIphilosophy #GenerativeAI #AItrust

Comments are closed.