NVIDIA Research: Mengubah Cara Robot Belajar dengan Eureka

Gambar : Generated by Dall-E 3

Jakarta - Dalam beberapa dekade terakhir, dunia robotika telah berkembang pesat, hingga robot kini mampu melakukan tugas-tugas rumit dengan keahlian luar biasa. Mereka hampir seperti pesaing manusia dalam tingkat ketangkasan. Kemajuan ini telah mendekatkan kesenjangan antara kemampuan manusia dan robot secara signifikan. Salah satu tonggak penting dalam perjalanan ini adalah pengembangan agen artificial intelligence (AI) yang mampu melatih robot untuk melakukan tugas-tugas kompleks dengan mandiri. Salah satu inovator perusahaan yang muncul dalam arena ini adalah NVIDIA Research.

Eureka: Guru Pribadi untuk Robot

Salah satu elemen kunci dalam pelatihan robot adalah reward algorithm. Algoritma tersebut memberikan umpan balik kepada robot tentang sejauh mana mereka berhasil dalam mengeksekusi suatu tugas. Tradisionalnya, reward Algoritma ini harus dirancang dan diberikan oleh manusia, yang dapat menjadi tugas yang rumit dan memakan waktu. Namun, Eureka mengubah paradigma ini. Agen AI Eureka mampu secara mandiri merumuskan reward algorithm, tanpa campur tangan manusia. Dalam video yang diberikan, Eureka telah mengajari tangan robot untuk melakukan berbagai tugas, termasuk trik memutar pena, membuka laci, melempar dan menangkap bola, dan banyak lagi. Eureka telah menguasai total hampir 30 tugas yang melibatkan advanced skills.


Coba kita bayangkan Eureka seperti guru pribadi bagi robot. Biasanya, guru harus memberikan nilai dan pujian kepada muridnya agar mereka dapat memahami sejauh mana kemajuan mereka. Namun, apa yang membuat Eureka spesial adalah kemampuannya untuk secara otomatis memberikan pujian ini, tanpa bantuan manusia. Bayangkan jika guru tidak perlu memberikan nilai, tetapi murid secara otomatis tahu kapan mereka melakukan hal yang benar.

Bagaimana Eureka Bekerja

Eureka memanfaatkan Model Bahasa Besar (Large Language Model) yang disebut GPT-4. Model bahasa ini digunakan untuk membuat software code yang memberi award kepada robot atas reinforcement learning. Proses ini tidak memerlukan instruksi khusus untuk tugas tertentu atau reward template yang telah ditentukan sebelumnya. Kita dapat membayangkan GPT-4 sebagai "panduan super pintar" yang membantu Eureka memberikan pujian kepada robot atas kemampuan yang diperoleh melalui latihan. Proses ini tidak memerlukan petunjuk khusus atau aturan hadiah yang telah ditentukan sebelumnya.

Selain itu, Eureka dapat menerima masukan dari manusia. Dimana memungkinkan sistem untuk lebih akurat menyelaraskan umpan balik manusia sesuai dengan tujuan dan harapan pengembang. Ini seperti bekerja sama dengan seorang guru untuk memahami cara terbaik memberikan pujian agar murid dapat tumbuh dan berkembang. Sehingga menjadikan kolaborasi yang kuat antara AI dan manusia. Fitur yang sangat menonjol dari Eureka adalah kemampuannya mengevaluasi banyak award candidate secara bersamaan secara efisien. Contohnya seperti guru yang bisa memberi nilai kepada seluruh kelas dalam waktu singkat. Hal ini dicapai melalui simulasi yang dipercepat dengan menggunakan GPU pada physics simulation reference application bernama NVIDIA Isaac Gym. Dengan cara ini, waktu dan sumber daya yang diperlukan untuk penilaian dapat dihemat secara signifikan. Bayangkan jika guru bisa memberi nilai seluruh kelas dalam waktu singkat dan hemat sumber daya.

Keberhasilan dan Implikasi

Hasil penelitian menunjukkan bahwa program award yang dibuat oleh Eureka unggul dalam menghasilkan result of trial-and-error learning untuk robot. Eureka mampu meningkatkan kinerja average robot lebih dari 50% dalam berbagai tugas. Dengan kata lain, robot yang dilatih dengan bimbingan Eureka menjadi jauh lebih cakap dalam mengeksekusi tugas-tugas yang rumit.

Selain itu, Eureka dapat menciptakan award yang baru dan efektif yang melebihi kinerja yang dirancang oleh manusia. Ini menunjukkan tingkat learning dan kemampuan generatif yang luar biasa yang dimiliki oleh Eureka.

Masa Depan Robotika

Kemajuan yang ditunjukkan oleh Eureka dari NVIDIA Research adalah contoh nyata dari revolusi dalam robotic learning. Robot bukan hanya sekadar alat pasif yang menjalankan perintah manusia, tetapi mereka menjadi active learner yang mampu memahami tugas-tugas yang kompleks dan mengambil keputusan yang cerdas.

Keberhasilan dalam robotic learning, seperti trik memutar pena yang diajarkan oleh Eureka, membuka jalan untuk implementasi robot dalam berbagai aplikasi di dunia nyata. Mulai dari Household Duties hingga proses industri yang rumit, robot akan dapat melaksanakan tugas-tugas tersebut dengan tingkat presisi dan efisiensi yang sebelumnya dianggap sulit dicapai.

Kesimpulan

NVIDIA Research telah mencapai terobosan penting dalam pengembangan artificial intelligence untuk melatih robot. Agen AI Eureka, yang mampu merumuskan reward algorithm secara otomatis, telah membuka pintu menuju robotic learning yang lebih efisien dan mandiri. Ini adalah tonggak penting dalam evolusi robotika dan membawa kita lebih dekat menuju masa depan di mana robot akan menjadi mitra yang lebih efektif dalam berbagai aspek kehidupan kita.

Glosarium

  • GPU: GPU (Graphics Processing Unit) merupakan sebuah komponen komputer yang memiliki peran penting dalam pemrosesan grafis. 
  • Household Duties: Pekerjaan yang biasanya dilakukan dalam kehidupan sehari-hari, seperti membersihkan, memasak, dan merapikan.
  • Large Language Model: Model artificial intelligence yang digunakan untuk memahami dan menghasilkan bahasa manusia.
  • Reinforcement Learning: Metode pembelajaran di mana agen belajar tindakan yang mengoptimalkan imbalan dalam suatu lingkungan.
  • Reward Algorithm: Sistem yang memberikan umpan balik kepada robot atau agen artificial intelligence untuk mengukur sejauh mana mereka berhasil dalam suatu tugas.
  • Software Code: Instruksi atau perintah yang digunakan oleh komputer atau robot untuk melakukan suatu tugas.

Referensi