Mari Berkomentar Tipis Tentang: AI
Belakangan marak kembali tren tantang AI, khususnya dalam bidang visual seiring dengan populernya layanan Bing Image dari Microsoft. Tulisan ini sudah tentu isinya bakal subjektif, namanya juga komentar. Anda sebagai pembaca tidak diwajibkan sama sekali untuk setuju maupun tidak setuju, ndak masalah. Saya menulis juga biar nggak jenuh dan biar ini blog ada updatenya juga. Jadi, mari kita mulai.
Awal 2024 lalu, tagar #TolakGambarAI sempat menjadi trending topic selama beberapa hari. Wah menarik ini, batin saya waktu itu :"). Dari poin yang saya tangkap, ada beberapa pemicu yang menyebabkan munculnya tagar ini. Pertama karena ada paslon capres-cawapres yang pakai Generative Image sebagai aset visual kampanye yang mana ini dianggap tidak memberikan apresiasi ke para pekerja kreatif, khususnya desainer lokal, dan kedua karena ditemukan dugaan pelanggaran properti oleh sebuah layanan generator gambar yang cukup populer.
Untuk yang pertama ini, saya ga mau komentar banyak-banyak, karena emang ga tau apa motivasinya. Apakah karena menghemat budget, mau nyoba ngikutin trend dan nunjukin kalau mereka update soal tema-tema teknologi, entah. Apakah saya apatis? Ya, toh nyatanya kita ga bisa kan peduli dengan semua hal, ada beberapa hal yang memang perlu diapatisasi dalam hidup ini untuk menjaga kewarasan, dan tentu saja hal tersebut pasti berbeda antara saya dan Anda sekalian. Mari skip soal ini.
Untuk yang kedua, ini menarik sekaligus mungkin menakutkan. Namun sebelum saya lanjut lebih jauh, boleh dibilang saya termasuk orang yang cukup antusias mengikuti perkembangan layanan-layanan AI sejak ChatGPT versi awal. Apa yang terjadi belakangan ini mengingatkan saya tentang serial Kamen Rider Faiz dan Zero One yang mengangkat tema teknologi, khususnya Zero One sih yang sangat spesifik mengangkat tema tentang kontroversi AI dalam keseharian manusia. Dari serial tersebut, poin generiknya adalah human dan humagear (robot AI di serial tsb), bisa banget buat berkolaborasi untuk menyelesaikan pekerjaan tertentu. Kenyataanya teknologi tetaplah memiliki batasan, demikian juga penggunanya. Dengan kolaborasi tersebut, batasan tersebut dapat di-extend sehingga bisa mendapatkan hasil yang lebih maksimal saat mengerjakan sesuatu.
Dalam beberapa kesempatan, saya pun demikian. Tidak mau ketinggalan, saya memanfaatkan akses AI yang ada ini untuk membantu beberapa pekerjaan saya, misal untuk menulis kode javascript, membuat ringkasan, membuat dummy data untuk testing dan lain sebagainya. Paling apes, saat ini layanan semacam Chat OpenAI menjadi salah satu rujukan cepat untuk mencari tahu atau membuat sesuatu, walau levelnya masih di bawah googling. E tapi googling sendiri sebenarnya ya dibantu AI di balik layar untuk pengumpulan dan sortingnya :"
Kalau dalam konteks AI visual, beberapa kali saya sempat membuat video terkait hal ini. Misalnya untuk membuat embeded caption pada gambar yang akan diunggah ke Shutterstock, melakukan vektorisasi gambar secara cepat dan akurat, dan tentu saja membuat beberapa aset visual.
Lalu dimana menakutkannya? Oke balik ke pembahasan awal lagi. Beberapa waktu lalu ditemukan beberapa data style visual yang di-training-kan ke layanan pembuat gambar AI, Midjourney. Untuk yang belum paham maksud di-training-kan, gampangnya sih gini; salah satu komponen penting dalam gambar generatif AI adalah inputan model data. Inputan data yang sebegitu banyaknya ini nggak akan terlalu berguna kalau misalnya nggak memiliki spesifikasi khusus, karena tentu hasilnya akan generic. Nah maka perlulah istilah training data ini untuk memberikan informasi yang lebih spesifik. Misal saya ingin gambar Kopi, maka kecerdasan buatan ini bakal mencarikan informasi hanya yang terkait dengan kopi saja, sehingga gambar yang dihasilkan tentu akan lebih relate dengan apa yang kita request.
Permasalahan dimulai saat beberapa orang melakukan training data dengan sumber data milik orang lain. Meski ini boleh saya bilang susah juga untuk di-track, mengingat biasanya gambar yang dijadikan bahan training ini memang sudah di-publish secara bebas di jagat maya. Apakah ini tindakan yang salah secara hukum, bisa jadi iya bisa jadi tidak, tapi tentu buruk secara norma :"
Pun demikian, saya terkadang masih merasa hal semacam ini masih agak bias. Misal gaya gambar WPAP, itu merupakan gaya desain visual yang cukup populer bahkan hingga sekarang, dan banyak direplikasi dan digunakan oleh desainer dan kreator, tapi agaknya hal ini biasa saja. Tidak pernah ada masalah sekalipun digunakan untuk layanan jasa, namun begitu masuk ke dalam sebuah sistem generator, barulah kemudian muncul hal yang dipermasalahkan.
Untuk saya, ini mirip-miriplah dengan fenomena yang muncul saat awal-awal kemunculan batik cetak, ketakutan akan pergeseran eksistensi batik tulis. Tapi toh akhirnya waktu menjawabnya. Sampai hari ini eksistensi batik tulis masih tetap ada, dan bahkan memiliki value yang berlipat kali lebih tinggi dari batik cap atau batik cetak. Perlu waktu untuk yang panjang untuk sampai di titik ini, demikian juga tarik ulur tentang gambar generatif.
Beberapa Hal yang Bikin Miris dan Geleng-Geleng
Euforia terkait kemudahan membuat gambar ini makin menjadi beberapa bulan belakangan, boleh dibilang ini berkat munculnya banyak layanan generator yang memberikan opsi generate secara cuma-cuma dan tanpa perlu memasang banyak ini itu. Bing milik Microsoft mungkin bisa saya sebut sebagai salah satu yang cukup populer, meski sampai hari ini saya belum pernah pakai.
Bermuculan banyak grup dengan topik AI Image Generator, baik di Telegram, Facebook, dan lain sebagainya. Yang kadang bikin saya geleng-geleng, ya mohon maaf banget ini, banyak yang overproud dengan gambar generatif. Sehinggal akhirnya munculah glorifikasi misalnya dengan sebutan, AI Artist, seniman AI, dan sejenisnya. Ini aneh dan lucu secara bersamaan. Bagaiamana bisa seseorang mengaku sebagai kreator sedang bukan ia yang membuat karya tersebut.
Ini tentu tidak bisa dipersamakan misal dengan misal pembuat roti yang menggunakan mesin dan mengakui bahwa roti yang dibuat dengan mesin tersebut adalah roti ciptaanya. Dimana perbedaanya? Kontrol output. Seorang pembuat roti dapat mengontrol secara penuh semua aspek dalam pembuatan roti, mesin hanya alat bantu untuk produksi, sehingga untuk dapat hasil akhir roti yang diinginkan oleh si pembuat dapat benar-benar diatur dan dikontrol, termasuk komposisi apa saja yang ingin dan tidak ingin ada dalam adonan. Hal ini mungkin juga dapat diasosikan kepada pekerja seni digital yang menggunakan aplikasi semacam Inkscape, Gimp, Photoshop, Illustrator, dan semacamnya. Mereka punya kendali penuh dan tau akan membuat seperti apa, bukan gacha.
Nah hal tersebut yang tidak bisa kita dapatkan dalam gambar generatif. Tapi kan kita membuat prompt, prompt itu kan resepnya. Iya, maka berarti yang sebenarnya karya Anda ya prompt itu sendiri, bukan output gambarnya. Itupun juga kalau prompt-nya meramu sendiri, bukan hasil mix sana-sini. Inilah mengapa saya lebih mengakui prompt enginer atau peramu input alih-alih AI Artist. Kecuali …
Anda melakukan training khusus pada data visual yang akan digunakan, kemudian dari sana Anda dapat mengontrol penuh semua output yang ingin dihasilkan, barulah saya mengakui Anda sebagai Trainer Data (bukan AI Artist juga dong) :“D
Jadi AI Artist itu ada atau nggak, untuk saya pribadi, sekeren apapun gambar yang misalnya saya create dengan AI, maka saya nggak akan pede untuk bilang itu karya saya, apalagi sampai berjuluk diri sebagai seniman AI. Untuk Anda yang merasa sebagai seniman AI, ya silakan saja, kan sudah saya bilang di awal ga ada keharusan setuju di obrolan ini.
Hal yang Tentu Saya Hindari
Seperti sempat saya katakan, bahwa saya juga menggunakan AI untuk membantu pekerjaan. Namun tentu ada batasan-batasan yang secara personal akan saya coba untuk patuhi agar tetap waras dalam berteknologi. Beberapa batasan tersebut misalnya; tidak menggunakan komponen AI sebagai aset visual utama untuk pesanan jasa komersial, kecuali dari klien memang memberikan rekomendasi, tapi tentu saya bakal kasih aware pros-cons-nya ke yang bersangkutan.
Untuk format foto realistis dengan karakter asli, ini sebisa mungkin saya hindari karena bisa berpotensi bikin hoax atau misinformasi. Kalau dalam format kartun, vektor, mungkin masih okelah karena orang waras masih akan sadar kalau itu bukan foto karakter asli dalam situasi tersebut.
Termasuk yang saya hindari adalah penggunaan layanan generator online sebelum membaca Term of Service yang mereka miliki. Sebagai mana yang sempat disinggung di atas, gambar yang dihasilkan dari layanan gambar generatif merupkan buatan sistem AI, saya rasa fair untuk mengatakan hal cipta dari segala yang dihasilkan by default adalah milik penyedia layanan. Untuk itu, saya sangat berhati-hati soal ini.
Saya hanya menggunakan layanan yang secara tertulis menyatakan bahwa gambar yang dihasilkan oleh sistem mereka, secara penuh haknya diberikan kepada pembuat prompt. Setidaknya ini membuktikan bahwa si penyedia layanan cukup pede untuk bilang kalau data yang mereka trainingkan aman dari sengketa properti. Selain itu saya juga lebih leluasa untuk mengolah aset tersebut menjadi aset yang lebih matang. Ini juga alasan saya enggan menggunakan Bing :”
Apa yang terjadi di Midjourney bukan mustahil terjadi platform lain. Sekadar info, beberapa waktu lalu saya sempat mencoba untuk melakukan training data dengan bermodal gambar sendiri, dan berhasil walau masih amatir. Keberhasilan ini membuat saya jadi sadar betapa gampangnya misal saya ingin membuat data model dari konten asal comot di internet. Ini bisa saya definisikan keren, gila, mengerikan, dan menyeramkan secara bersamaan. Ada hikmah manfaat untuk rekan-rekan saya yang selalu konsisten posting foto dengan muka ditutup atau gambar portofolio tapi kualitasnya burik. Tapi nggak perlu panik berlebih juga, kelak ada namanya istilah Glazing untuk mengatisipasi dan melindingi aset visual dari penggunaan yang sembrono dan menyalahi aturan semacam ini.
Untuk AI dalam membantu ngetik kode, saya rasa per hari ini masih fine-fine aja selama kita sudah miliki fundamental pemahaman kode tersebut, jadi tahu dan bisa ndebug kalau (dan pasti sering terjadi) kodenya error. Toh bash, javascript, python, ini kan ya mau di negara manapun sintaknya bakal sama karena memang standar. Yang pada akhirnya membedakan misal ada beberapa dev yang pakai AI untuk membuat program yang sama adalah urutan logic atau algoritma serta style kode.
Menjadi Lebih Relevan
Menjadi relevan di setiap zaman, saya rasa adalah implementasi untuk menjadi khoirunnas, karenya dengan kemampuan untuk terus bersaing dan beradaptasi ini yang nantinya berpotensi menjadikan kita anfa’u(hum) linnas.
Jadi karya AI ga akan gantiin manusia kah? Ya belum tentu, kalau manusianya nggak mau belajar dan berkembang ya pasti kalah juga, walaupun saya meyakini bahwa gambar generatif ini sebenarnya menciptakan pasarnya tersendiri, meskipun tidak dapat dipungkiri bakal ada beberapa aspek pasar yang beririsan sehingga muncul diskusi panjang seperti yang terjadi saat ini.
Saat ini jasa-jasa untuk training data semakin diminati, begitu juga peramu input kata kunci alias prompt enginer, tengah menjadi profesi baru yang banyak dibutuhkan. Enaknya di jaman sekarang, untuk memilki skill, misalnya terkait dua hal tersebut, dapat dipelajari dengan mudah karena adanya akses yang mumpuni dan hampir ta terbatas. Ini membuat peluang semua orang, teorinya ya, menjadi kurang lebih sama sekaligus menjadi tantangan besar secara bersamaan. Yang membedakan tentu amal perbuatan dan silsilah dan warisan keluarga, #eh.
Menggunakan AI nggak membuat saya menjadi lebih keren sebagai kreator, namun dapat memberikan efisiensi waktu dalam pengerjaan. Tidak menggunakan AI juga nggak membuat saya lebih keren karena merasa superior dan paling ahli, namun dapat meningkatkan dan mengasah kepekaan emosional visual dalam berkarya, kalau konteksnya seni, dan meningkatkan pemahaman fundamental skill kalau konteknya nulis kode.
Apa Selanjutnya?
Saya masih meyakini bahwa; terlepas dari besar kecilnya peminatnya, kesenian, apapun itu bentuknya, akan memiliki tempat masing-masing di setiap jaman. Seni yang baik menurut saya pribadi adalah yang dapat memberikan kebahagian kepada para penikmatnya tanpa perlu memberikan kerugian pada sekitar.
Saya akan tetap menjadi saya, ish apasih! Menggunakan atau tidak menggunakan AI, dalam hal ini gambar generatif, itu terserah. Suka-suka, namun akan lebih baik jika sebelum memutuskan untuk menggunakan atau tidak menggunakan, kita paham dulu beberapa aspek pengetahuan seperti lisensi, hak cipta, properti intelektual, serta norma umum yang berlaku. Kesadaran ekstra tentang publisitas di jagat maya juga diperlukan.
Seringkali kita bukan tidak suka dengan perkembangan teknologinya, namun sekadar kesal karena kerja keras yang kita telah lalui, dapat dicapai orang lain secara lebih mudah, atau dongkol karena memiliki saingan yang menurut kita skill-nya di bawah diri kita. Atau Itu manusiawi, sah-sah saja. Di luar topik ini, hal tersebut juga memberi saya jawaban mengapa Tuhan memberikan label dosa besar saat disekutukan/dipersamakan dengan makhluk yang levelnya sudah jelas-jelas jauh di bawah-Nya.
Mari Berkomentar Tipis Tentang: AI