Anak saya yang SMP tiba-tiba pulang dengan marah-marah. Karya tulisnya yang dibuat dengan kerja keras, sampai tidur malam, terindikasi plagiat oleh gurunya.
Ternyata gurunya menggunakan AI pemeriksa tulisan, dan tulisan anak saya terindikasi plagiat karya lain atau AI generated, oleh AI pemeriksa tulisan.
Sekarang ini ada trend menulis dengan AI generated, tulisannya ditulis oleh AI, penulisnya tinggal buat prompt, input di AI, lalu tinggal menyalin hasil AI.
Tapi ada juga AI untuk mendeteksi apakah tulusan tersebut di buat AI atau bukan, sekaligus untuk mendeteksi apakah tulisan tersebut plagiat atau bukan.
Pendeteksi plagiat berbasis AI, sebelumnya sudah mempunyai koleksi data berupa teks dari berbagai macam sumber seperti buku, artikel, blog, paper akademik, dan lain-lain. Semakin besar koleksi datanya, akan membuat semakin akurat kemampuan mendeteksi.
NLP, Natural Language Processing, digunakan untuk analisis teks. NLP ini akan memecah teks untuk mencari kesamaan kalimat, frase, kata, struktur kalimat, dan hubungan antar masing-masing komponen, termasuk kemungkinan terjadi parafrase.
Proses selanjutnya adalah dengan membandingkan hasil olahan NLP dengan data-data yang sudah terindeks, dan diberikan penilaian seberapa kemiripan dengan data-data yang sudah ada.
Untuk memeriksa apakah konten dibuat oleh AI atau manusia, caranya sedikit berbeda. Analisa dilakukan dengan melihat pola-pola linguistik, seperti variasi kalimat, ritme kalimat, panjang kalima, kompleksitas ,pengulangan dan beberapa parameter pola lain.
AI akan memeriksa apakah pola-pola tersebut mudah di prediksi atau tidak. Semakin mudah di prediksi, kemungkinan besar tulisan adalah dibuat oleh AI, semakin sulit di prediksi, besar kemungkinan tulisan tersebut adalah buatan manusia. Ini di sebut analisis perplexity.
Variasi pada kalimat dan ritma juga akan menjadi parameter yang di periksa. Manusia secara alami tidak terlalu memperhatikan penggunaan panjang pendek kalimat, dan secara alami tidak konsisten.
Sedangkan AI cenderung menulis lebih seragam dan lebih terstruktur.
Beberapa model AI, membuat pola-pola tersembunyi, dalam menyusun kalimat, sehingga mudah di deteksi.
Detektor AI bukan tidak punya kelemahan, hasilnya bisa saja false negative atau false positive. Beberapa tulisan manusia yang terstruktur seperti tulisan-tulisan akademik, cenderung akan mendapatkan hasil false positive.
Untuk tulisan-tulisan hasil plagiat yang di parafrase, atau di susun ulang juga sulit dideteksi.
AI juga sangat bergantung pada kualitas data awal untuk menentukan akurasinya. Semakin sedikit data, atau semakin rendah kualitas data maka akurasi akan menjadi semakin jelek.
AI juga tidak memahami konteks tulisan, sehingga bila terdapat teks sitasi, atau kutipan, kemungkinan besar akan di nilai sebagai plagiat atau ai generated.
Sebagai penulis, sangat penting untuk menjaga etika, agar tidak terjebak dalam plagiat. Plagiat tidak hanya merusak reputasi, tapi juga ada kemungkinan akan ada konsekuensi hukum.
Yang paling pertama dilakukan adalah bila melakukan sitasi, atau kutipan, lakukan dengan benar, sesuai tata cara yang berlaku.
Yang kedua bisa di lakukan adalah memeriksa, dengan AI tentu saja, apakah tulisan kita terdapat unsur-unsur yang menyebabkan terdeteksi sebagai ai generated, dan plagiat, sebelum memposting atau share tulisan. Ini untuk mencegah unsur ketidak sengajaan.
Untuk penulis yang mengambil inspirasi dari penulis lain, perlu memperhatikan etika dalam mengambil inspirasi. Pastikan tidak hanya menyadur begitu saja, tapi membuat hal baru, yang benar-benar asli.
Detektor AI sangat membantu untuk mengatasi maraknya plagiat dan konten-konten yang di generate AI, tapi penggunaannya tetap harus secara bijaksana, bukan seluruhnya diserahkan ke AI.
Keterlibatan manusia masih tetap dibutuhkan untuk memutuskan, karena AI mempunyai keterbatasan.
Saya membayangkan seandainya Chairil Anwar masih hidup sekarang, lalu ia memeriksa karyanya yang terbaru, apakah AI akan memberikan penilaian plagiat, atau bahkan AI generated ?