TEMPO.CO, Jakarta - Pengembangan teknologi kecerdasan buatan atau artificial intelligence (AI) semakin kencang. Pemanfaatannya pun meluas ke berbagai sektor untuk membantu manusia di level yang belum pernah terbayangkan. Namun demikian, di tengah seabreg sisi positifnya, AI telah meningkatkan kekhawatiran atas beragam bentuk penyimpangan dalam penggunaannya.

Penggunaan AI di dunia pendidikan termasuk yang menjadi perhatian banyak kalangan. AI telah meningkatkan risiko atas isu keaslian jawaban ataupun karya tulis peserta didik. Pada satu sisi, AI diyakini belum cukup mampu menggantikan manusia dalam hal gaya penalaran. Namun di sisi lain, manusia pada kenyataannya juga tak mudah mengidentifikasi hasil karya AI, termasuk jawaban ujian.

Hasil riset terbaru University of Reading, Inggris, membuktikannya. Penguji tak mendeteksi sekitar 94 persen dari tugas ujian universitas yang dibuat menggunakan ChatGPT. “Rata-rata, respons AI memperoleh nilai lebih tinggi dibandingkan respons siswa kami yang sebenarnya,” kata Peter Scarfe, Associate Professor pada Schol of Psychology and Clinical Language Sciences, University of Reading, seperti dikutip Tempo dari New Scientist, Selasa, 16 Juli 2024.

Scarfe dan timnya menggunakan ChatGPT untuk menjawab 63 pertanyaan ujian pada lima modul di program studi sarjana psikologi University of Reading. Ujian ini mencakup soal dengan jawaban singkat dan esai panjang. Para mahasiswa mengerjakan ujian ini di rumah, sehingga mereka diperbolehkan melihat catatan dan referensi—mereka juga berpotensi menggunakan AI meskipun hal ini tidak diizinkan.

Naskah yang dikerjakan menggunakan AI tersebut kemudian disisipkan bersama tugas yang dikirimkan mahasiswa. Para penilai tidak diberi informasi bahwa mereka sedang memeriksan pekerjaan dari 33 "mahasiswa palsu" yang namanya bahkan juga dihasilkan oleh ChatGPT.

Hasilnya mencengangkan. Di semua modul, hanya 6 persen pekerjaan AI yang ditandai oleh penilai sebagai kemungkinan bukan karya asli mahasiswa. Beberapa modul bahkan sama sekali tak ada karya yang ditandai sebagai naskah mencurigakan.

Scarfe mengatakan, teknologi AI saat ini cenderung kesulitan pada aspek penalaran yang lebih abstrak dan terintegrasi ke dalam informasi. Namun, di antara 63 jawaban AI, ada peluang 83,4 persen bahwa karya kecerdasan buatan tersebut mengungguli karya siswa.

Para peneliti mengklaim bahwa riset mereka ini sebagai studi terbesar dan terkuat yang pernah dilakukan. Kendati hanya memeriksa karya pada program studi psikologi di University of Reading, Scarfe yakin hasil riset ini akan menjadi perhatian seluruh sektor akademis. "Saya tidak punya alasan untuk berpikir bahwa bidang studi lain tidak akan menghadapi masalah yang sama," kata Scarfe.

Menurut Scarfe, menangani permasalahan ini pada sumbernya hampir mustahil dilakukan. Artinya, kata dia, dunia pendidikan harus mempertimbangkan kembali bagaimana cara mereka menilai. "Saya pikir sektor tersebut secara keseluruhan harus mengakui fakta bahwa kita harus membangun AI ke dalam penilaian yang kita berikan kepada siswa kita," kata dia.

Thomas Lancaster, peneliti komputasi pada Imperial College London, Inggris, sudah bisa menebak hasil akhir riset ini. AI, kata dia, dapat menghasilkan respons yang terdengar masuk akal untuk pertanyaan tekstual yang sederhana dan terbatas. "Ini menunjukkan bahwa penilaian tanpa pengawasan termasuk jawaban singkat selalu rentan terhadap kecurangan," kata Lancaster yang dikenal sebagai pakar urusan integritas dan plagiarisme di dunia akademik.

Menurut Lancaster, beban kerja akademikus yang diharapkan untuk menilai pekerjaan para siswa juga tidak membantu kemampuan mereka untuk mendeteksi kecurangan AI. "Penilai pertanyaan jawaban singkat yang dibatasi waktu sangat tidak mungkin memunculkan kasus pelanggaran AI begitu saja," kata dia. "Saya yakin ini bukan satu-satunya institusi yang mengalami hal ini."

NEW SCIENTIST

