Jakarta – Kecerdasan buatan (AI) kini menunjukkan kemampuan yang setara atau bahkan lebih baik dari dokter dalam mendiagnosis kasus medis. Temuan ini dipublikasikan dalam jurnal Science pada Kamis lalu, menandai kemajuan signifikan di bidang kesehatan digital.

Para peneliti menguji model penalaran terbaru OpenAI, o1, dan membandingkannya dengan model lama GPT-4 serta dokter dan residen medis. Hasilnya, model o1 mampu meningkatkan kemampuan diagnostik secara substansial, bahkan melampaui para dokter dalam sejumlah skenario.

Salah satu eksperimen menggunakan data rekam medis elektronik dari pasien unit gawat darurat di rumah sakit Boston. Dalam uji triase awal, model o1 menunjukkan akurasi diagnostik lebih dari dua pertiga kasus, sementara dua dokter ahli hanya mencapai sekitar setengahnya.

Dr. Robert Wachter, profesor dan ketua Departemen Kedokteran di University of California, San Francisco, menyebut temuan ini sangat penting. Menurutnya, sudah tidak terbantahkan lagi bahwa AI modern akan mengungguli model bahasa besar lama dan dokter dalam mengidentifikasi diagnosis yang tepat.

Meski demikian, Wachter yang juga penulis buku A Giant Leap: How AI is Transforming Healthcare menekankan perlunya riset lebih lanjut. Ia mengingatkan bahwa implementasi AI dalam praktik klinis masih membutuhkan validasi yang ketat.

“Pertanyaannya adalah seberapa dekat ini mereplikasi kehidupan nyata, dan jawabannya cukup baik tetapi tidak sempurna,” tulis Wachter dalam surelnya. Ia menambahkan bahwa eksperimen hanya menggunakan input teks tanpa melibatkan isyarat visual dan auditori yang biasa digunakan dokter.

Para penulis studi mengakui keterbatasan tersebut. Diagnosis dalam dunia nyata sering kali bergantung pada tingkat distress pasien, hasil pencitraan medis, dan komunikasi langsung yang belum bisa sepenuhnya ditiru AI saat ini.

Dr. Ashwin Ramaswamy, instruktur urologi di Mt. Sinai yang juga meneliti respons AI terhadap pertanyaan kesehatan, memberikan pandangan serupa. Ia memuji desain studi namun mencatat bahwa AI hanya memproses informasi yang telah dikumpulkan dan difilter oleh manusia.

“Ini berharga dan menunjukkan kemajuan teknologi, tetapi melewatkan bagian sentral dari pekerjaan ‘menjadi dokter’,” ujar Ramaswamy. Dalam kehidupan nyata, pasien bisa merasa takut, mabuk, atau kondisinya memburuk secara aktif.

Ramaswamy juga menyoroti perlunya detail spesifik tentang kesalahan yang dibuat baik oleh dokter maupun AI. Jika model membuat kesalahan yang masih bisa dimengerti, itu berbeda dengan kesalahan berbahaya yang tidak bisa dijelaskan.

Dalam evaluasinya terhadap ChatGPT Health yang diterbitkan di Nature Medicine, Ramaswamy menemukan bahwa mode kegagalan AI bisa bersifat tidak konsisten. AI mungkin berkinerja baik saat mendiagnosis penyakit langka, tetapi justru melewatkan hal yang secara klinis jelas.

Penelitian ini memperkuat argumen untuk menggunakan AI sebagai alat opini kedua yang diawasi oleh dokter. Para penulis studi menekankan perlunya uji klinis prospektif untuk menentukan bagaimana sistem AI dapat meningkatkan praktik klinis.

“Laju peningkatan yang cepat pada model bahasa besar memiliki implikasi substansial bagi ilmu dan praktik kedokteran klinis,” tulis para penulis yang sebagian besar berasal dari Beth Israel Deaconess Medical Center di Boston. Mereka mendesak penelitian lebih lanjut tentang dampak AI terhadap hasil pasien.

Artikel pendamping di Science yang ditulis oleh dua ahli dari Flinders Health and Medical Research Institute Australia setuju dengan implikasi mendesak tersebut. Namun, mereka menentang penggantian dokter dengan AI dan lebih membayangkan kolaborasi yang memberikan pengawasan dan akuntabilitas.

“Tanpa efektivitas, kesetaraan, dan keamanan yang terbukti kuat, banyak sistem AI akan tetap tidak memadai untuk penggunaan klinis,” tulis para ahli tersebut. Mereka menekankan pentingnya pengujian ketat sebelum adopsi luas di fasilitas kesehatan.

Ke depannya, integrasi AI dalam diagnosis medis membutuhkan keseimbangan antara inovasi teknologi dan kehati-hatian klinis. Perkembangan ini juga membuka diskusi tentang Cara Kerjanya di berbagai sektor, termasuk kesehatan.

Meskipun hasil studi menjanjikan, para ahli sepakat bahwa AI belum siap menggantikan dokter sepenuhnya. Peran manusia dalam memberikan konteks, penilaian situasional, dan empati tetap tidak tergantikan dalam pelayanan medis.

Penelitian lebih lanjut diperlukan untuk mengatasi kesenjangan antara performa AI di laboratorium dan efektivitasnya di dunia nyata. Isu AI Medis yang bias terhadap kelompok tertentu juga menjadi perhatian serius para peneliti.