Terkait Keamanan Terkait Keamanan OpenAI Mengacaukan Forum Parenting yang Sangat Populer

OpenAI Mengacaukan Forum Parenting yang Sangat Populer

OpenAI Mengacaukan Forum Parenting yang Sangat Populer


Pikirkan topik apa pun yang samar-samar terkait dengan membesarkan anak-anak, dan mungkin ada posting tentangnya di Mumsnet, forum pengasuhan anak yang sudah lama berjalan, sangat populer, dan memicu kontroversi bagi para ibu di Inggris. Selama lebih dari dua dekade sejarahnya, Mumsnet telah mengumpulkan arsip lebih dari enam miliar kata yang ditulis oleh basis penggunanya yang sangat aktif, tentang topik-topik seperti popok kotor dan suami yang malas. (Belum lagi omelan gila tentang lumba-lumba.)

Musim semi ini, setelah Mumsnet menemukan bahwa perusahaan AI mencuri datanya, perusahaan tersebut mengatakan bahwa mereka memutuskan untuk mencoba mencapai kesepakatan lisensi dengan beberapa pemain utama di bidang tersebut, termasuk OpenAI, yang awalnya menyatakan kesediaan untuk menjajaki kesepakatan setelah Mumsnet pertama kali menghubungi mereka. Setelah pembicaraan dengan OpenAI gagal, Mumsnet pada bulan Juli mengumumkan niatnya untuk menempuh jalur hukum.

Menurut Mumsnet, selama percakapan awal tersebut, seorang pimpinan kemitraan strategis OpenAI memberi tahu perusahaan tersebut bahwa kumpulan data lebih dari 1 miliar kata menarik bagi raksasa AI tersebut. Pimpinan Mumsnet sangat antusias. “Kami menghabiskan cukup banyak waktu untuk berdiskusi dengan mereka,” kata pendiri dan CEO Mumsnet Justine Roberts kepada WIRED. “Kami harus menandatangani beberapa NDA, dan mereka menginginkan banyak informasi dari kami.”

Namun, lebih dari sebulan kemudian, OpenAI memberi tahu Mumsnet bahwa perusahaan tersebut tidak lagi tertarik untuk bermitra saat itu, menurut pertukaran email yang ditinjau oleh WIRED. Ketika ditanya mengapa, staf OpenAI tersebut menggolongkan kumpulan data Mumsnet yang berjumlah 6 miliar kata terlalu kecil untuk menjamin pengaturan lisensi, kata Roberts. Mereka juga mencatat bahwa OpenAI terutama tertarik pada kumpulan data besar yang belum dapat diakses publik secara daring, dan menginginkan kumpulan data yang menangkap pengalaman manusia yang luas.

Sentimen ini digaungkan oleh perusahaan tersebut ketika dimintai komentar dari WIRED. “Kami mengupayakan kemitraan untuk kumpulan data berskala besar yang mencerminkan masyarakat manusia dan tidak mengupayakan kemitraan semata-mata untuk informasi yang tersedia bagi publik,” kata juru bicara OpenAI Kayla Wood. “Kami mendukung pilihan penerbit dan kreator, menawarkan mereka cara untuk mengekspresikan preferensi mereka tentang bagaimana situs dan konten mereka bekerja dengan AI dalam hasil pencarian dan melatih model dasar AI generatif.”

Roberts mengatakan bahwa ia “jengkel” dengan perkembangan ini. Ia ingat bahwa OpenAI pada awalnya tampak sangat tertarik pada Mumsnet karena konten platform tersebut sebagian besar ditulis oleh perempuan. “Data percakapannya sangat berkualitas tinggi,” katanya. “90 persen percakapannya ditulis oleh perempuan, yang cukup tidak biasa.”

OpenAI telah mencapai berbagai kesepakatan lisensi data dengan outlet media dan platform pada tahun lalu, menandatangani perjanjian dengan Vox Media, AtlantikAxel Springer, Time, dan perusahaan induk WIRED Condé Nast, serta platform yang dipenuhi konten buatan pengguna seperti Reddit. (Automattic, pemilik WordPress.com dan Tumblr, juga disebut-sebut tengah dalam pembicaraan lisensi awal tahun ini.) Karena rincian transaksi tersebut belum diungkapkan, tidak jelas berapa besar korpus masing-masing.

Ketika WIRED bertanya tentang ukuran kumpulan data yang akan dipertimbangkan untuk lisensi komersial, OpenAI menolak untuk membagikan informasi tersebut. Namun juru bicara Kayla Wood menekankan bahwa kemitraan perusahaan dengan penerbit “difokuskan pada menampilkan konten mereka dalam produk kami dan mengarahkan lalu lintas ke sana.”

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post