OpenAI อาจใช้ข้อมูลมีลิขสิทธิ์ในการฝึกสอนโมเดล AI ซึ่งอาจเป็นการละเมิดลิขสิทธิ์ ตามที่มีการฟ้องร้องจากเจ้าของผลงาน

วันที่โพสต์: 5 เมษายน 2568 11:08:52 การดู 1 ครั้ง ผู้โพสต์ baikhao

เขียน โปรแกรมเมอร์ และเจ้าของลิขสิทธิ์ที่กล่าวหาว่าบริษัทใช้ผลงานของพวกเขา เช่น หนังสือ โค้ด และอื่นๆ ในการฝึกสอนโมเดล AI โดยไม่ได้รับอนุญาต แม้ว่าบริษัทจะอ้างว่าการใช้ข้อมูลเหล่านี้เป็นไปตามข้อกำหนดของ "การใช้ที่ยุติธรรม" (fair use) แต่ผู้ฟ้องคดีกลับแย้งว่าไม่มีข้อยกเว้นในกฎหมายลิขสิทธิ์สำหรับการฝึกสอนโมเดล AI

การศึกษานี้เขียนร่วมโดยนักวิจัยจากมหาวิทยาลัยวอชิงตัน โคเปนเฮเกน และสแตนฟอร์ด ซึ่งเสนอวิธีการใหม่ในการตรวจสอบว่าโมเดล AI เช่น ของ OpenAI อาจ "จำ" ข้อมูลบางส่วนที่ใช้ในการฝึกสอนหรือไม่

โมเดล AI ทำงานโดยการทำนายผลลัพธ์จากข้อมูลจำนวนมาก ซึ่งทำให้สามารถสร้างข้อความ รูปภาพ หรือสิ่งอื่นๆ ได้ แม้ว่าผลลัพธ์ส่วนใหญ่จะไม่ใช่การคัดลอกตรงๆ แต่บางครั้งก็มีข้อมูลที่เหมือนกับต้นทาง เช่น โมเดลภาพที่สามารถสร้างภาพจากภาพยนตร์ที่ได้รับการฝึกสอน หรือโมเดลภาษาที่อาจลอกเลียนบทความข่าว

วิธีการที่ใช้ในการศึกษาคือการตรวจสอบคำที่หายากและโดดเด่นในข้อความ เช่น คำว่า "radar" ในประโยค “Jack and I sat perfectly still with the radar humming” ซึ่งถือว่าเป็นคำที่หายากเมื่อเทียบกับคำอื่นๆ ที่มักจะมาอยู่ก่อนคำว่า “humming”

นักวิจัยได้ทดสอบโมเดลต่างๆ ของ OpenAI เช่น GPT-4 และ GPT-3.5 โดยการลบคำที่หายากออกจากบทสนทนาในหนังสือและบทความจาก New York Times แล้วให้โมเดลทายคำที่หายไป หากโมเดลทายได้ถูกต้อง ก็แสดงว่าอาจจำข้อมูลจากแหล่งนั้นๆ ได้

ผลการทดสอบพบว่า GPT-4 มีการจดจำข้อมูลจากหนังสือฟิคชั่นบางเล่ม รวมถึงข้อมูลจากชุดข้อมูลที่มีลิขสิทธิ์ชื่อ BookMIA และยังพบว่าโมเดลจดจำข้อมูลบางส่วนจากบทความของ New York Times ด้วย

Abhilasha Ravichander นักศึกษาปริญญาเอกจากมหาวิทยาลัยวอชิงตันที่ร่วมเขียนการศึกษานี้ กล่าวว่า ผลการศึกษาช่วยเปิดเผยข้อมูลเกี่ยวกับแหล่งข้อมูลที่โมเดลอาจใช้ในการฝึกสอน

“เพื่อให้โมเดลภาษาขนาดใหญ่มีความน่าเชื่อถือ เราจำเป็นต้องสามารถตรวจสอบข้อมูลเหล่านี้ได้” Ravichander กล่าว “งานของเราจึงเป็นการพัฒนาเครื่องมือที่ช่วยให้สามารถตรวจสอบโมเดล AI ได้ และยังมีความต้องการที่ชัดเจนในการเพิ่มความโปร่งใสของข้อมูลในการพัฒนาโมเดล”

OpenAI ได้สนับสนุนการใช้ข้อมูลที่มีลิขสิทธิ์ในการฝึกสอนโมเดล โดยเชื่อว่าการใช้ข้อมูลเหล่านี้เป็นไปตามข้อกำหนดของ “การใช้ที่ยุติธรรม” (fair use) และถึงแม้บริษัทจะมีข้อตกลงการอนุญาตเนื้อหาบางประการและมีระบบให้เจ้าของลิขสิทธิ์สามารถยกเลิกการใช้ข้อมูลได้ แต่ OpenAI ยังคงล็อบบี้ให้รัฐบาลหลายประเทศกำหนดกฎเกณฑ์ที่ชัดเจนเกี่ยวกับการใช้ข้อมูลในการฝึกสอนโมเดล AI

ที่มา : techcrunch

baikhao

"ยินดีต้อนรับทุกท่านเข้าสู่การอ่านบทความของ baikhao เราเป็นนักเขียนที่มีประสบการณ์ มุ่งมั่นนำเสนอเนื้อหาที่มีคุณภาพ ข้อมูลที่เป็นประโยชน์ และมุมมองที่น่าสนใจในหลากหลายหัวข้อ ขอบคุณสำหรับการติดตาม และหวังว่าคุณจะได้รับความรู้และความเพลิดเพลินจากบทความของเรา"

ดูบทความทั้งหมด

แท็ก: OpenAI

เนื้อหาที่เกี่ยวข้อง

OpenAI เตรียมบังคับใช้การยืนยันตัวตนสำหรับองค์กรเพื่อเพิ่มความปลอดภัยและป้องกันการใช้งาน AI ผิดกฎหมาย

OpenAI เปิดตัวฟีเจอร์ค้นคว้าเชิงลึกเวอร์ชันเบา เตรียมปูทางสู่ยุค AI วิเคราะห์และเข้าใจข้อมูลอย่างแท้จริง

OpenAI ยื่นคำขอจดเครื่องหมายการค้าใหม่ เปิดเผยแผนพัฒนาผลิตภัณฑ์ AI ที่หลากหลาย

OpenAI เปิดสำนักงานในเกาหลีใต้ รับกระแส AI โตแรง เดินหน้ารุกตลาดเอเชีย

OpenAI ยกเลิกโมเดล AI "o3" เตรียมเปิดตัว GPT-5 แทน

OpenAI ปล่อยฟีเจอร์ "คิดก่อนตอบ" ในประเทศไทย เสริมความแม่นยำและการใช้เหตุผลของ AI

ข่าวแนะนำ

สมัครเป็นนักเขียนกับ Baikhao.com วันนี้ รับเครดิตทันที 100 บาท! สร้างรายได้จากการเขียนบทความได้ทุกวัน

ปฏิทินวันหยุดประจำปี 2568 ในประเทศไทย

วิธีการเขียนบทความกับ baikhao.com

Baikhao.com แพลตฟอร์มบริการที่ครบวงจรสำหรับทุกไลฟ์สไตล์และความสนใจ

การเปิดลงทะเบียนบัตรคนจน โอกาสใหม่สำหรับประชาชนรายได้น้อย ปี 68

ข่าวยอดนิยม

สมัครเป็นนักเขียนกับ Baikhao.com วันนี้ รับเครดิตทันที 100 บาท! สร้างรายได้จากการเขียนบทความได้ทุกวัน

งานเชียงรายดอกไม้งาม ครั้งที่ 21 ณ สวนสาธารณะหาดนครเชียงราย

Baikhao.com แพลตฟอร์มบริการที่ครบวงจรสำหรับทุกไลฟ์สไตล์และความสนใจ

วิธีดาวน์โหลดและสมัครใช้งาน Douyin (TikTok จีน)

เชียงใหม่พร้อมจัดงานยี่เป็ง 2567 ยิ่งใหญ่ 14-17 พฤศจิกายน นี้ เต็มไปด้วยกิจกรรมวัฒนธรรมล้านนา

ข่าวล่าสุด

เทียบหน้าจอล็อก iOS 26 และ Google Android 16

PhoneArt วิจารณ์ iOS 26 เปลี่ยนแปลงครั้งใหญ่ในรอบหลายปี แต่เต็มไปด้วยปัญหา พร้อมพาดพิงกรณี Grok และการผูกขาดของ Apple

BOE ถูกตัดสินมีความผิดฐานขโมยเทคโนโลยี OLED ของ Samsung เสี่ยงถูกแบนตลาดสหรัฐฯ นานเกือบ 15 ปี

วิธีติดตั้งไดรเวอร์ด้วย Intel Driver & Support Assistant (IDSA) อัปเดตไดรเวอร์ Intel ได้ง่าย รวดเร็ว และปลอดภัย

GPT-OSS พร้อมให้บริการบน Azure AI Foundry และ Windows AI Foundry ยกระดับศักยภาพนักพัฒนาสาย Windows