Hàng triệu bài báo từ The New York Times đã được sử dụng để huấn luyện chatbot, bây giờ lại cạnh tranh với nó, theo như đơn kiện nói.
The New York Times đã kiện OpenAI và Microsoft vì vi phạm bản quyền vào thứ Tư, mở ra một mặt trận mới trong cuộc chiến pháp lý ngày càng gay gắt về việc sử dụng không được phép các tác phẩm xuất bản để huấn luyện công nghệ trí tuệ nhân tạo.
Times là tổ chức truyền thông lớn đầu tiên của Mỹ kiện các công ty này, những người tạo ra ChatGPT và các nền tảng A.I. phổ biến khác, về vấn đề bản quyền liên quan đến các tác phẩm viết của mình. Vụ kiện, được nộp tại Tòa án Quận Liên bang ở Manhattan, cho rằng hàng triệu bài báo được Times xuất bản đã được sử dụng để huấn luyện các chatbot tự động, hiện nay cạnh tranh với tờ báo này như một nguồn thông tin đáng tin cậy.
Đơn kiện không đưa ra yêu cầu cụ thể về số tiền. Nhưng nó nói rằng các bị cáo nên chịu trách nhiệm về “hàng tỷ đô la thiệt hại theo quy định và thực tế” liên quan đến “việc sao chép và sử dụng trái phép các tác phẩm có giá trị độc đáo của Times”. Nó cũng yêu cầu các công ty phải tiêu hủy bất kỳ mô hình chatbot và dữ liệu huấn luyện nào sử dụng tài liệu bản quyền từ Times.
Trong đơn khiếu nại của mình, Times cho biết họ đã tiếp cận Microsoft và OpenAI vào tháng 4 để nêu lên mối quan ngại về việc sử dụng tài sản trí tuệ của mình và tìm kiếm “một giải pháp hòa bình,” có thể liên quan đến một thỏa thuận thương mại và “rào cản công nghệ” xung quanh sản phẩm A.I. tạo ra. Nhưng họ nói rằng cuộc thảo luận chưa đạt được giải pháp.
Người phát ngôn của OpenAI, Lindsey Held, cho biết trong một tuyên bố rằng công ty đã “tiến triển một cách xây dựng” trong các cuộc trò chuyện với Times và họ “ngạc nhiên và thất vọng” về vụ kiện.
“Chúng tôi tôn trọng quyền của các nhà sáng tạo và chủ sở hữu nội dung và cam kết làm việc với họ để đảm bảo họ được hưởng lợi từ công nghệ A.I. và các mô hình kinh doanh mới,” bà Held nói. “Chúng tôi hy vọng sẽ tìm ra cách làm việc có lợi cho cả hai bên, như chúng tôi đang làm với nhiều nhà xuất bản khác.”
Microsoft từ chối bình luận về vụ việc.
Vụ kiện có thể thử nghiệm các đường viền pháp lý mới nổi của công nghệ A.I. tạo ra — được gọi như vậy vì văn bản, hình ảnh và nội dung khác mà chúng có thể tạo ra sau khi học từ các bộ dữ liệu lớn — và có thể mang lại hậu quả lớn cho ngành tin tức. Times là một trong số ít các cơ quan truyền thông đã xây dựng thành công mô hình kinh doanh từ báo chí trực tuyến, nhưng hàng chục tờ báo và tạp chí đã bị suy yếu bởi sự chuyển dịch đọc giả sang internet.
Đồng thời, OpenAI và các công ty công nghệ A.I. khác — sử dụng nhiều loại văn bản trực tuyến, từ bài báo đến thơ đến kịch bản, để huấn luyện chatbot — đang thu hút hàng tỷ đô la vốn đầu tư.
OpenAI hiện được các nhà đầu tư định giá hơn 80 tỷ đô la. Microsoft đã cam kết 13 tỷ đô la cho OpenAI và đã tích hợp công nghệ của công ty vào công cụ tìm kiếm Bing của mình.
“Các bị cáo tìm cách tận dụng không công bằng vào khoản đầu tư lớn của Times vào báo chí,” đơn khiếu nại nói, cáo buộc OpenAI và Microsoft “sử dụng nội dung của Times mà không trả tiền để tạo ra sản phẩm cạnh tranh với Times và lấy mất khán giả từ nó.”
Các bị cáo chưa có cơ hội trả lời tại tòa.
Những mối quan tâm về việc sử dụng không được đền bù tài sản trí tuệ bởi các hệ thống A.I. đã lan truyền trong các ngành công nghiệp sáng tạo, với khả năng mô phỏng ngôn ngữ tự nhiên và tạo ra các phản hồi viết tinh vi cho hầu như bất kỳ lời nhắc nào.
Nữ diễn viên Sarah Silverman tham gia vào một cặp vụ kiện vào tháng Bảy, cáo buộc Meta và OpenAI đã “nuốt chửng” hồi ký của cô làm văn bản huấn luyện cho các chương trình A.I. Các nhà văn bày tỏ lo ngại khi tiết lộ rằng các hệ thống A.I. đã hấp thụ hàng chục ngàn cuốn sách, dẫn đến một vụ kiện của các tác giả bao gồm Jonathan Franzen và John Grisham. Getty Images, liên đoàn nhiếp ảnh, đã kiện một công ty A.I. tạo hình ảnh dựa trên các lời nhắc viết, cho rằng nền tảng này phụ thuộc vào việc sử dụng không được phép các tài liệu hình ảnh bản quyền của Getty.
Các ranh giới của luật bản quyền thường được xem xét mới tại những thời điểm thay đổi công nghệ - như sự xuất hiện của radio phát sóng hoặc các chương trình chia sẻ tệp số như Napster - và việc sử dụng trí tuệ nhân tạo đang nổi lên như biên giới mới nhất.
“Một quyết định của Tòa án Tối cao là cơ bản không thể tránh khỏi,” Richard Tofel, cựu chủ tịch phòng tin tức phi lợi nhuận ProPublica và tư vấn cho ngành báo chí, nói về cơn bão kiện tụng mới nhất. “Một số nhà xuất bản sẽ giải quyết trong một khoảng thời gian - bao gồm cả The Times - nhưng đủ nhà xuất bản không chịu đồng ý khiến vấn đề bản quyền mới mẻ và quan trọng này cần phải được giải quyết.”
Microsoft đã thừa nhận trước đây về những mối quan tâm bản quyền tiềm ẩn đối với các sản phẩm A.I. của mình. Vào tháng Chín, công ty thông báo rằng nếu khách hàng sử dụng công cụ A.I. của mình bị kiện vì vi phạm bản quyền, công ty sẽ bảo hiểm cho họ và trả chi phí pháp lý liên quan.
Những tiếng nói khác trong ngành công nghệ đã cứng rắn hơn trong cách tiếp cận với bản quyền. Vào tháng Mười, Andreessen Horowitz, một công ty vốn mạo hiểm và nhà đầu tư ban đầu của OpenAI, đã viết trong nhận xét gửi Văn phòng Bản quyền Hoa Kỳ rằng việc phơi bày các công ty A.I. cho trách nhiệm bản quyền sẽ “hoặc giết chết hoặc làm giảm đáng kể sự phát triển của họ.”
“Kết quả sẽ là ít cạnh tranh hơn, ít sáng tạo hơn và rất có thể là mất vị trí của Hoa Kỳ là người dẫn đầu trong phát triển A.I. toàn cầu,” công ty đầu tư nói trong tuyên bố của mình.
Ngoài việc bảo vệ tài sản trí tuệ, vụ kiện của The Times đặt ChatGPT và các hệ thống A.I. khác như những đối thủ tiềm năng trong kinh doanh tin tức. Khi chatbot được hỏi về các sự kiện hiện tại hoặc các chủ đề đáng tin tức khác, chúng có thể tạo ra câu trả lời dựa trên báo chí của The Times. Tờ báo bày tỏ lo ngại rằng độc giả sẽ hài lòng với câu trả lời từ chatbot và từ chối truy cập vào trang web của The Times, do đó giảm lưu lượng truy cập web có thể được chuyển đổi thành doanh thu quảng cáo và thuê bao.
Đơn khiếu nại trích dẫn một số ví dụ khi chatbot cung cấp cho người dùng các trích đoạn gần như nguyên văn từ các bài báo của Times mà bình thường yêu cầu phải có đăng ký trả phí để xem. Nó khẳng định rằng OpenAI và Microsoft đặc biệt nhấn mạnh vào việc sử dụng báo chí của Times trong việc huấn luyện các chương trình A.I. của họ do tính chính xác và độ tin cậy được cho là có của tài liệu.
Các tổ chức truyền thông đã dành năm qua để xem xét các hậu quả pháp lý, tài chính và báo chí của sự bùng nổ trong A.I. tạo ra. Một số cơ quan truyền thông đã đạt được thỏa thuận về việc sử dụng báo chí của họ: Hãng thông tấn Associated Press đã ký một thỏa thuận cấp phép vào tháng Bảy với OpenAI, và Axel Springer, công ty xuất bản Đức sở hữu Politico và Business Insider, cũng làm như vậy trong tháng này. Điều khoản cho các thỏa thuận này không được tiết lộ.
The Times đang khám phá cách sử dụng công nghệ mới nổi này. Tờ báo gần đây đã thuê một giám đốc biên tập cho các sáng kiến trí tuệ nhân tạo để thiết lập các quy tắc cho việc sử dụng A.I. trong phòng tin tức và xem xét cách tích hợp công nghệ vào báo chí của công ty.
Trong một ví dụ về cách các hệ thống A.I. sử dụng tài liệu của The Times, đơn kiện cho thấy rằng Browse With Bing, một tính năng tìm kiếm của Microsoft được cung cấp bởi ChatGPT, đã sao chép gần như nguyên văn kết quả từ Wirecutter, trang web đánh giá sản phẩm của The Times. Tuy nhiên, kết quả văn bản từ Bing không liên kết đến bài viết của Wirecutter, và chúng loại bỏ các liên kết giới thiệu trong văn bản mà Wirecutter sử dụng để tạo ra hoa hồng từ các bán hàng dựa trên khuyến nghị của họ.
“Việc giảm lưu lượng truy cập đến các bài viết của Wirecutter và, theo đó, giảm lưu lượng truy cập đến các liên kết liên kết sau đó dẫn đến mất doanh thu cho Wirecutter,” đơn khiếu nại tuyên bố.
Vụ kiện cũng làm nổi bật thiệt hại tiềm ẩn cho thương hiệu của The Times thông qua những ảo giác của A.I. được gọi là “hallucinations,” một hiện tượng trong đó chatbot chèn thông tin sai lệch sau đó sai lầm được quy cho một nguồn. Đơn khiếu nại trích dẫn một số trường hợp trong đó Bing Chat của Microsoft cung cấp thông tin không chính xác được cho là đến từ The Times, bao gồm kết quả cho “15 loại thực phẩm tốt nhất cho sức khỏe tim mạch,” trong đó có 12 loại không được đề cập trong một bài báo của tờ báo.
“Nếu The Times và các tổ chức tin tức khác không thể sản xuất và bảo vệ báo chí độc lập của họ, sẽ có một khoảng trống mà không có máy tính hay trí tuệ nhân tạo nào có thể lấp đầy,” đơn khiếu nại viết. Nó thêm, “Ít báo chí hơn sẽ được sản xuất, và chi phí cho xã hội sẽ rất lớn.”
The Times đã giữ các công ty luật Susman Godfrey và Rothwell, Figg, Ernst & Manbeck làm luật sư ngoại trú cho vụ kiện. Susman đại diện cho Dominion Voting Systems trong vụ kiện phỉ báng chống lại Fox News, dẫn đến một thỏa thuận 787,5 triệu đô la vào tháng Tư. Susman cũng đã nộp đơn kiện tập thể đề xuất vào tháng trước chống lại Microsoft và OpenAI thay mặt cho các tác giả phi hư cấu, những người sách và tài liệu bản quyền khác của họ đã được sử dụng để huấn luyện chatbot của các công ty.
cre: nytimes