Các thuật toán sẽ giết chết báo chí?

0
876

Công ty khởi nghiệp Articoolo tại Israel khẳng định sản phẩm trí tuệ nhân tạo của họ có thể tạo ra những nội dung nguyên bản về bất kỳ chủ đề nào trong vài phút – và chúng ta sẽ không thể nhận ra sự khác biệt.

Viết nội dung có thể gây đau đầu cho các nhà quản lý trang web. Sản xuất nội dung đòi hỏi thời gian, nhân lực có kỹ năng và tiền bạc. Trong hiện thực kỹ thuật số hiện nay, các thương hiệu, công ty và các chủ doanh nghiệp vừa và nhỏ đều phải có một trang web để duy trì liên lạc với khách hàng và thu hút khách hàng mới. Ngoài ra, họ cần có một danh sách phân phối email và các hồ sơ trên mạng xã hội.

Hiện có khoảng hơn một tỷ trang web nội dung trên toàn thế giới. Các nghiên cứu cho thấy mỗi ngày, có 4 triệu bài blog được viết và 215 tỷ email thương mại được gửi đi. Mặc dù các nhà thiết kế và viết nội dung không được trả lương hậu hĩnh, việc viết những nội dung nguyên bản tỏ ra là một gánh nặng tài chính đáng kể. Ở các công ty lớn hơn, nhu cầu nội dung gốc phong phú để duy trì sự hiện diện của họ trong thế giới kỹ thuật số có thể khiến chi phí tăng vọt.

Một giải pháp cho những vấn đề này vừa được công ty khởi nghiệp Articoolo ở Israel đưa ra.

Giải pháp này giúp việc viết lách trở thành một quá trình đơn giản với chi phí thấp bằng cách sử dụng trí tuệ nhân tạo. Articoolo đã phát minh ra một công cụ công nghệ có thể sản xuất một bài tin tức 500 từ với nội dung nguyên bản và chất lượng cao về bất kỳ nội dung nào trong vòng 2 phút. Độc giả sẽ không thể phân biệt được văn bản này được người viết hay máy viết.

Articoolo đã phát minh ra một công cụ công nghệ có thể sản xuất một bài tin tức 500 từ với nội dung nguyên bản và chất lượng cao về bất kỳ nội dung nào trong vòng 2 phút.

“Về mặt trí tuệ nhân tạo, sản xuất một bài tin tức mạch lạc rất phức tạp,” Doron Tal, một trong những nhà sáng lập công ty cho biết. “Giải pháp của chúng tôi cho phép cải tiến các mẩu nội dung đã có trong không gian kỹ thuật số, trình bày chúng theo một cách thống nhất, sử dụng ngôn ngữ rõ ràng và chính xác.”

Ý định đầu tiên của Articoolo là sử dụng trí tuệ nhân tạo trong giáo dục để giúp các sinh viên đại học viết các bài luận. Công ty nhanh chóng nhận ra lĩnh vực tiếp thị còn có nhu cầu viết tự động lớn hơn. “Trong thập kỷ qua, quảng cáo đã trải qua rất nhiều thay đổi. Khách hàng bây giờ tìm kiếm những giá trị và ít bị ảnh hưởng bởi những câu khẩu hiệu hơn. Các công ty và thương hiệu do đó đã chuyển sự tập trung và đầu tư của họ vào nội dung,” Tal cho biết.

Articoolo được thành lập cách đây 2 năm bởi Tal và các cộng sự, tiến sỹ toán học Nir Haloani và nhà phát triển phần mềm Lilia Demidov – cả hai người này có kinh nghiệm dày dạn trong việc nén dữ liệu và quảng cáo trên internet. Năm ngoái, Articoolo là một trong số 8 công ty khởi nghiệp được tham gia vào chương trình tăng tốc danh tiếng của IBM. Điều này đã giúp các nhà sáng lập tiếp cận với một trong những hệ thống trí tuệ nhân tạo mạnh mẽ nhất thế giới: Watson.

“Trong vòng một tháng rưỡi, chúng tôi đã tăng vốn ban đầu lên tới hàng triệu USD, và trong vòng một năm, chúng tôi chỉ nghiên cứu các thuật toán cơ bản. Tầm nhìn của chúng tôi là xây dựng một cỗ máy dựa trên trí tuệ nhân tạo có thể viết một bài tin tức mà người đọc sẽ nghĩ là do con người viết. Điều quan trọng với chúng tôi là văn bản đó phải nguyên gốc, không được là sự sao chép hay cắt dán,” Tal chia sẻ.

“Ở bất kỳ phân khúc thị trường nào, nếu bài viết bị sao chép từ đâu đó và không phải là duy nhất, thì nó sẽ chẳng có ý nghĩa gì cả. Bạn có thể sử dụng Google để lấy một văn bản. Chúng tôi đã trải qua một quá trình bảo đảm chất lượng dài hơi, phát hiện các vấn đề và lỗi sai, và mỗi lần như vậy chúng tôi lại cải thiện được thuật toán. Đây là một quá trình bất tận, chúng tôi sẽ luôn phải cải tiến nó và chúng tôi sắp xin được bằng sáng chế cho sản phẩm này,” ông cho biết thêm.

Sản xuất tại Ấn Độ

* Ông nghĩ chất lượng văn bản do cỗ máy tạo ra như thế nào?

Tal: “Sáu tháng trước chúng tôi đã cho chạy thử và đạt được kết quả là 100% các bài viết đều là độc nhất. Chúng tôi hài lòng vơi kết quả này. Chúng tôi chưa gặp câu văn nào nghe vô lý. Chất lượng là một vấn đề chủ quan và chúng tôi chỉ còn cách những mục tiêu của mình một nửa đường nữa.”

* Hệ thống này xử lý tin tức giả như thế nào? Điều gì sẽ xảy ra nếu thuật toán sử dụng một bài báo bịa đặt?

“Theo định nghĩa, thuật toán tìm kiếm những nguồn có dạng bài viết. Chúng tôi thường không sử dụng nội dung từ các trang web tin tức hay các trang blog viết về các sự kiện đang diễn ra như nguồn tin bài. Điều này làm giảm khả năng gặp phải tin giả. Rõ ràng, ngay cả khi coi các bài tin tức là một nguồn, chúng tôi cũng có thể gặp những thông tin sai, nhưng điều này cũng giống như một người viết là con người tìm kiếm các nguồn tin và tìm thấy một thứ gì đó mà anh ta không thể truy nguyên. Khả năng bị vấp ngã như vậy của chúng tôi thấp hơn vì chúng tôi đã phân loại các nguồn tin khác nhau, làm giảm nguy cơ gặp phải những nguồn không đáng tin cậy.”

* Articoolo có bao nhiêu người dùng?

“Chúng tôi có 33.000 người dùng đã tạo ít nhất một bài tin tức, trong đó có 2.000 người là khách hàng trả tiền. 7% những người đăng ký sử dụng đã trở thành khách hàng trả tiền. 60 phần trăm khách hàng trả tiền cũng đăng ký theo dõi, hoặc là khách hàng cũ quay lại.

“Về mặt chiến lược, mục tiêu của chúng tôi là tiếp cận các công ty và tổ chức lớn thường xuyên có nhu cầu về nội dung gốc với số lượng lớn. Chúng tôi co một số dự án thí điểm với các công ty về quảng cáo và nội dung tự nhiên, và chúng tôi đãng kiểm chứng khả năng xử lý khối lượng công việc lớn của công cụ của mình. Các mức giá của chúng tôi phụ thuộc vào việc công ty đăng ký thuê bao trả tiền hay chỉ muốn mua một số lượng tin bài giới hạn. Mười bài viết có giá 19 USD và 100 bài có giá 99 USD. Mặt khác, người dùng đăng ký trả tiền có thể tạo 30 bài tin tức với giá 29 USD hoặc 250 bài với giá 99 USD.”

*Ai là đối thủ cạnh tranh của công ty? Có công ty nào khác tạo nội dung bằng trí tuệ nhân tạo không?

“Chúng tôi đã tìm hiểu và nghiên cứu một số giải pháp khác trong lĩnh vực này. Không công ty nào cung cấp một giải pháp hoàn chỉnh như chúng tôi. Ví dụ, có những sản phẩm phần mềm gọi là spinner, có thể lấy một văn bản hay một từ rồi thay thế bằng từ đồng nghĩa hay văn bản tương tự. Vấn đề là họ không phân tích văn bản, dẫn đến việc văn bản có thể không mạch lạc. Một công ty khởi nghiệp tên là Narrative Science viết được những bài tóm tắt nhưng cũng có thể sản xuất những văn bản, tuy nhiên hoạt động này phải dựa trên các mẫu cố định. Chúng tôi không sản xuất những văn bản cứng nhắc mà cung cấp những sản phẩm cho các công ty cần nội dung gốc với số lượng lớn và tần suất liên tục.

“Chúng tôi cố gắng chỉ đạo hệ thống sản xuất ra văn bản dưới dạng các bài viết, vì thế đối thủ chính của chúng tôi thực ra là những cây viết con người. Nghiên cứu cho thấy 79% nội dung tiếng Anh trên internet được viết ra ở Ấn Độ. Có rất nhiều trang web viết tin bài do người Ấn Độ quản lý với mức giá khá cao. Trong lần thử nghiệm của mình, chúng tôi nhận ra nhu cầu là rất cao và mọi người đều sẵn sàng trả tiền. Trong giai đoạn tiếp theo, chúng tôi sẽ có thể tăng giá vì chúng tôi gần như không có đối thủ cạnh tranh nào. Khi lựa chọn thay thế chủ yếu là cây viết con người, giá thành phẩm trở nên rất đáng kể.”

Viết bằng thuật toán

*Các anh có phải là một mối đe dọa với những người viết nội dung hay không? Các nhà báo có cần bắt đầu tìm một công việc mới không?

“Chúng tôi sẽ không thay thế các nhà báo. Đây là một sự trợ giúp dành cho nhiều nhóm người dùng. Vẫn cần các nhà báo xem xét lại nội dung, biên tập và trong trường hợp của chúng tôi là dịch thuật ra nữa. Chúng tôi đã kết luận rằng các nhà báo và những cây viết chuyên nghiệp không muốn để một thuật toán viết bài thay họ. Họ đã quá mệt mỏi với những thuật toán như vậy rồi. Mặt khác, họ cũng cần sự giúp đỡ khi viết lách, nhất là trong những giai đoạn đầu khi họ ngồi trước một trang giấy trắng và cần một điểm xuất phát. Thuật toán này không khiến các nhà báo mất việc. Trái lại, nó nhấn mạnh tầm quan trọng của cây viết con người, do thuật toán sẽ không bao giờ đọ được với một nhà báo cùng khả năng phân biệt và sự hiểu biết của họ. Nó có thể giúp công việc của nhà báo trở nên dễ dàng hơn mà không hoàn toàn thay thế họ. Sẽ phải mất một thời gian dài để máy móc có thể thay thế hoàn toàn một cây viết con người.”

* Tuy nhiên, sản phẩm của các anh vẫn đặt ra câu hỏi về công việc của người viết hoặc nhà báo: Họ có nên xuất bản những tin bài do máy viết thay vì do họ viết không?

“Tôi không nghĩ việc một nhà báo dùng Articoolo và các công cụ công nghệ của chúng tôi để lấy ý tưởng hay xây dựng nội dung từ đó lại là phi đạo đức. Cả thế giới đang hướng về trí tuệ nhân tạo và sẽ không có cách nào quay lưng lại với nó được.”

Trong những tháng gần đây, một số trang web nội dung đã tiếp cận công ty này và đề nghị dùng thử các công cụ của họ, và các quan hệ đối tác đã được thành lập, một số còn trên cơ sở dài hạn. Một ví dụ là BITA, một trang blog công nghệ của Nhật Bản sử dụng thuật toán của Articoolo để viết các tin bài chủ yếu liên quan đến tin tức và khảo sát công nghệ. Sự hợp tác này làm tăng sự hiện diện của công ty ở Nhật và khách hàng Nhật Bản hiện chiếm 15% cơ sở khách hàng của họ.

Các công cụ của Articoolo đã làm dấy lên nhiều câu hỏi về nội dung được tạo tự động mà không có sự can thiệp của con người. Ngoài việc đe dọa công ăn việc làm của những người viết nội dụng và những nhà báo (dù Tal đã phủ định việc này), những nội dung do máy móc tạo ra vẫn cần khách hàng phải kiểm tra và xác minh trong một số trường hợp để bảo đảm không có thông tin sai lệch. Việc chuẩn bị tin bài do đó trở thành một quá trình lâu hơn so với dự định của khách hàng.

Tuy nhiên, Articoolo nỗ lực sản xuất những văn bản đơn giản, không phải là các luận án học thuật hay mục tin tức. Đó là lý do vì sao công ty đáp ứng được nhu cầu cao của thị trường trong việc nhanh chóng tạo ra những nội dung có liên quan với số lượng lớn, sự mạch lạc và độ chính xác tương đối.

Không có sự tham gia của con người

Văn bản dưới đây có tên “Những ảnh hưởng về mặt tài chính của biến đổi khí hậu” được viết hoàn toàn bởi hệ thống trí tuệ nhân tạo của Articoolo. Hệ thống được cho 5 từ khóa theo chủ đề và giới hạn bài viết ở 250 từ.

Thuật toán phân tích từng từ và quét toàn bộ internet để chọn nguồn chính để viết bài. Sau đó, phần mềm sẽ tìm kiếm những nội dung liên quan hơn và tạo những câu chính cho bài viết từ các nguồn này. Cuối cùng, văn bản thô được viết lại và chỉnh sửa bằng công cụ xử lý ngôn ngữ tự nhiên để chắc chắn về độ rõ ràng và dễ hiểu. Toàn bộ quá trình này mất không quá hai phút.

Rate this post

LEAVE A REPLY

Please enter your comment!
Please enter your name here