Thuật toán phân phối nội dung của TikTok là chiếc hộp đen bí ẩn

12 Tháng Mười, 2023

Thuật toán phân phối nội dung của TikTok được coi là bí mật giúp nền tảng này “gây nghiện” cho người dùng. Cũng chính sự bí ẩn khiến cho những nhà quản lý gặp khó khi muốn hạn chế những nội dung độc hại dưới dạng video ngắn.

Thuật toán phân phối nội dung của TikTok là chiếc hộp đen bí ẩn

Số liệu của Statista cho thấy mỗi phút có hơn 500 giờ video được tải lên YouTube, 167 triệu giờ video được xem trên TikTok và 44 triệu giờ xem livestream trên Facebook. Trước lượng nội dung khổng lồ, các mạng xã hội lớn đối diện bài toán khó trong việc kiểm duyệt và loại bỏ nội dung độc hại.

Thuật toán phân phối của TikTok được coi là bí mật giúp nền tảng này “gây nghiện” cho người dùng. Cũng chính sự bí ẩn khiến cho những nhà quản lý gặp khó khi muốn hạn chế những nội dung độc hại dưới dạng video ngắn.

“TikTok được tải xuống và cài đặt dưới dạng ứng dụng trên smartphone. Như vậy nội dung được truy cập trực tiếp từ máy chủ TikTok bằng thiết bị của người dùng.

Điều này đồng nghĩa cơ quan quản lý khó có thể theo dõi, lọc và kiểm duyệt nội dung do giao thức HTTPS và thuật toán bảo mật SHA-256 (thuật toán băm bảo mật 256-bit) được áp dụng”, Tiến sĩ Sam Gounder, giảng viên cấp cao ngành Công nghệ thông tin, khoa Khoa học, Kỹ thuật & Công nghệ, Đại học RMIT Việt Nam, nhận định.

Khó kiểm duyệt video hiệu quả.

Dù tăng cường hệ thống quản lý, những vấn đề mà TikTok đang gặp cho thấy biện pháp kiểm duyệt nội dung trên nền tảng chưa thể đáp ứng số lượng video quá lớn. Ngoài ra, thuật toán phân phối nội dung gây nghiện trên TikTok cũng là câu hỏi lớn của chính phủ các nước.

Theo báo cáo thực thi tiêu chuẩn cộng đồng quý IV/2022 được TikTok công bố ngày 31/3, hơn 1,7 triệu video đã bị xóa, với tỷ lệ xóa chủ động chiếm 94,9%. Các biện pháp của TikTok gồm thuật toán tự động, nhân viên kiểm duyệt và đánh giá báo cáo từ cộng đồng.

Theo Cục PTTH&TTĐT, các biện pháp kỹ thuật để kiểm soát, rà quét nội dung xấu độc khó áp dụng trên nền tảng video như TikTok. Thuật toán được coi như cách “lách” công cụ rà quét, khiến việc xử lý lâu hơn.

TS Sam Goundar cho biết nhiều mạng xã hội đang áp dụng trí tuệ nhân tạo (AI), máy học và khoa học dữ liệu để tự động hóa khâu kiểm duyệt nội dung.

Tuy nhiên, hiệu quả khi áp dụng thuật toán cho nội dung đa phương tiện (như video) là vấn đề chung của nhiều nền tảng. Đó là lý do những công ty tuyển dụng rất nhiều người thanh lọc video. Dù vậy, tốc độ kiểm duyệt của con người không thể bắt kịp sự xuất hiện nhanh chóng của các nội dung mới.

“Chi phí sẽ rất cao nếu phải tuyển hàng nghìn, thậm chí hàng triệu người để kiểm duyệt nội dung. Do đó, chúng ta cần trông cậy và tin tưởng vào công nghệ”, ông Goundar cho biết.

Theo nhận định của chuyên gia, AI, máy học, mạng neuron sâu và khoa học dữ liệu có thể được đào tạo để phát hiện nội dung gây hại trong video. Những chi tiết liên quan đến nội dung độc hại được trích xuất để đào tạo mô hình máy học, giúp chúng nhận biết khi phân tích các video tiếp theo.

“Mô hình xử lý ngôn ngữ tự nhiên có thể được sử dụng để phân loại video dựa trên sự hiện diện của phát ngôn thù hận hay âm thanh có hại.

Ngoài ra, chúng ta có thể sử dụng mô hình thị giác máy tính để phát hiện hình ảnh thể hiện hành vi bạo lực, tự ngược đãi bản thân hay các video có hại khác”, ông Goundar nói thêm.

Tuy công nghệ có thể giúp ích, tiến sĩ cho rằng vẫn cần kết hợp đánh giá thủ công từ nhân viên kiểm duyệt, tham vấn chuyên gia tâm lý, đọc báo cáo từ người dùng và tham khảo hệ thống xếp hạng nội dung.

Yếu tố tác động thuật toán của TikTok.

Bên cạnh hiệu quả kiểm duyệt video, chuyên gia và chính phủ các nước còn đặt câu hỏi về thuật toán phân phối nội dung của TikTok. Ngay tại Việt Nam, việc sử dụng thuật toán tạo xu hướng bất chấp nội dung độc hại, phản cảm là một trong những sai phạm của nền tảng.

Theo TS Sam Goundar, thuật toán phân phối nội dung trên TikTok độc quyền và không được công khai. Dựa trên thông tin được chia sẻ bởi TikTok và các chuyên gia trong ngành, có một số yếu tố chung ảnh hưởng đến thuật toán phân phối nội dung của TikTok.

Các yếu tố gồm mức độ tương tác của người dùng (lượt thích, chia sẻ, nhận xét và theo dõi), thông tin video (phụ đề, âm thanh, hashtag), cài đặt của người dùng (vị trí, ngôn ngữ), tỷ lệ xem hết video và thời gian đăng tải. Song, thuật toán phân phối nội dung của TikTok liên tục phát triển và thay đổi dựa trên hành vi, phản hồi của người dùng.

“Hầu hết mạng xã hội khác cũng sử dụng thuật toán tương tự nhằm tiếp cận lượng người xem tối đa và gia tăng quảng cáo, bởi quảng cáo là cách kiếm tiền của các nền tảng này”, ông Goundar nói thêm.

Các chỉ trích liên quan đến thuật toán của TikTok chủ yếu liên quan đến tính minh bạch và công bằng. Ví dụ, việc thiếu minh bạch đến từ thuật toán độc quyền và không công khai, chưa công bằng do một số nội dung được đề xuất có nội dung thiên kiến.

Ngoài ra, thuật toán trên TikTok còn có “bong bóng lọc” (filter bubble), khiến nội dung được đề xuất phù hợp với sở thích và quan điểm tín ngưỡng của người dùng, dẫn đến sự thiếu đa dạng về quan điểm.

“Có trường hợp thuật toán TikTok thậm chí đẩy cao nội dung độc hại hoặc không phù hợp, chẳng hạn như video quảng bá chứng rối loạn ăn uống hoặc tự ngược đãi bản thân. Điều này làm dấy lên lo ngại về tính hiệu quả của thuật toán trong việc xác định và xóa nội dung độc hại.

TikTok đã có động thái giải quyết những vấn đề này, nhưng vẫn còn nhiều việc phải làm để đảm bảo thuật toán công bằng và hiệu quả trong việc thúc đẩy môi trường an toàn, thân thiện”, ông Goundar nhận định.

Tham gia Cộng đồng We’re Marketer của MarketingTrips để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Hà Anh | MarketingTrips

Thuật toán phân phối nội dung của TikTok là chiếc hộp đen bí ẩn

Khó kiểm duyệt video hiệu quả.

Yếu tố tác động thuật toán của TikTok.

Bài viết liên quan

Facebook đã xoá bỏ khoảng 10 triệu tài khoản giả mạo trong 6 tháng đầu năm 2025

Chiến lược mới của các sàn thương mại điện tử trong năm 2025 và xa hơn thế nữa

Từ 21/07/2025: YouTube sẽ xoá bỏ tab Trending và thay bằng Charts

Từ 15/7: Chính sách kiếm tiền từ YouTube sẽ có những thay đổi đối với các nội dung do AI tạo ra

Facebook và Google tăng thuế quảng cáo tại Việt Nam

Facebook tự ý lấy ảnh của người dùng để huấn luyện AI

Nhiều nhóm Facebook (Group) tại Việt Nam bất ngờ biến mất hoặc bị đổi tên

Công ty mẹ TikTok ra mắt Seedance 1.0: công cụ trí tuệ nhân tạo (AI) có khả năng tạo video từ văn bản và hình ảnh

Khả năng kéo traffic cho website từ Google Search đang giảm dần vì AI

Meta đầu tư gần 15 tỷ USD vào Scale AI và mời Founder của startup này về làm việc cho Meta

Apple xóa hơn 9.000 ứng dụng từ Việt Nam trong năm 2024

Samsung muốn đầu tư vào Perplexity AI nhằm giảm phụ thuộc vào Google Search

Nổi bật

VNG tiếp tục đầu tư vào startup mới của nhà sáng lập Telio (VNG từng mất trắng hơn 20 triệu USD với startup này)

Facebook đã xoá bỏ khoảng 10 triệu tài khoản giả mạo trong 6 tháng đầu năm 2025

Chiến lược mới của các sàn thương mại điện tử trong năm 2025 và xa hơn thế nữa

TikiNow bị phạt 200 triệu đồng vì cạnh tranh không lành mạnh

Chiến lược mới của Starbucks nhằm kéo chân người dùng

Người tiêu dùng Việt Nam chi 16 tỷ USD mua sắm online trong năm 2024

Google bị yêu cầu thay đổi cách xếp hạng kết quả tìm kiếm và mở quyền truy cập dành cho đối thủ

Từ 21/07/2025: YouTube sẽ xoá bỏ tab Trending và thay bằng Charts

Mới nhất

VNG tiếp tục đầu tư vào startup mới của nhà sáng lập Telio (VNG từng mất trắng hơn 20 triệu USD với startup này)

Facebook đã xoá bỏ khoảng 10 triệu tài khoản giả mạo trong 6 tháng đầu năm 2025

Chiến lược mới của các sàn thương mại điện tử trong năm 2025 và xa hơn thế nữa

TikiNow bị phạt 200 triệu đồng vì cạnh tranh không lành mạnh

Chiến lược mới của Starbucks nhằm kéo chân người dùng

Đọc nhiều

TikiNow bị phạt 200 triệu đồng vì cạnh tranh không lành mạnh

Facebook và Google tăng thuế quảng cáo tại Việt Nam

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Lý do khiến các gã khổng lồ ngành FMCG như Unilever hay P&G đang sa thải hàng chục ngàn nhân sự

Tìm hiểu về Baby Boomers, Gen X, Gen Y, Gen Z, Gen Alpha và Gen Beta