Thuật toán YouTube hoạt động như thế nào?
Với hơn một tỷ người dùng và hàng tỷ giờ video, việc thuật toán của YouTube quản lý để cung cấp những gì bạn muốn xem khi bạn truy cập trang web là một minh chứng cho công nghệ phần mềm. Vì vậy, làm thế nào nó hoạt động?
Câu trả lời ngắn gọn: Không ai biết chi tiết - thậm chí cả YouTube, ở một mức độ nào đó. Thuật toán của YouTube sử dụng học máy để đề xuất video, điều đó có nghĩa là không có quy tắc nào chúng tôi có thể nói với bạn. Ngoài ra, Google sẽ không cho chúng tôi biết vì điều đó sẽ dẫn đến việc mọi người khai thác chúng.
Những gì chúng ta biết
Khi bạn huấn luyện một mô hình học máy, bạn cung cấp cho nó một loạt các đầu vào và sau đó xếp hạng các đầu ra được đề xuất của nó về mức độ đúng đắn của chúng.
Đây là một ví dụ rất đơn giản. Giả sử bạn muốn đào tạo một AI để nói lên sự khác biệt giữa hình ảnh của mèo và chó. Về cơ bản, bạn sẽ cung cấp cho AI một loạt hình ảnh về chó và mèo, hãy bắt đầu lựa chọn và sau đó chấm điểm đúng nếu nó trả lời đúng. Càng nhiều chính xác, nó càng tốt hơn trong việc lựa chọn. Kết quả là một cỗ máy có thể xác định chó mèo. Đào tạo này sử dụng một số liệu theo đó các kết quả được đánh giá; trong trường hợp của chúng tôi, cat-o-mét, hoặc bao nhiêu phần trăm hình ảnh thực sự là con mèo.
Số liệu YouTube sử dụng là xem giờ-người dùng ở lại trên video trong bao lâu. Điều này có ý nghĩa bởi vì YouTube không muốn mọi người bỏ qua việc tìm kiếm video để xem, vì đó là công việc nhiều hơn và họ dành ít thời gian hơn để xem.
Mặc dù vậy, nó mang nhiều sắc thái hơn so với chỉ có thời gian bạn xem một video. Thuật toán tính đến nhiều yếu tố khác nhau và xếp hạng chúng phù hợp: duy trì người xem, số lần hiển thị cho số lần nhấp, mức độ tương tác của người xem và một số yếu tố khác đằng sau hậu trường mà chúng ta không bao giờ thấy. YouTube sau đó điều chỉnh các yếu tố này cho hồ sơ của bạn để nó có thể đề xuất các video mà bạn có nhiều khả năng nhấp vào.
Lấy gì từ đây
Nếu bạn là một YouTuber đầy tham vọng, hai điều chính cần làm là tối đa hóa thời lượng xem trung bình của bạn và tối đa hóa tỷ lệ nhấp của bạn. Lấy kim tự tháp lộn ngược sau đây.
YouTube đề xuất video của bạn cho nhiều người, trên màn hình chính và trong tab được đề xuất. Trên tài khoản của tôi, tôi có gần 750 nghìn lượt hiển thị. Điều đó có vẻ khá tốt, nhưng chỉ một phần nhỏ những người đó nhấp vào video của bạn. Phân số này được gọi là tỷ lệ nhấp của bạn và được tính bằng phần trăm (bạn có thể thấy trong ví dụ của tôi rằng tôi có tỷ lệ nhấp qua 4,0%). Hình Lượt xem hiển thị số người thực sự đã nhấp qua.
Sau khi ai đó nhấp vào video, YouTube sẽ đo lượng thời gian những người đó đã xem video.
Bạn có thể thấy lý do tại sao rất nhiều người tạo YouTube sử dụng tiêu đề và hình thu nhỏ của clickbait (để có được các lần nhấp đó) và các video dài, được rút ra (để tăng thời gian lưu). Đây là hai đặc điểm rất khó chịu của nhiều người tạo YouTube, nhưng này, đổ lỗi cho thuật toán.
Một trường hợp nghiên cứu
Chúng ta hãy xem hai kênh lớn có các cách tiếp cận khác nhau để giải quyết thuật toán. Đầu tiên là Primitive Technology, một kênh được điều hành bởi một anh chàng đi vào vùng hoang dã và xây dựng mọi thứ không có công cụ. Tất cả các video của anh ấy đều rất dài nhưng vẫn giữ được mức độ tương tác tốt trong suốt thời lượng đó - khá là thành công vì không có lời tường thuật. Thực tế này có nghĩa là anh ta có thể có thời lượng xem trung bình rất cao, điều này tốt trong mắt thuật toán.
Bởi vì anh ấy chỉ làm một video mỗi tháng, thật đáng ngạc nhiên khi anh ấy có hơn 8 triệu người đăng ký. Điều này có thể là do thời gian dài giữa các video tạo ra cảm giác về một cái gì đó mới khi cái tiếp theo giảm xuống. Các video của anh ấy mang tính biểu tượng và bất cứ khi nào chúng xuất hiện trong nguồn cấp dữ liệu của tôi, tôi hầu như luôn nhấp vào chúng. Tôi đoán người khác cũng cảm thấy như vậy, nên có lẽ anh ta cũng có tỷ lệ nhấp cao.
Kênh thứ hai có một cách tiếp cận hơi cặn bã. BCC Trolling, một kênh Fortnite trong Funny Moments, lấy các đoạn phim từ các bộ truyền phát phổ biến và chỉnh sửa chúng thành các video hàng ngày. Trong năm ngoái, họ đã thành thạo thuật toán và bắn tới 7,3 triệu người đăng ký. Để tối đa hóa thời gian xem, họ đặt đoạn phim tiêu đề của video ở đâu đó vào giữa video, buộc mọi người phải xem một lúc trước khi đến đoạn clip họ nhấp vào, về cơ bản khiến họ mắc kẹt trên video. Bởi vì điều này, thời gian xem của họ cao hơn.
Chúng cũng xuất sắc ở hình thu nhỏ và tiêu đề clickbait, đặt * MỚI * trong tất cả các mũ trên nhiều video và luôn có hình thu nhỏ đầy màu sắc thường được tùy chỉnh và thường rất dễ gây hiểu lầm. Nhưng, chúng không phải là clickbait rõ ràng; các video phân phối trên tiêu đề, nhưng nó chỉ đủ clickbait để khiến mọi người nhấp vào.
Đây là điều chính cần loại bỏ khỏi BCC: nếu bạn định nhấp vào hình thu nhỏ của mình, hãy thực hiện một cách tinh tế. Đặt những lời nói dối hoàn toàn trong tiêu đề thường sẽ khiến mọi người tức giận và có thể có tác dụng ngược lại với bạn.
Dù bằng cách nào, bạn nên tìm những gì phù hợp với bạn và sử dụng điều đó cho lợi thế của bạn. Luôn theo dõi thời gian và tỷ lệ nhấp qua trong tương lai, nhưng hãy tuân thủ định dạng của bạn và đừng để thuật toán sai khiến nội dung của bạn.