Instagram - không nằm ngoài cuộc chạy đua Trí tuệ Nhân tạo

Gabby Nguyen | 3 phút đọc

Hơn 500 triệu người dùng, 1 tỷ lượt truy cập thường xuyên mỗi tháng, Instagram đang nằm trong top những mạng xã hội phát triển nhất hiện nay. Sau thương vụ sát nhập nổi tiếng vào Facebook năm 2018, Instagram chính thức bước vào cuộc đua công nghệ nhằm giữ chân người dùng. Liên tục đào tạo thuật toán mới, tận dụng dữ liệu và nền tảng Trí tuệ Nhân tạo, hãy cùng xem Instagram đang sử dụng AI vào những việc gì nhé!

 Cá nhân hoá tab Explore bằng thuật toán gợi ý

“Một trong những phần thú vị nhất của việc xây dựng tab Explore là liên tục tìm ra những cách mới và thú vị để giúp cộng đồng của chúng tôi khám phá nội dung thú vị và phù hợp nhất trên Instagram”

(Đội ngũ kỹ thuật Instagram)

Mỗi ngày, hàng triệu tài khoản Instagram truy cập tab Explore để tìm kiếm những bức ảnh, video và story. Để có thể gợi ý được nội dung phù hợp nhất trong số hàng tỷ tùy chọn trong thời gian thực, đội ngũ kỹ thuật của Instagram đã phải tạo ra một hệ thống dựa trên AI bao gồm ngôn ngữ truy vấn tùy chỉnh, kỹ thuật mô hình hóa và các công cụ cho phép thử nghiệm tốc độ cao. Hệ thống này của Instagram đã trích xuất 65 tỷ tính năng và tạo ra 90 triệu mô hình dự đoán mỗi giây.

Mô hình gợi ý đang là xu hướng công nghệ nổi bật được rất nhiều nền tảng phát triển nhằm cá nhân hóa trải nghiệm người dùng.

(Nguồn: Dribbble)

Ivan Medvedev, kỹ thuật viên của Instagram, cho biết nội dung được người dùng tải lên mỗi ngày rất đa dạng, nên việc đề xuất những nội dung thú vị cho người dùng không hề dễ dàng. Do đó hệ thống Machine Learning của Instagram sẽ thường tập trung vào những tài khoản có thể khiến người dùng quan tâm. Để xác định tài khoản nào đang thu hút người dùng, đội ngũ kỹ thuật viên đã sử dụng một phương pháp học máy phổ biến là Word embedding (nhúng từ) giúp phân tích tần số xuất hiện và mối quan hệ giữa các từ lặp lại trong bài đăng. Instagram cũng ứng dụng quy trình tương tự để xác định mức độ liên quan giữa hai tài khoản với nhau.

“Các công cụ và hệ thống tùy chỉnh của chúng tôi đã tạo ra một nền tảng vững chắc cho việc học hỏi và lặp lại liên tục, điều cần thiết để xây dựng thuật toán cho Instagram Explore”

(Ivan Medvedev, Kỹ sư phần mềm Instagram)

Công đoạn tiếp theo là lựa chọn nội dung đề xuất. Hệ thống bắt đầu bằng việc tham khảo "tài khoản hạt giống" - những tài khoản đã được người dùng thích hoặc chia sẻ bài đăng trong quá khứ. Sau đó, AI sẽ chọn ra 500 nội dung ngẫu nhiên của tài khoản tương tự "tài khoản hạt giống". Các nội dung này được sàng lọc để loại bỏ tin nhắn rác (spam), thông tin sai lệch và vi phạm chính sách. Cuối cùng, 25 bài đăng được hệ thống dự đoán có nhiều khả năng được người dùng tương tác nhất sẽ được cập nhật lên Explore Tab.

2. Khai thác hàng tỷ bức ảnh cho trí tuệ nhân tạo

Công cuộc khai thác kho ảnh khổng lồ của Instagram nhằm phục vụ cuộc đua nhận diện hình ảnh bằng AI của Facebook. Sau khi mua lại Instagram với giá 1 tỷ USD vào năm 2018, Facebook đã ngay lập tức tận dụng triệt để việc phân tích dữ liệu. Theo TechCrunch, Facebook công bố rằng hàng tỷ bức ảnh công khai trên Instagram mà người dùng gắn hashtag đã được sử dụng để đào tạo mô hình nhận dạng hình ảnh. Facebook đã dựa vào hàng trăm GPU chạy liên tục để phân tích dữ liệu, sau đó áp dụng vào mô hình máy học, điều này giúp độ chính xác nhận dạng khuôn mặt lên đến 86,4% thông qua phép kiểm ImageNet.

Instagram, mỏ vàng mới của Facebook là kho dữ liệu khổng lồ đang được khai thác triệt để.

(Nguồn: Vice)

Tuy nhiên, việc nhận dạng dựa trên ảnh có gắn hashtag vẫn là thách thức cho Facebook khi người dùng gắn hashtag không vào đối tượng cụ thể.  Điều này buộc công ty phải phân loại những yếu tố có liên quan trong hàng tỉ bức ảnh mà họ thu thập trên Instagram. Và để giải quyết vấn đề trên, nhóm nghiên cứu AI của Facebook đã áp dụng một giải pháp mang tên “mô hình dự đoán hashtag quy mô lớn”, giúp dọn dẹp bớt những hashtag không liên quan. Tuy nhiên câu hỏi đặt ra là liệu rằng những điều Facebook đang làm có ảnh hưởng đến quyền riêng tư hay không? Khi mà Facebook đã phải đối mặt với rất nhiều bê bối liên quan đến dữ liệu.

“Liệu người dùng đăng ảnh trên Instagram có ý thức được rằng họ đang đóng góp cho cơ sở dữ liệu đào tạo AI của Facebook? Câu hỏi đặt ra ở đây chính là quyền riêng tư”

3. Đẩy lùi nạn bắt nạt trực tuyến với Trí tuệ Nhân tạo

Theo khảo sát về nạn bắt nạt hàng năm của Ditch The Label, tổ chức từ thiện của Anh, 42% thanh thiếu niên đã trải qua việc bị bắt nạt trực tuyến trên Instagram – con số cao nhất trong tất cả các nền tảng xã hội. Trước thực tế đó, Instagram đã đào tạo các thuật toán AI nhằm sàng lọc tất cả các bình luận được đăng tải. Bộ lọc sẽ liên tục phân tích cú pháp của các văn bản hay ngôn từ trong video. Nếu được xác định là một bình luận quấy rối, hệ thống sẽ tự động lọc và xóa nội dung. 

 

Khi những tài khoản cụ thể bị đánh dấu là thường xuyên bị lọc, chức năng đánh giá thủ công sẽ được kích hoạt tới nhân viên của mạng lưới, những người này sẽ xác định liệu người dùng tài khoản có đang vi phạm điều khoản dịch vụ hay không. Điều này có thể dẫn đến việc họ bị cấm sử dụng nền tảng.

AI giúp sàng lọc mọi bài đăng tải trên Instagram theo kịp thời gian thực nhằm giúp DeepText kích hoạt hệ thống ngăn chặn chủ động.

(Nguồn: CNRS News)

Bộ lọc chống bắt nạt của Instagram sử dụng công nghệ xử lý ngôn ngữ tự nhiên được phát triển bởi Facebook có tên là DeepText. DeepText hoạt động bằng cách kiểm tra văn bản tạo ra các bình luận của người dùng và tính toán nếu chúng hiển thị trùng khớp với những mẫu thông tin được gắn nhãn là lạm dụng. DeepText sử dụng công nghệ Deep Learning có liên quan đến các mạng nơ-ron nhân tạo để phân loại văn bản tải lên, cũng như ngữ cảnh của văn bản. Do hệ thống học sâu cải thiện độ chính xác khi được huấn luyện, nó ngày càng có khả năng phân biệt, ví dụ như những lời lăng mạ giữa bạn bè lúc trêu đùa và ngôn ngữ ám chỉ về chiến dịch nhằm mục đích quấy rối trực tuyến.

“Những biện pháp của các công ty truyền thông xã hội đang thực hiện nhằm đối phó với vấn đề bắt nạt trực tuyến là không đủ và không nhất quán.”

(Children’s Society)

Cùng với việc gắn nhãn nhận dạng cho mỗi từ, và sử dụng để theo dõi tần suất và ngữ cảnh của một đoạn văn bản, DeepText gắn cho mỗi từ một vị trí trong mạng lưới các kết nối ngữ nghĩa. Điều này cho phép AI tìm hiểu về các mối quan hệ phổ biến giữa các từ, và các tình huống mà các từ khác nhau được sử dụng để có nghĩa giống nhau. Thủ thuật này có thể sử dụng nhanh đến mức hệ thống có hiệu quả cùng lúc với thời gian thực tế. Nghĩa là nó phân tích, hiểu và đưa ra quyết định về 1.000 lượt tải lên của Instagram mỗi giây.

 

Học về Machine Learning và Computer Vision để chính bạn là người tiếp theo tạo ra những thuật toán cực ngầu và những ứng dụng hữu ích, tại sao không? Đăng ký cùng rubikTALENT tại để không bỏ lỡ cơ hội bắt đầu sự nghiệp trong lĩnh vực trí tuệ nhân tạo nhé!

Tìm hiểu thêm

Nguồn: WeTransform, Facebook Artificial Intelligence, Báo Thanh niên, VNExpress

#Instagram #giải trí #machine learning #deep learning

Bài viết liên quan

​Tại sao Spotify lại hiểu gu âm nhạc của bạn đến vậy?

Netflix dùng thuật toán để thống trị địa hạt giải trí thế nào?

LIÊN HỆ

CHÚNG TÔI

Mai Thu (Natasha)
SĐT: 0357 572 556

info@rubikai.com
 

ĐẾN THĂM

CHÚNG TÔI

Thứ 2 - Thứ 6 | 09:00 - 18:30

Tầng 4, Tháp T2, Times Tower,

35 Lê Văn Lương, Thanh Xuân, Hà Nội

 

​THEO DÕI

CHÚNG TÔI

  • White Facebook Icon
  • White YouTube Icon

Website này thuộc quyền sở hữu của Công ty TNHH Nexus FrontierTech Việt Nam