Nhân sinh cảm ngộ

Làm thế nào để phân biệt giữa video thật và video giả do AI tạo ra?

Chân Chân (sưu tầm) 20/12/25, 07:58

Internet hiện nay tràn ngập hình ảnh và video do AI tạo ra, thật giả khó mà phân biệt. Một vài chuyên gia đã đưa ra một số cách để nhận dạng video AI.

Giọng nói được tổng hợp bằng AI thường nhanh và không tự nhiên

Theo The Huffington Post, người thật nói chuyện theo nhịp điệu tự nhiên, với một số từ được nói chậm hơn. Tuy nhiên, giọng nói tổng hợp từ AI thường nghe nhanh và rất thiếu tự nhiên.

Ông Jeremy Carrasco, một chuyên gia chuyên vạch trần các video AI trên mạng xã hội, lưu ý rằng các video do Sora (một ứng dụng video AI thuộc sở hữu của OpenAI) tạo ra thường “quá năng động”. Ông nói: “Họ nói rất nhiều, nhưng thực ra chẳng nói gì cả; họ chỉ đang nhét lời vào miệng mình thôi.”

Các nhà ngôn ngữ học gọi nhịp điệu lời nói của con người là “hiệp đồng phát âm”. Điều này đề cập đến sự chuyển đổi tự nhiên của âm thanh từ âm tiết này sang âm tiết khác khi luồng không khí đi qua khoang mũi và khoang miệng.

Tuy nhiên, nhiều giọng nói do AI tạo ra vẫn còn hạn chế về mặt này, tạo ra những âm thanh không rõ ràng, nghe như âm sắc tự nhiên đã bị làm phẳng.

Ông Migüel Jetté, Phó Chủ tịch AI tại Rev, một dịch vụ chuyển giọng nói thành văn bản, cho biết các mô hình chuyển văn bản thành giọng nói được đào tạo để dự đoán cách phát âm có khả năng xảy ra nhất trong một chuỗi từ, nhưng chúng thường gặp khó khăn trong việc kết nối các âm tiết giữa các từ một cách mượt mà.

Ông Jetté chỉ ra rằng nếu một video chứa những từ phát âm sai rõ ràng, đây có thể là dấu hiệu cho thấy giọng nói AI có thể gặp khó khăn trong việc nhận dạng những từ hiếm hoặc độc đáo không có trong cơ sở dữ liệu đào tạo của nó.

Quan sát xem phản ứng cảm xúc có phù hợp với nội dung video hay không

Bà Camila Bruder, một nhà nghiên cứu tại Viện nghiên cứu Thẩm mỹ thực nghiệm Max Planck ở Đức (Max Planck Institute for Empirical Aesthetics), cho biết cảm xúc của giọng nói AI thường quá mãnh liệt và không phù hợp với nhu cầu của bối cảnh.

Bà lưu ý rằng nếu giọng nói AI thể hiện niềm vui quá khuôn mẫu, như “Ồ!”, hoặc sự tức giận quá khuôn mẫu, như một diễn viên vụng về, thì những đặc điểm này có thể cho thấy nội dung video là do AI tạo ra.

Ông Carrasco nói thêm rằng bạn cũng nên chú ý xem các biểu cảm có mang theo những phản ứng cảm xúc kỳ lạ hay không. Ví dụ, trong một video AI lan truyền, có cá rơi từ trên trời xuống, và một người phụ nữ thốt lên: “Chúng là cá! Chúng thực sự là cá!”. Nhưng trong đời thực, mọi người sẽ không nói như vậy.

Ông Jetté cho biết bạn cũng có thể tìm kiếm manh mối bằng cách trực tiếp quan sát chuyển động miệng của những người trong video. “Nếu môi và giọng nói của người nói không hoàn toàn đồng bộ… đó là một dấu hiệu rõ ràng.”

Kiểm tra tính logic và độ dài video

Chuyên gia về kỹ năng số Mike Caulfield cho biết: “Chúng ta đang bị ngập trong rác mạng – tràn lan như lũ lụt. Khi lượng thông tin rác vượt quá mức chịu đựng, não bộ sẽ mất khả năng phân biệt thật – giả.”

Bà Kolina Koltai, điều tra viên cấp cao của một tổ chức báo chí điều tra độc lập, nhận định: duy trì khả năng phân biệt thật giả là vô cùng quan trọng. “Tôi cho rằng một trong những rủi ro lớn nhất của dạng nội dung này không phải là có người tin video giả, mà là người ta bắt đầu không tin ngay cả video thật.”

Bà đưa ra phương pháp nhận diện video AI: chú ý xem video có kích thích cảm xúc quá mạnh hoặc đi ngược lại những gì bạn vẫn tin hay không.

Bà nói: video càng tạo phản ứng cảm xúc mạnh, càng phải thận trọng. Nhiều video giả cố tình gây kịch tính hoặc xung đột, nhằm thu hút lượt xem, bình luận và chia sẻ.

Chuyên gia Hany Farid của Đại học California, Berkeley, người nghiên cứu thao túng truyền thông, cho biết một dấu hiệu quan trọng khác là độ dài video. Các công ty tạo video AI thường giới hạn thời lượng vì chi phí tính toán rất đắt—đa số các video AI chỉ dài khoảng 8–10 giây. Ông nói: “Khi bạn thấy một video rất ngắn và vô nghĩa, đó là lúc nên dừng lại và hít thở sâu.”