Nội dung trùng lặp là gì?
Nội dung trùng lặp là gì? – Có lẽ bạn đã gặp khá nhiều thuật ngữ nội dung trùng lặp, nhưng nó là gì? Nội dung trùng lặp là nội dung tồn tại ở một số vị trí – tức là URL. Nó có thể gây hại cho thứ hạng của bạn và nhiều người nói rằng lượng lớn nó thậm chí có thể dẫn đến hình phạt của Google. Tuy nhiên, điều đó không đúng. Không có hình phạt, nhưng việc có vô số nội dung trùng lặp hoặc sao chép có thể khiến Google ảnh hưởng tiêu cực đến thứ hạng của bạn.
Nội dung trùng lặp là gì? Bài viết dưới đây sẽ giải thích cho bạn:
-
Nội dung trùng lặp là gì?
Nội dung trùng lặp là tất cả nội dung có sẵn ở nhiều vị trí trong hoặc ngoài trang web của bạn. Nó thường tồn tại trên một URL khác và đôi khi thậm chí trên một tên miền khác. Nó chủ yếu xảy ra một cách vô tình hoặc là kết quả của việc triển khai kỹ thuật dưới mức trung bình .
Ví dụ: trang web của bạn có thể có sẵn trên cả www và không phải www hoặc HTTP và HTTPS — hoặc cả hai cùng một lúc, thật kinh khủng! Hoặc có thể CMS của bạn sử dụng quá nhiều tham số URL động khiến công cụ tìm kiếm bối rối. Ngay cả các trang AMP của bạn cũng có thể được tính là nội dung trùng lặp nếu không được liên kết đúng cách. Nó ở khắp mọi nơi.
-
Định nghĩa của Google về nội dung trùng lặp như sau:
“Nội dung trùng lặp thường đề cập đến các khối nội dung quan trọng trong hoặc trên các miền hoàn toàn khớp với nội dung khác hoặc tương tự nhau đáng kể. Hầu hết, đây không phải là nguồn gốc lừa đảo.”
Phần cuối cùng đó là quan trọng. Nếu bạn sao chép, sao chép và quay nội dung hiện có – Google gọi đây là nội dung được sao chép – với mục đích đánh lừa công cụ tìm kiếm để có thứ hạng cao hơn, bạn sẽ gặp nguy hiểm.
-
Google cho biết loại mục đích xấu này có thể kích hoạt một hành động:
“Nội dung trùng lặp trên một trang web không phải là căn cứ để thực hiện hành động trên trang web đó trừ khi có vẻ như mục đích của nội dung trùng lặp là lừa đảo và thao túng kết quả của công cụ tìm kiếm”
Michiel có một số mẹo hay để phát hiện nội dung trùng lặp trên trang web của bạn trong tính năng kiểm tra Nội dung trùng lặp tự làm và những việc cần làm nếu ai đó sao chép nội dung của bạn . Tài liệu của Google cũng là một mỏ vàng nếu bạn đang làm việc với loại nội dung này.
-
Nội dung trùng lặp, nội dung sao chép và nội dung mỏng: có gì khác biệt?
Chủ đề trùng lặp nội dung khiến nhiều người bối rối. Đối với Google, nó chủ yếu có nguồn gốc kỹ thuật, nhưng nó cũng sẽ xem xét chính nội dung. “Tôi có hai URL cho cùng một bài viết, tôi nên chọn URL nào?”
Trong khi hầu hết những người bình thường có thể sẽ nghĩ đến những phần nội dung tương tự xuất hiện ở nơi khác trên một trang web. “Tôi đã sử dụng đoạn văn bản này ở một số nơi khác, điều đó có tệ không?” Đây đều là nội dung trùng lặp nhưng để xác định thứ hạng, công cụ tìm kiếm phân biệt giữa nội dung trùng lặp, nội dung sao chép và nội dung mỏng.
Nội dung trùng lặp của bạn có thể được phân loại là nội dung được sao chép nếu bạn sử dụng văn bản hiện có và nhanh chóng sửa lại văn bản đó để sử dụng lại trên trang web của mình. Sẽ không thành vấn đề nếu bạn xoay nó một chút hoặc đưa vào một vài từ khóa, hành vi này không được chấp nhận.
Đưa vào một vài trang nội dung mỏng — những trang có ít hoặc không có nội dung chất lượng — và bạn đang ở trong vùng nguy hiểm. Chất lượng trang web là một vấn đề và những chiến thuật này có thể mang lại tác hại nghiêm trọng cho trang web của bạn. Bạn có nhớ gấu trúc không ?
Một lưu ý nhanh dành cho người dùng plugin Yoast Duplicate Post của chúng tôi . Đừng lo lắng, các bài đăng bạn sao chép bằng plugin của chúng tôi không được tính là nội dung trùng lặp. Trừ khi bạn xuất bản cả bản sao cũng như bản gốc mà không thực hiện bất kỳ thay đổi nào. Đọc thêm về cách sử dụng plugin Yoast Duplicate Post và lý do .
-
Đừng chặn nội dung trùng lặp trên trang web của bạn
Google khá giỏi trong việc phát hiện và xử lý nội dung trùng lặp. Công cụ tìm kiếm đủ thông minh để tìm ra những việc cần làm với hầu hết nội dung nó tìm thấy. Nếu nó tìm thấy nhiều phiên bản của một trang, nó sẽ xếp chúng thành phiên bản mà nó thấy tốt nhất – trong hầu hết các trường hợp, đây sẽ là bài viết/trang gốc.
Tuy nhiên, những gì nó cần là quyền truy cập đầy đủ vào các URL này. Nếu bạn chặn Googlebot trong robots.txt thu thập dữ liệu các URL này, nó không thể tự tìm ra những điều này và bạn sẽ gặp rủi ro khi Google coi các trang này là các trường hợp riêng biệt. Dưới đây là một số điều bạn nên làm:
Cho phép robot thu thập dữ liệu các URL này
Đánh dấu nội dung là trùng lặp bằng cách sử dụng rel=canonical (đọc thêm về điều này bên dưới)
Sử dụng công cụ Xử lý tham số URL của Google để xác định cách xử lý tham số
Sử dụng chuyển hướng 301 để đưa người dùng và trình thu thập thông tin đến URL chuẩn
Bạn có thể làm nhiều điều hơn nữa để chống lại nội dung trùng lặp trên trang web của mình như Joost mô tả trong bài viết của anh ấy về nguyên nhân và giải pháp .
-
Sử dụng rel=canonical!
Một trong những công cụ thiết yếu trong bộ công cụ chống nội dung trùng lặp của bạn là rel=”canonical” . Bạn có thể sử dụng đoạn mã này để xác định URL gốc của một phần nội dung là gì, chúng tôi gọi là URL chuẩn . Chúng tôi có một hướng dẫn cơ bản tuyệt vời về rel=”canonical” sẽ cho bạn thấy mọi thứ cần biết về nó.
-
Tập trung vào nội dung gốc, mới và có thẩm quyền
Một công cụ khác trong kho vũ khí của bạn để chống lại nội dung trùng lặp, sao chép và không nguyên bản là kỹ năng viết của bạn. Google tập trung vào chất lượng. Nó luôn tìm kiếm phần nội dung tốt nhất có thể phù hợp nhất với mục đích của người dùng. Mục tiêu của bạn không phải là kiếm tiền nhanh chóng mà là để lại ấn tượng lâu dài. Hãy chú ý đến nội dung mỏng và đảm bảo nội dung đó nguyên bản và có chất lượng cao.
Điều tương tự cũng xảy ra với nội dung tương tự trên trang web của bạn. Trước đây chúng ta đã nói về việc ăn thịt từ khóa và đây là phần mở rộng của điều đó. Việc gấp nhiều bài đăng có thể so sánh thành một có thể đạt được kết quả tốt hơn nhiều, cả về thứ hạng cũng như chống lại nội dung trùng lặp.
Đây là cách Google đảm nhận nội dung tương tự:
“Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự nhau, hãy cân nhắc việc mở rộng từng trang hoặc hợp nhất các trang thành một. Ví dụ: nếu bạn có một trang web du lịch với các trang riêng biệt cho hai thành phố nhưng có cùng thông tin trên cả hai trang, bạn có thể hợp nhất các trang thành một trang về cả hai thành phố hoặc bạn có thể mở rộng từng trang để chứa nội dung duy nhất về mỗi thành phố. ”
Nếu bạn muốn biết cách thực hiện việc này, hướng dẫn từng bước này do Joost viết sẽ giải thích rõ ràng cách tìm và khắc phục hành vi ăn thịt người từ khóa trên trang web của bạn .
-
Nội dung trùng lặp ở khắp mọi nơi – biết phải làm gì với nó
Cựu nhân viên Google Matt Cutts từng có câu nói nổi tiếng rằng 20% đến 30% trang web có nội dung trùng lặp . Mặc dù tôi không chắc những con số này có còn chính xác hay không; nội dung trùng lặp tiếp tục xuất hiện trên mọi trang web. Đây không nhất thiết phải là tin xấu. Hãy khắc phục những gì bạn có thể và đừng thử biến nội dung trùng lặp và nội dung anh chị em của nó đã sao chép và nội dung sơ sài thành một chiến lược SEO khả thi.
Xem thêm: Giải thích SEO cho người không chuyên: 4 bước cơ bản