DIY: Kiểm tra nội dung trùng lặp
DIY: Kiểm tra nội dung trùng lặp – Nội dung trùng lặp là điều đáng sợ trong thế giới SEO. Nếu nội dung của bạn xuất hiện trên nhiều trang trên trang web của bạn hoặc các trang web khác, Google có thể bị nhầm lẫn và không biết nên xếp hạng gì đầu tiên. Bạn sẽ muốn ngăn chặn nội dung trùng lặp càng nhiều càng tốt.
Vì vậy, bạn có thể làm gì, chính mình? Ở đây, tôi sẽ giải thích cách thực hiện kiểm tra nội dung trùng lặp mà thỉnh thoảng bạn nên làm để tìm nội dung được sao chép . Ngoài ra, một số mẹo để tránh trùng lặp nội dung ngay từ đầu. Bắt đầu nào!
DIY: Kiểm tra nội dung trùng lặp là gì? Bài viết dưới đây sẽ giải thích cho bạn:
-
Thêm đoạn mã phòng ngừa
Trong phần ‘Giao diện tìm kiếm’ > ‘RSS’ của plugin Yoast SEO , chúng tôi đã xác định trước một đoạn mã để thêm vào mục nhập nguồn cấp dữ liệu của bạn với nội dung “Bài viết này lần đầu tiên xuất hiện trên yourwebsite.com”. Liên kết trong đoạn trích này đảm bảo rằng mọi công cụ thu thập đều bao gồm liên kết đến bài viết gốc. Tất nhiên, điều này đã giúp ngăn chặn nội dung trùng lặp vì Google sẽ tìm thấy liên kết ngược đó đến trang web của bạn.
Tuy nhiên, nếu bạn viết nội dung tuyệt vời, nội dung của bạn sẽ bị trùng lặp. Và bản sao đó không phải lúc nào cũng bao gồm liên kết đến trang web của bạn. Càng có thêm lý do để thực hiện kiểm tra nội dung trùng lặp một cách thường xuyên.
-
Trình kiểm tra nội dung trùng lặp CopyScape
Có rất nhiều công cụ để tìm nội dung trùng lặp. Một trong những công cụ kiểm tra nội dung trùng lặp nổi tiếng nhất có lẽ là CopyScape.com . Công cụ này hoạt động khá dễ dàng: chèn một liên kết vào hộp trên trang chủ và CopyScape sẽ trả về một số kết quả, được trình bày hơi giống các trang kết quả tìm kiếm của Google.
Bạn có thể nhấp vào kết quả để biết thêm chi tiết và xem phần nào trong văn bản của bạn bị trùng lặp. Hãy xem một ví dụ từ bài đăng phổ biến của chúng tôi về 6 lỗi SEO phổ biến , được xuất bản lần đầu vào ngày 3 tháng 10 năm 2017. Copyscape nhận thấy rằng 170 từ, tương đương 9% bài đăng này, đã bị sao chép:
Trong trường hợp này, đoạn đầu tiên trong bài viết của chúng tôi, thảo luận về tốc độ trang web thấp là một lỗi SEO phổ biến, đã được sao chép và chuyển thành một bài đăng blog ngắn. CopyScape đánh dấu rõ ràng văn bản mà họ phát hiện là trùng lặp, điều này cho thấy mức độ nghiêm trọng của việc sao chép. Nếu đó chỉ là một phần trăm nhỏ của trang, tôi sẽ không lo lắng. Nếu nó chiếm hơn 40% và chiếm một phần khá lớn trên trang khác, tôi chỉ cần gửi email cho họ để thay đổi văn bản đã sao chép.
Sử dụng trình kiểm tra nội dung trùng lặp CopyScape để tìm nội dung được sao chép từ trang web của bạn trên các trang web khác. Một lần nữa, đây là một trong nhiều công cụ nhưng công cụ này miễn phí và dễ sử dụng. Tuy nhiên, hãy nhớ rằng bạn sẽ không được quét không giới hạn cho một trang web. Nếu bạn muốn tìm hiểu sâu hơn một chút về nội dung trùng lặp của mình, CopyScape cũng cung cấp phiên bản cao cấp để hiểu rõ hơn.
Mẹo: Trùng lặp nội dung trên trang sản phẩm
Khi sử dụng CopyScape, chúng tôi thường thấy các mô tả của nhà sản xuất được sử dụng trong các cửa hàng trực tuyến bị trùng lặp. Thông thường, những thứ này được tự động nhập vào hệ thống quản lý nội dung của cửa hàng. Thông thường, không chỉ cho trang web của bạn . Hãy nhận biết điều này. Tôi hiểu rằng việc viết mô tả sản phẩm độc đáo cho mỗi sản phẩm khá rắc rối. Tuy nhiên, ít nhất những sản phẩm bán chạy nhất của bạn không xứng đáng được như vậy sao? Vì vậy, hãy bắt đầu ngay bây giờ và bắt đầu từ đó!
-
Kiểm tra nội dung trùng lặp nội bộ của Siteliner
Siteliner là người anh em của CopyScape chuyên tìm kiếm nội dung trùng lặp nội bộ . Vì vậy, trình kiểm tra nội dung trùng lặp này sẽ tìm thấy nội dung trùng lặp trên trang web của riêng bạn .
-
Nội dung trùng lặp nội bộ
Bạn hỏi nội dung trùng lặp nội bộ, điều đó xảy ra như thế nào? Chà, một ví dụ rất phổ biến về điều này là khi một blog WordPress không sử dụng các đoạn trích mà hiển thị toàn bộ bài đăng trên trang chủ của blog. Điều đó có nghĩa là bài đăng blog có sẵn trên ít nhất hai trang: trang chủ và chính bài đăng đó. Và nó có thể cũng nằm trên các trang tổng quan về danh mục và thẻ. Đó là bốn phiên bản của cùng một bài viết trên trang web của riêng bạn.
Sử dụng đoạn trích (thay vì hiển thị toàn bộ bài viết) có ưu điểm là đoạn trích luôn có liên kết thích hợp đến bài viết. Liên kết này sẽ cho Google biết rằng nội dung gốc không có trên trang blog/danh mục/thẻ đó mà nằm trong chính bài đăng đó. Chúng tôi thường khuyên bạn nên sử dụng các đoạn trích.
-
Sử dụng Siteliner
Kiểm tra nội dung trùng lặp Siteliner sẽ hiển thị cho bạn rất nhiều thứ, nhưng giới hạn ở 250 trang và 30 ngày một lần. Một lần nữa, có một phiên bản cao cấp, nhưng phiên bản miễn phí sẽ mang lại cho bạn ấn tượng tốt. Chỉ cần thực hiện tìm kiếm và bạn sẽ kết thúc ở trang tổng quan. Bạn sẽ thấy phần trăm nội dung trùng lặp nội bộ ở trên cùng bên trái. Đừng hoảng sợ khi bạn thấy con số cao, vì quá trình kiểm tra nội dung trùng lặp này cũng xem xét các đoạn trích nội dung trùng lặp:
Chỉ cần nhấp vào một trong các liên kết và kiểm tra xem đó có thực sự là đoạn trích hay không. Đoạn trích rõ ràng có liên kết đến bài đăng, vì vậy nếu đúng như vậy thì bạn sẽ được bảo vệ.
-
Sidenote về việc sử dụng trình kiểm tra nội dung trùng lặp
Mặc dù Google hiểu thanh bên là gì nhưng CopyScape và Siteliner dường như bao gồm tất cả văn bản trên một trang trong phép tính tỷ lệ phần trăm của họ. Điều này có nghĩa là tỷ lệ phần trăm thực tế của nội dung trùng lặp khi chỉ nhìn vào nội dung chính của một trang có thể cao hơn. Hãy ghi nhớ điều này khi bạn sử dụng một trong những trình kiểm tra nội dung trùng lặp này. Chỉ cần cảnh báo thôi!
-
Kiểm tra nội dung trùng lặp thủ công
CopyScape và Siteliner là những công cụ kiểm tra nội dung trùng lặp dễ sử dụng. Tuy nhiên, nếu bạn muốn xem nội dung nào trùng lặp theo Google, bạn cũng có thể sử dụng chính Google.
Nếu bạn có một trang nhất định mà bạn muốn kiểm tra, chỉ cần truy cập trang đó. Sao chép một đoạn văn bản, tốt nhất là từ phần mà bạn cho rằng có thể hấp dẫn người khác sao chép. Hãy lấy một đoạn trong bài viết về các lỗi SEO phổ biến của chúng tôi: “ Nếu tiêu đề trang của bạn quá dài (hiện tại là 400 đến 600 pixel), nó sẽ bị cắt bỏ trên Google.
Bạn không muốn khách truy cập tiềm năng không thể đọc được tiêu đề đầy đủ trong SERPs. ” (Lưu ý Google chỉ tính đến 32 từ đầu tiên). Chèn đoạn mã chính xác vào Google giữa các dấu ngoặc kép như thế này:
Kiểm tra nội dung trùng lặp trên Google
Truy vấn tìm kiếm này trả về ‘khoảng 208 kết quả’ theo Google, cao hơn 10 kết quả mà CopyScape trả về.
-
Kiểm tra nội dung trùng lặp của riêng bạn
Sử dụng trình kiểm tra nội dung trùng lặp như CopyScape để tìm nội dung đã được sao chép từ trang web của bạn và sử dụng Google để xem nội dung này đã kết thúc ở nơi nào khác trên internet. Đây là những công cụ đơn giản phục vụ mục tiêu cao hơn: ngăn chặn nội dung trùng lặp . Nếu bạn muốn đọc thêm về nội dung trùng lặp, hãy bắt đầu với bài viết Nội dung trùng lặp: nguyên nhân và giải pháp của chúng tôi .
Xem thêm: Google ra mắt công cụ “Cập nhật nội dung hữu ích” để đa dạng hóa kết quả tìm kiếm