Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

Rate this post

Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

Google, gã khổng lồ tìm kiếm, cũng phải đối diện với một vấn đề nan giải: “nội dung khi trùng lặp”. Nỗi sợ sẽ xảy đến khi nội dung khi trùng lặp xuất hiện tại nhiều URL khác nhau trên web. Hệ quả là Google bối rối, không biết cách hiển thị URL như thế nào trong kết quả tìm kiếm.

Điều này sẽ làm giảm thứ hạng website của bạn, thậm chí vấn đề còn trở nên nghiêm trọng khi mọi người cố gắng liên kết đến các trang khác nhau của cùng một nội dung khi trùng lặp. Bài viết này sẽ cùng bạn vén màn bí ẩn về các nguyên nhân gây ra “nội dung khi trùng lặp”, qua đó đưa ra phương án giải quyết đối với mỗi vấn đề.

noi-so-noi-dung-khi-trung-lap-google-dau-dau-website-dieu-dung
Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

 

“Nội dung khi trùng lặp” là như thế nào?

Hiểu một cách ngắn gọn, “nội dung khi trùng lặp” là nội dung xuất hiện trên nhiều URL khác nhau trên web. Vì nhiều URL cùng hiển thị nội dung giống hệt nhau, Google lúng túng không biết nên hiển thị URL nào trong kết quả tìm kiếm. Do đó, Google có thể hạ thấp thứ hạng của cả hai URL và hạn chế hiển thị các trang web khác.

Trong bài viết này, chúng ta sẽ đi sâu tìm hiểu về nguyên nhân kỹ thuật gây ra “nội dung khi trùng lặp” cùng phương pháp giải quyết hiệu quả.

Hình dung vấn đề thông qua tình huống thực tế

Hãy hình dung bạn đang đứng tại ngã tư, nơi biển báo chỉ dẫn bạn đến cùng một đích đến nhưng theo hai hướng khác nhau. Bạn sẽ lựa chọn con đường như thế nào? Để tạo thêm sự thử thách, đích đến sau cùng cũng khác nhau, cho dù chỉ là một nửa.

Là người đọc, bạn hoàn toàn không quan tâm nếu bạn đến đúng nơi muốn đến, bởi vì Google phải lựa chọn trang khác được hiển thị trong kết quả tìm kiếm và tất nhiên Google không thích hiển thị cùng một nội dung khi trùng lặp hai lần.

Giả sử bài viết của bạn chứa “từ khoá X” xuất hiện ở trang http://www.example.com/từ-khoá-X/và nội dung khi trùng lặp cũng xuất hiện ở http://www.example.com/chuyên-mục-bài-viết/từ-khoá-X/. Điều này cũng có thể xảy ra: nó thường xuyên xảy ra đối với bất kỳ Hệ thống quản trị nội dung (CMS) hiện đại.

Giả sử bài viết của bạn được nhiều blogger khác đăng tải lại, một vài người liên kết đến URL ban đầu, trong khi một vài người khác liên kết đến URL thứ hai. Lúc này, vấn đề của Google biểu lộ rõ ràng: đó là vấn đề của bạn.

“Nội dung khi trùng lặp” là vấn đề của bạn nếu các liên kết đó được quảng cáo URL khác nhau. Nếu toàn bộ các liên kết đến cùng một URL, thời cơ xếp hạng cho “từ khoá X” của bạn sẽ cao lên.

Tại sao phải loại bỏ “nội dung khi trùng lặp” trên website của bạn?

“Nội dung khi trùng lặp” sẽ gây tổn hại tới thứ hạng website của bạn. Ít nhất, Google sẽ không biết cách xếp hạng trang như thế nào đối với người dùng. Và kết quả là, toàn bộ số trang bị Google cho là nội dung khi trùng lặp sẽ có khả năng bị xếp hạng thấp hơn.

Đó là kịch bản tồi tệ nhất. Nếu vấn đề “nội dung khi trùng lặp” của bạn quá trầm trọng, ví dụ như nội dung khi trùng lặp nghèo nàn cộng với nội dung khi trùng lặp copy nhiều lần, bạn hoàn toàn có thể phải đối diện với hình phạt trực tiếp từ Google do cố tình lừa dối người dùng.

Vì vậy, nếu bạn mong muốn nội dung của mình được xếp hạng cao, điều rất cần thiết là phải chắc chắn rằng mỗi trang phải chứa một số lượng nội dung khi trùng lặp đặc biệt nhất định.

Tuy nhiên, nó cũng là vấn đề của Google. Nếu người dùng đang tìm kiếm một trang chung chung, họ có thể cảm thấy khó chịu nếu họ không có nội dung khi trùng lặp cụ thể mà họ đang tìm kiếm. Vì vậy, giống với nhiều khía cạnh của SEO, điều cần thiết là phải xử lý vấn đề “nội dung khi trùng lặp” nhằm đem tới trải nghiệm người dùng tuyệt vời hơn cũng như tối ưu kết quả tìm kiếm.

Nguyên nhân gây ra “nội dung khi trùng lặp”

Có rất nhiều nguyên nhân liên quan đến “nội dung khi trùng lặp”. Hầu hết trong số họ là vì kỹ thuật: thật ít khi chúng ta có thể đăng cùng một nội dung khi trùng lặp tại hai nơi khác nhau mà không nói rõ ràng ai là đồng tác giả. Trừ khi bạn tình cờ sao chép một bài viết và đăng nó. Nhưng nếu không, phần lớn chúng ta sẽ nghĩ điều ấy không bình thường.

Tuy nhiên, có quá nhiều vấn đề kỹ thuật và điều chính xảy ra là các nhà phát triển không tư duy như một lập trình viên, một người dùng, và chưa đề cập đến một con nhện của công cụ tìm kiếm – họ tư duy như một lập trình viên.

Hãy xem bài viết mà chúng ta đã thảo luận trước đó, bài viết xuất hiện trên http://www.example.com/từ-khoá-X/và http://www.example.com/chuyên-mục-bài-viết/từ-khoá-X/. Nếu bạn hỏi lập trình viên, họ sẽ trả lời rằng trình duyệt chỉ hoạt động một lần.

noi-so-noi-dung-khi-trung-lap-google-dau-dau-website-dieu-dung
Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

Hiểu nhầm ngôn ngữ về URL

Nhà phát triển không hề phát điên, họ chỉ đang sử dụng một ngôn ngữ lập trình khác. Một CMS có thể sẽ cung cấp cơ sở dữ liệu trên website và nếu cơ sở dữ liệu đó chỉ có một bài viết, tuy nhiên ứng dụng của website chỉ cho phép truy cập vào một bài viết nhất định trong cơ sở dữ liệu thông qua một vài URL.

Đó là bởi vì, trong mắt nhà phát triển, mã định danh duy nhất cho bài viết đó là ID nội dung khi trùng lặp bài viết có trong cơ sở dữ liệu, chứ không phải URL. Nhưng đối với Google, URL là mã định danh duy nhất đối với một đoạn nội dung khi trùng lặp. Nếu bạn nói điều tương tự với nhà phát triển, họ sẽ nhanh chóng hiểu vấn đề. Và sau khi đọc bài viết này, bạn chắc chắn sẽ có thể cung cấp cho họ giải pháp tức thì.

ID phiên

Bạn cũng muốn theo dõi khách truy cập của mình và cho phép họ, ví dụ hơn, giữ các sản phẩm họ muốn mua trong giỏ đặt hàng. Để làm được điều đó, bạn phải cung cấp cho họ một ‘ phiên ’.

Phiên là lịch sử tóm tắt tất cả những việc khách truy cập đã làm trên trang web của bạn và có thể lưu trữ những gì bao gồm các sản phẩm trong giỏ đặt hàng của họ. Để lưu trữ phiên đó khi khách truy cập chuyển từ trang này qua trang tiếp theo, mã định danh duy nhất cho phiên tiếp theo – được gọi là ID Phiên – phải được lưu giữ tại đâu đó. Giải pháp tốt nhất là làm điều đó với cookie. Tuy nhiên, Google sẽ không lưu giữ cookie.

Tại thời điểm đó, một số hệ thống sẽ chuyển hướng qua sử dụng ID Phiên trong URL. Điều này có nghĩa là tất cả link nội bộ trên website sẽ được chèn ID Phiên trên URL của trang và nếu ID Phiên sẽ là duy nhất đối với phiên tiếp theo, nó sẽ tạo ra một URL mới và cuối cùng tạo ra “nội dung khi trùng lặp”.

Tham số URL được sử dụng để theo dõi và xếp hạng

Một lý do khác gây ra “nội dung khi trùng lặp” là sử dụng các tham số URL không làm thay đổi nội dung khi trùng lặp của trang, ví dụ như đối với các link theo dõi. Bạn thấy không, theo Google, http://www.example.com/từ-khoá-X/và http://www.example.com/từ-khoá-X/?nguồn=rss không phải là cùng một URL. URL thứ hai có thể cho phép bạn theo dõi vị trí của từng từ khoá, tuy nhiên nó cũng có thể khiến bạn không xếp hạng cao được – một công dụng phụ cực kỳ không mong đợi!

Tất nhiên, điều tương tự cũng đúng đối với các tham số theo dõi. Nó áp dụng đối với bất kỳ tham số bạn có thể chèn vào URL mà không làm thay đổi thành phần nội dung khi trùng lặp chính, bất kể tham số đó là để ‘ thay đổi cách hiển thị trên một nhóm sản phẩm ’ hay là để ‘ hiển thị thanh bên khác ‘: toàn bộ đều sẽ gây ra “nội dung khi trùng lặp”.

Công cụ copy nội dung khi trùng lặp và cung cấp nội dung khi trùng lặp

Hầu hết các nguyên nhân gây “nội dung khi trùng lặp” là ‘ trang web ’ của bạn hoặc website của bạn. Tuy nhiên, thỉnh thoảng, các website khác sử dụng nội dung khi trùng lặp của bạn, có khi không có sự cho phép của bạn.

Họ không phải lúc nào cũng đề cập đến bài viết gốc của bạn và vì vậy Google không ‘ hiểu ‘ nó và phải tìm kiếm một phiên bản khác của cùng một bài viết. Trang web của bạn ngày càng trở nên lớn, bạn ngày càng thu thập được nhiều phương tiện sao chép, khiến vấn đề càng trở nên nghiêm trọng hơn bao giờ hết.

Thứ tự của các tham số

Một lý do phổ biến khác là CMS không sử dụng URL đẹp mắt và ngăn nắp, đặc biệt là đối với URL kiểu */? id= 1 & cat= 2 *, trong đó ID liên quan đến bài viết còn cat liên quan đến danh mục. URL */? cat= 2 & id= 1 * sẽ hiển thị kết quả tương tự như đối với phần lớn các hệ thống website, mặc dù kết quả có thể khác nhau đối với Google.

Phân trang bình luận

Trong WordPress, cũng như trong một số hệ thống khác, có một tuỳ chọn để phân chia trang nhận xét của bạn. Điều này liên quan đến nội dung khi trùng lặp bị trùng lặp trên URL bài viết và URL bài viết +/comment-page -1/,/comment-page -2/, vv

Trang thân thiện với máy in

Nếu hệ thống quản trị nội dung của bạn tạo các trang thân thiện với máy in và bạn trỏ đến những trang như vậy trên đầu trang bài viết của mình, Google cũng sẽ nhìn thấy chúng, trừ khi bạn xoá chúng một cách cụ thể. Bây giờ, hãy tự hỏi bản thân: Bạn muốn Google hiển thị phiên bản như thế nào? Phiên bản có quảng cáo hiển thị nội dung khi trùng lặp website của bạn hay phiên bản chỉ hiển thị bài viết của bạn?

WWW so với không phải WWW

Đây là một trong những vấn đề phổ biến nhất, tuy nhiên đôi lúc Google lại hiểu nhầm: “nội dung khi trùng lặp” WWW so với không phải WWW, nghĩa là cả hai phiên bản website của bạn cùng có thể truy cập được. Một trường hợp khác, kém thông dụng hơn nhưng tôi đã thấy là “nội dung khi trùng lặp” HTTP so với HTTPS, theo đó cùng một nội dung khi trùng lặp được truyền giữa cả hai.

Giải pháp về mặt kỹ thuật: URL ‘ chuẩn ‘

Như chúng ta đã thấy, vấn đề một số URL liên quan đến cùng một nội dung khi trùng lặp là một vấn đề, tuy nhiên nó có thể được giải quyết. Một nhân viên làm việc trong một công ty thông thường sẽ có thể cho bạn biết một cách nhanh chóng URL ‘ chuẩn ’ cho một bài viết cụ thể là như thế nào, tuy nhiên nếu đôi khi bạn hỏi ba nhân viên tại cùng một thời điểm, bạn sẽ có được ba câu trả lời khác nhau. ..

Đó là một vấn đề phải được giải quyết và, do đó, chỉ có thể có một (URL). URL ‘ đúng ‘ duy nhất chứa một phần nội dung khi trùng lặp được Google coi là URL chuẩn.

noi-so-noi-dung-khi-trung-lap-google-dau-dau-website-dieu-dung
Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

Xác định các vấn đề “nội dung khi trùng lặp”

Bạn có thể không biết liệu website hoặc nội dung khi trùng lặp của bạn có gặp phải vấn đề “nội dung khi trùng lặp” hay không. Sử dụng Google là một trong những phương pháp dễ dàng nhất giúp xác định “nội dung khi trùng lặp”.

Có một vài công cụ tìm kiếm rất hiệu quả đối với những trường hợp như trên. Nếu bạn cần tìm kiếm toàn bộ các URL trên website của mình có chứa bài viết từ khoá X, bạn sẽ gõ cú pháp tìm kiếm sau trên Google:

site:example.com intitle: “Từ khoá X”

Google sau đó sẽ hiển thị cho bạn danh sách các trang trên example.com có chứa từ khoá X. Bạn có thể làm cho phần intitle của từ khoá rõ ràng hơn, như vậy quá trình loại trừ “nội dung khi trùng lặp” sẽ đơn giản hơn. Bạn có thể sử dụng đến cùng một phương thức để loại trừ “nội dung khi trùng lặp” trên web. Giả sử tiêu đề chính của bài viết của bạn là ‘ Từ khoá X – lí do tại sao nó tốt ’, bạn sẽ tìm kiếm:

intitle: “Từ khoá X – lí do tại sao nó hoàn hảo”

Và Google sẽ hiển thị giúp bạn danh sách các website phù hợp với tiêu đề trên. Đôi khi, bạn cũng nên tìm kiếm một đến hai câu hoàn chỉnh từ bài viết của mình, bởi vì một vài trình copy có thể sửa đổi tiêu đề. Trong một vài trường hợp, khi bạn tiến hành tìm kiếm tương tự, Google có thể hiển thị thông báo lỗi sau trên trang kết quả tìm kiếm:

Trong kết quả hiển thị có thể có những trang tương tự với kết quả đã hiển thị bên trên. Nếu không thể xem toàn bộ, vui lòng nhấn vô đây.

Đây là tín hiệu cho thấy Google đã ‘ loại trừ nội dung khi trùng lặp ’ kết quả. Vẫn còn tốt, vì vậy bạn hãy nhấn vào link và xem toàn bộ danh sách kết quả tìm kiếm để xem liệu bạn có thể sửa một vài kết quả trong tổng số kia hay không.

Giải pháp thực tiễn đối với “nội dung khi trùng lặp”

Khi bạn đã biết URL nào là URL chuẩn đối với phần nội dung khi trùng lặp của trang, bạn phải thực hiện quy trình chuẩn hoá (vâng, tôi biết, bạn đã làm điều đó ba lần rất nhanh chóng). Điều này có nghĩa là chúng ta phải cho Google biết về phiên bản chuẩn của một trang và giúp Google tìm thấy nội dung khi trùng lặp MỘT CÁCH NHANH VÀ HIỆU QUẢ. Có bốn phương pháp để giải quyết vấn đề, theo thứ tự ưu tiên:

Không tạo “nội dung khi trùng lặp”

Chuyển hướng “nội dung khi trùng lặp” sang URL chuẩn

Thêm phần tử liên kết chuẩn vào trang nội dung khi trùng lặp

Thêm phần tử HTML từ trang nội dung khi trùng lặp sang trang chuẩn

Tránh “nội dung khi trùng lặp”

Một số lý do xảy ra “nội dung khi trùng lặp” ở trên có một cách giải quyết cực kỳ dễ dàng:

Có ID Trùng lặp trong URL của bạn? Những điều này cũng có thể bị tắt khỏi thiết lập hệ thống của bạn.

Bạn có phân trang phù hợp với máy in nội dung khi trùng lặp? Những điều trên là không quan trọng: bạn chỉ nên sử dụng bảng chọn kiểu in.

Bạn đang sử dụng các trang comment trong WordPress? Bạn chỉ nên vô hiệu hoá chức năng thảo luận (trong thiết lập » thảo luận) trên 99% website.

Các tham số của bạn có theo thứ tự nào không? Hãy nói chuyện với nhà phát triển của bạn tạo một tập lệnh cho phép bạn sắp xếp các tham số theo cùng một thứ tự (điều này còn được gọi là trình tạo URL).

Có vấn đề đối với liên kết theo dõi? Trong phần lớn các trường hợp, bạn có thể sử dụng theo dõi quảng cáo dựa trên tham số bắt đầu bởi ký tự # thay vì theo dõi quảng cáo dựa trên tham số.

Bạn có vấn đề về WWW so với không phải WWW? Chọn một và gắn bó với trang web bằng cách chuyển hướng cái nọ qua cái kia mà. Bạn cũng có thể đặt tuỳ lựa chọn tương tự trong Google Search Console, mặc dù bạn sẽ phải xác minh cho tất cả hai phiên bản của nó.

Nếu vấn đề của bạn không dễ dàng khắc phục được, bạn vẫn nên cố gắng. Mục tiêu là loại bỏ toàn bộ “nội dung khi trùng lặp” tồn tại, bởi vì nó là cách hiệu quả nhất cho vấn đề.

noi-so-noi-dung-khi-trung-lap-google-dau-dau-website-dieu-dung
Nỗi sợ “Nội dung khi trùng lặp” – Google đau đầu, website điêu đứng!

Chuyển hướng 301 “nội dung khi trùng lặp”

Trong một vài tình huống, thay vì chặn toàn bộ nếu bạn đang dùng các URL lỗi cho nội dung khi trùng lặp, bạn vẫn có thể chuyển hướng chúng. Nếu điều này không phù hợp với bạn (điều mà tôi có thể làm tốt), vui lòng xem xét điều đó khi thảo luận với nhóm phát triển của bạn. Nếu bạn loại bỏ thành công một số vấn đề “nội dung khi trùng lặp”, vui lòng chắc chắn rằng bạn chuyển hướng toàn bộ URL “nội dung khi trùng lặp” cũ thành URL chuẩn phù hợp.

Sử dụng liên kết

Đôi khi bạn không thích hoặc muốn loại bỏ phiên bản trùng lặp của một bài viết, ngay cả khi bạn nghĩ rằng đó là URL sai. Để khắc phục vấn đề phổ biến này, Google đã ra mắt phần tử liên kết chuẩn. Nó được đặt trong phần <head> của website của bạn và sẽ hiển thị như thế này:

<link rel=”canonical” href=”https://example.com/canonical-version/” />

Use code with caution.

Html

Trong phần href của liên kết chuẩn, bạn đặt URL chuẩn phù hợp cho bài viết của mình. Khi Google giúp liên kết chuẩn tìm được phần tử liên kết chính xác, Google sẽ thực hiện chuyển hướng 301 mềm, đưa các phần tử liên kết từ trang đó lấy đến liên kết chuẩn của bạn.

Tuy nhiên, quy trình sẽ lâu hơn nhiều so với chuyển hướng 301, và nếu bạn muốn thực hiện chuyển hướng 301 mềm sẽ nhanh hơn, ông John Mueller của Google đã nói.

Liên kết trở lại nội dung khi trùng lặp gốc

Nếu bạn không thể thực hiện bất cứ điều nào như trên, có lẽ bởi vì bạn không quản lý phần của website nơi nội dung khi trùng lặp của bạn hiển thị, vì vậy việc chèn liên kết trở lại bài viết gốc nằm trên cùng hoặc bên dưới bài viết có thể là một ý tưởng hay.

Bạn có thể dễ dàng thực hiện điều tương tự đối với phần cung cấp RSS của website bằng cách chèn liên kết trở lại bài viết gốc đó. Một số công cụ copy sẽ xoá liên kết đi, còn những phần mềm khác có thể giữ lại liên kết đó. Nếu Google gặp phải một số liên kết dẫn về bài viết gốc của bạn, Google sẽ nhanh chóng tìm thấy liên kết đó là phiên bản chuẩn thực sự.

Kết luận: “nội dung khi trùng lặp” có thể khắc phục được và nên sớm khắc phục

“Nội dung khi trùng lặp” xảy ra hầu như khắp mọi nơi. Tôi chưa bao giờ gặp một website nào có trên 1.000 trang mà lại không gặp phải bất kỳ một vấn đề “nội dung khi trùng lặp” nhỏ. Đó là điều bạn cần phải tiếp tục quan tâm, bởi vì hoàn toàn có thể khắc phục được và phần thưởng có thể cực kỳ lớn. Nội dung khi trùng lặp SEO của bạn có thể tăng lên trong bảng tìm kiếm, hoặc bằng cách loại bỏ “nội dung khi trùng lặp” trên website của bạn!

Đánh giá mức độ phù hợp SEO kỹ thuật của bạn

Khắc phục “nội dung khi trùng lặp” là một phần quan trọng của SEO kỹ thuật của bạn. Tò mò xem mức độ phù hợp SEO kỹ thuật tổng thể của website bạn? Chúng tôi đã thực hiện một bài đánh giá mức độ phù hợp SEO kỹ thuật cho phép bạn tìm thấy những điều bạn sẽ phải thực hiện!

Xem thêm: Dọn dẹp backlink rác – 1 cơn ác mộng của website

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses cookies to offer you a better browsing experience. By browsing this website, you agree to our use of cookies.