Tôi có thể lập chỉ mục các tệp pdf bằng plugin seo không?

5/5 - (1 vote)

Tôi có thể lập chỉ mục các tệp PDF bằng plugin SEO không?

Trong bài viết cơ sở kiến thức này, chúng ta sẽ thảo luận về cách ngăn chặn **lập chỉ mục các tệp PDF** của bạn hiển thị trong kết quả tìm kiếm.

Cung cấp các tệp PDF (sách điện tử, hướng dẫn hoặc bất cứ thứ gì khác) có thể là nguồn thu hút khách hàng tiềm năng tuyệt vời để xây dựng khán giả của bạn. Tuy nhiên, điều đó có nghĩa là bạn sẽ không muốn

những tài nguyên có giá trị này có sẵn thông qua tìm kiếm của Google để mọi người có thể tìm thấy chúng dễ dàng, thay vì tải chúng xuống thông qua biểu mẫu của bạn.

Và điều tương tự cũng xảy ra với các trang web ở các phân khúc khác; tài liệu được lưu trữ dưới dạng PDF sẽ không xuất hiện trong kết quả tìm kiếm trừ khi bạn có ý định làm như vậy. Nói cách khác, bạn có thể không muốn **lập chỉ mục các tệp PDF**.

Mặc dù chúng tôi quen với việc ngăn chặn các trang của bạn được lập chỉ mục trong kết quả tìm kiếm bằng cách sử dụng thẻ Robots Meta nhưng cách tiếp cận tương tự sẽ không hiệu quả đối với các tệp phương tiện và tệp PDF.

Tại sao không thể thêm chỉ thị meta của Noindex Robots vào tệp PDF?

Thẻ Meta Robots được thêm vào phần đầu mã HTML của trang. Với Rank Math, bạn có thể dễ dàng thêm nó vào bài đăng, trang, trang lưu trữ và thậm chí cả trang đính kèm của mình vì chúng đều là HTML.

Tuy nhiên, PDF không phải là tệp HTML và không chứa bất kỳ mã HTML nào; do đó bạn không thể thêm thẻ Meta Robot NoIndex vào đó. Điều này có nghĩa là bạn không thể **lập chỉ mục các tệp PDF** theo cách này.

Nếu điều đó thậm chí có thể thực hiện được bằng bất kỳ cách nào — khi các tệp PDF của bạn được truy cập, chúng không được phân phối qua WordPress mà trực tiếp bởi máy chủ của bạn và các plugin WordPress của bạn sẽ không có quyền kiểm soát nó.

Do đó, Rank Math ( hoặc bất kỳ plugin SEO nào khác ) không thể thêm chỉ thị Robots Meta vào tệp PDF. Điều này có nghĩa là bạn không thể sử dụng plugin để **lập chỉ mục các tệp PDF**.

Tuy nhiên, như đã nói, nếu tệp PDF của bạn đã được lập chỉ mục trong kết quả tìm kiếm hoặc bạn muốn ngăn việc thu thập thông tin tệp PDF của mình, các phương pháp sau sẽ giúp bạn làm điều đó. Nói cách khác, bạn có thể ngăn chặn **lập chỉ mục các tệp PDF**.

Toi-co-the-lap-chi-muc-cac-tep-PDF-bang-plugin-SEO-khong
Tôi có thể lập chỉ mục các tệp PDF bằng plugin SEO không?

Làm cách nào để ngăn chặn việc thu thập thông tin tệp PDF?

Đưa ra yêu cầu xóa tìm kiếm

Đưa ra yêu cầu xóa trong Google Search Console có lẽ là cách nhanh nhất để loại bỏ các tệp PDF của bạn khỏi chỉ mục và để đưa ra yêu cầu, hãy làm theo các bước chính xác mà chúng tôi đã thảo luận bên dưới. Bằng cách này, bạn có thể hoàn tác việc **lập chỉ mục các tệp PDF**.

Mở Search Console

Truy cập Google Search Console và sau đó đăng nhập vào tài khoản của bạn. Nếu bạn chưa kết nối và xác minh trang web của mình trong Google Search Console thì bạn có thể để Rank Math làm điều đó cho bạn .

Chọn thuộc tính chính xác nếu bạn đã kết nối nhiều tài khoản với Google Search Console.

Mở Google Search Console

Điều hướng đến phần Xóa

Từ thanh bên trái, nhấp vào phần Xóa .

phần xóa

Chọn Yêu cầu mới

Trên trang Xóa, nhấp vào Yêu cầu mới .

yêu cầu mới

Toi-co-the-lap-chi-muc-cac-tep-PDF-bang-plugin-SEO-khong
Tôi có thể lập chỉ mục các tệp PDF bằng plugin SEO không?

Gửi yêu cầu mới

Trong cửa sổ bật lên xuất hiện trên màn hình, nhập URL PDF mà bạn muốn xóa rồi nhấp vào Tiếp theo .

Gửi yêu cầu xóa mới trong Google Search Console

Trong màn hình tiếp theo, xác nhận xóa URL bằng cách nhấp vào nút Gửi yêu cầu .

Gửi yêu cầu xóa URL khỏi Google Search Console

Khi yêu cầu đã được gửi, bạn có thể kiểm tra trạng thái xóa trong Google Search Console.

Trạng thái xóa tạm thời trong Google Search Console

Lưu ý: Việc xóa khỏi chỉ mục tìm kiếm này chỉ là tạm thời trong một khoảng thời gian nhất định. Như Google tuyên bố, nội dung sẽ không được lập chỉ mục trong sáu tháng. Tuy nhiên, để loại tệp PDF này vĩnh viễn khỏi chỉ mục tìm kiếm của Google, bạn cần chặn các công cụ tìm kiếm thu thập dữ liệu tệp PDF bằng robots.txt.  Điều này có nghĩa là Google sẽ không **lập chỉ mục các tệp PDF** nữa.

Không cho phép tệp PDF sử dụng robots.txt

Bằng cách sử dụng robots.txt, bạn có thể ngăn việc thu thập thông tin tệp PDF của mình. Tuy nhiên, điều này sẽ chỉ ngăn trang của bạn được thu thập thông tin và không được lập chỉ mục .

Chỉ khi ai đó liên kết đến tệp PDF của bạn từ một công cụ tìm kiếm trang web bên ngoài mới tiến hành lập chỉ mục tệp của bạn. Trừ khi có ai đó liên kết rõ ràng, Google sẽ không thu thập dữ liệu tệp PDF và lập chỉ mục tệp của bạn. Nói cách khác, Google sẽ không **lập chỉ mục các tệp PDF**. Bây giờ, hãy xem cách ngăn chặn việc thu thập dữ liệu tệp PDF của bạn bằng robots.txt.

Điều hướng đến Robots.txt của bạn

Đi tới Bảng điều khiển WordPress → Xếp hạng SEO toán học → Cài đặt chung → Chỉnh sửa Robots.txt . Nếu tùy chọn Chỉnh sửa Robots.txt không có sẵn thì hãy đảm bảo bạn đang sử dụng Chế độ nâng cao trong Rank Math .

chỉnh sửa robots.txt

Toi-co-the-lap-chi-muc-cac-tep-PDF-bang-plugin-SEO-khong
Tôi có thể lập chỉ mục các tệp PDF bằng plugin SEO không?

Chỉnh sửa Robots.txt

Sau đó, sao chép và dán đoạn mã sau vào trình chỉnh sửa mã. Đảm bảo thay thế yoursite.combằng tên miền của bạn. Quy Disallow: *.pdftắc được thêm vào đây sẽ hướng dẫn các công cụ tìm kiếm không thu thập dữ liệu các tệp PDF.

User-agent: *

Disallow: /wp-admin/

Disallow: *.pdf

Allow: /wp-admin/admin-ajax.php

Sitemap: https://yoursite.com/sitemap_index.xml

Dán mã vào robots.txt để không cho phép tệp PDF

Lưu thay đổi

Bây giờ hãy nhấp vào nút Lưu Thay đổi ở cuối màn hình để phản ánh các thay đổi. Bạn có thể kiểm tra và xác nhận bằng cách sử dụng Trình kiểm tra robots.txt để xem liệu Googlebot có thể thu thập dữ liệu và truy cập vào tệp PDF của bạn hay không. Bằng cách này, bạn có thể ngăn chặn việc Google **lập chỉ mục các tệp PDF**.

Lưu các thay đổi vào robots.txt

Không cho phép tệp PDF sử dụng X-Robots-Tag

Thẻ X-robots là một phương pháp khác để ngăn các tệp không phải HTML như PDF lập chỉ mục. Nó phức tạp hơn thẻ Robot Meta.

Để ngăn tệp PDF sử dụng thẻ x-robots, bạn cần sửa đổi tệp htaccess, header.php của trang web hoặc cần sửa đổi ở cấp độ máy chủ.

Nếu bạn đang sử dụng máy chủ Apache, hãy thêm thẻ x-robots sau vào tệp httpd.config hoặc tệp htaccess trên trang web của bạn.

<Files ~ “.pdf$”>

Header set X-Robots-Tag “noindex, follow”

</Files>

Và đối với máy chủ Ngnix, hãy thêm thẻ x-robots-tag sau.

location ~* .pdf$

{

add_header X-Robots-Tag “noindex, follow”;

}

Lưu ý: Đảm bảo kiểm tra nguyên tắc của Google về thẻ x-robots trước khi thực hiện bất kỳ sửa đổi nào đối với tệp trang web của bạn. Phương pháp này cũng ngăn chặn **lập chỉ mục các tệp PDF**.

Toi-co-the-lap-chi-muc-cac-tep-PDF-bang-plugin-SEO-khong
Tôi có thể lập chỉ mục các tệp PDF bằng plugin SEO không?

Kết luận

Và thế là xong! Chúng tôi hy vọng các phương pháp trên đã giúp bạn ngăn chặn việc thu thập thông tin tệp PDF của mình và khiến chúng bị loại khỏi chỉ mục tìm kiếm. Nếu bạn vẫn có bất kỳ câu hỏi nào về việc lập chỉ mục nội dung của mình, vui lòng liên hệ trực tiếp với nhóm hỗ trợ của chúng tôi từ đây và chúng tôi luôn sẵn sàng trợ giúp.

Xem Thêm: Cách loại trừ các từ khỏi tìm kiếm của Google

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses cookies to offer you a better browsing experience. By browsing this website, you agree to our use of cookies.