Blog » Cách xóa link 404 không tồn tại vĩnh viễn bằng File Robots

Cách xóa link 404 không tồn tại vĩnh viễn bằng File Robots

Bởi administrator | 15749

Bất kỳ 1 quản trị viên website nào cũng sẽ gặp trường hợp website của mình xuất hiện những link 404 không tồn tại và bị báo lỗi trong Webmaster Tool. Vì đây là lỗi thường xuyên gặp phải đối với 1 newbie quản lý web và có thể xuất hiện từ nhiều nguyên nhân mà chính bạn cũng không thể kiểm soát được.

Để khắc phục các lỗi 404 trong Webmaster (hay còn gọi là Google Search Console), Webbanhang24h đã làm bài hướng dẫn dưới đây để các bạn tham khảo các cách làm hiệu quả. Từ đó, không chỉ ẩn được link 404 not found mà còn xóa nó khỏi công cụ tìm kiếm của Google vĩnh viễn.

Link 404 page not found là gì? Có quan trọng với website không?

Khi người dùng truy cập vào 1 trang bất kỳ và được trình duyệt phản hồi hiển thị thông báo ở dạng như:

404 không tìm thấy

404 page not found

Không tìm thấy đường dẫn này

  1. That’s a error

This page cannot be found

Oops. The page you’re trying to reach doesn’t exit

404 page not found
404 page not found

Hoặc các thông báo tương tự. Khi đó, trong web Webmaster Tool (Tức Google Search console của người quản trị web cũng sẽ có thêm biểu đồ báo lỗi thu thập dữ liệu như sau:

 

webmaster hiển thị lỗi 404
webmaster hiển thị lỗi 404
sơ đồ lỗi 404 page not found
sơ đồ lỗi 404 page not found

Đồng thời, nếu lỗi 404 này xuất hiện khá nhiều trong 1 thời gian ngắn hoặc không sửa chữa trong 1 thời gian dài, người quản trị sẽ nhận được 1 hoặc nhiều thông báo được xếp vào thông báo quan trọng trong webmaster tool, kèm hướng dẫn sửa lỗi cho trang 404:

Thông báo nghiêm trọng về lỗi 404
Thông báo nghiêm trọng về lỗi 404

Nếu đã nhận được thông báo này mà bạn không tìm hiểu nguyên nhân cũng như cách giải quyết sẽ gây ra các ảnh hưởng nghiêm trọng như:

  • Người dùng truy cập vào những trang này sẽ không tìm thấy nội dung mong muốn, thoát ra, làm giảm thời gian onpage (bound rate), lâu dần là ảnh hưởng đến tỉ lệ nhấp chuột (CTR).
  • Các bot sau khi vào trang này không nhận được dữ liệu cần thu thập và không thể tự điều hướng đến các trang liên quan và toàn bộ sơ đồ trang web.
  • Khi nhiều lần lặp đi lặp lại lỗi này, các chỉ số trên website bị giảm, ảnh hưởng lớn nhất là chỉ số liên quan đến trải nghiệm người dùng – 1 trong các tiêu chí đánh giá chất lượng website lớn nhất của Google.
  • Khi có link 404 đang đứng top, nếu không có biện pháp khắc phục thì thứ hạng từ khóa đó sẽ bị giảm. Đồng thời, thứ hạng từ khóa của trang liên quan được trang 404 này liên kết đến cũng sẽ bị ảnh hưởng tiêu cực.

Có nhiều cách để giải quyết các link 404 này như ẩn, chuyển hướng, xóa,… tùy vào nguyên nhân phát sinh link 404. Vẫn có trường hợp dù link vẫn còn tồn tại nhưng do lỗi từ Google bot truy cập và thu thập dữ liệu sai vào 1 thời điểm nhất định mà báo lỗi 404. Vì vậy, khi xuất hiện link không tồn tại 404, việc đầu tiên cần làm của 1 quản trị viên là tìm hiểu nguyên nhân trước nhé.

Nguyên nhân và cách khắc phục các link 404:

  • Một số link (URL) trong website bị xóa. Lúc này, bạn có 2 hướng giải quyết là xóa hẳn link 404 kia đi và cách thứ 2 là chuyển hướng 301 thủ công (hoặc tự động) đến trang liên quan (hoặc trang chủ).
  • Một số link bị sửa đường dẫn tĩnh. Lúc này, để người dùng và bots truy cập đúng đường dẫn mới, bạn cần chuyển hướng (redirect 301 hoặc 302) đến đường dẫn mới. Trong đó: Redirect 301 áp dụng đối với việc chuyển hướng vĩnh viễn, Redirect 302 áp dụng cho việc chuyển hướng tạm thời. trường hợp sửa URL như thế này bạn nên dùng redirect 301 nhé.

Xem thêm: cách chuyển hướng 301

  • Do khách truy cập vào những đường link sai (vô tình hoặc cố ý gõ sai đường link), đi đến 1 trang không tồn tại. Việc này cũng có thể xuất hiện trong trường hợp đối thủ dùng công cụ để làm, tạo ra link 404 gây rắc rối cho website của bạn. Hướng giải quyết: Xóa Url. Chi tiết cách này sẽ được hướng dẫn ngay phần sau.
  • Do Bots truy cập sai đường dẫn và báo lỗi sai ở 1 thời điểm nào đó. Vẫn có nhiều trường hợp trong Google webmaster Tool báo danh sách lỗi 404 nhưng những link đó lại là link vẫn tồn tại. Có thể tại thời điểm nhận ra lỗi, bots đã thu thập dữ liệu sai. Trường hợp này, bạn không được xóa các link đó, cần tìm nạp (fetch as Google trong Webmaster Tool).

Chi tiết Hướng dẫn cách xóa URL trong Webmaster Tool:

Lưu ý: Trước khi bắt đầu vào hướng dẫn, mình nhận thấy rất rất nhiều bạn đang nhằm lẫn giữa công cụ xóa URL trong webmaster: https://www.google.com/webmasters/tools/url-removal . Đây chỉ là công cụ ẩn URL không cho chúng được báo lỗi trong webmaster (Google Search console) mà thôi. Thời gian ẩn tối đa của nó là 90 ngày. Tức là sau 90 ngày này, Bots sẽ vào thu thập lại dữ liệu, nếu sự cố chưa được khắc phục (chưa chuyển hướng, chưa xóa,…) thì URL này vẫn sẽ được thu thập và báo lỗi 404. Hính dưới đây là các URL sau 90 ngày đó:

link ẩn bị hết hạn trong webmaster
link ẩn bị hết hạn trong webmaster

Vì vậy, khi có link 404, sau khi xem xét nguyên nhân, bạn muốn xóa nó đi, hãy làm theo cách dùng File Robots.txt dưới đây:

Cách xóa URL (chặn URL) bằng File Robots.txt:

Nếu bạn chưa biết đến File robots, hãy đọc trước bài biết: File Robots là gì? Sau đó hãy tiến hành xóa URL như sau:

Bước 1: Vào Google Search console > Thu thập dữ liệu > Lỗi thu thập dữ liệu > Không tìm thấy > Chọn tải xuống để tải tất cả các link 404 về máy ở dạng file excel

tải xuống danh sách link bị lỗi 404 trong webmaster
tải xuống danh sách link bị lỗi 404 trong webmaster

Bước 2: Mở file > thay thế cụm: http bằng Disallow: http để được các giá trị có định dạng Disallow: link-can-xoa như hình:

cú pháp: Disallow: link-can-xoa
cú pháp: Disallow: link-can-xoa

Bước 3: Truy cập hosing > tìm đến Edit file Robots.txt (vị trí file có thể khác một chút, nhưng đa phần, file robots được đặt trong Public_html). Nếu chưa rõ vị trí, có thể xem bài viết: https://webbanhang24h.org/file-robot-la-gi-cach-su-dung-file-robot-hieu-qua-cho-seo-website/

Bước 4: Dán tất cả các link cần xóa vào file robots > Lưu:

thêm link cần xóa vào file robots để chặn
thêm link cần xóa vào file robots để chặn

Như vậy, bạn đã xóa được URL 404 bằng cách ngăn chặn bots thu thập dữ liệu. Cách này được áp dụng khi bạn muốn URL vĩnh viễn, không cho bots thu thập. Nhưng về phía người dùng, nếu họ click vào các link này thì vẫn sẽ nhận được thông báo page not found, để giải quyết triệt để, sau khi xóa link bằng file robots, bạn cần chuyển hướng (Redirect 301) các link này về 1 trang tồn tại (thông thường sẽ được chuyển đến 1 trang có nội dung tương tự hoặc chuyển hướng đến trang chủ).

Xem thêm: Cách chuyển hướng 301

Quay lại với cách xóa link bằng Robots.txt vừa rồi, để Webmaster không còn báo lỗi nữa, bạn cần làm tiếp như sau:

Bước 5: Google Search console > Thu thập dữ liệu > Lỗi thu thập dữ liệu > Không tìm thấy > Chọn tất cả link 404 > Đánh dấu là cố định.

Việc đánh dấu cố định này có tác dụng ẩn URL mà bạn đã xử lý xong trong vòng 90 ngày. Nếu sau thời gian này mà bạn chưa giải quyết được thì Webmaster sẽ tiếp tục báo lỗi.

https://webbanhang24h.org/ Chúc các bạn xóa link 404 triệt để.

Hãy like nếu bạn thấy hữu ích

Leave a Reply

Your email address will not be published. Required fields are marked *

Bài viết liên quan