Tài liệu liên quan
Danh mục liên quan
Thời gian đọc của bạn
Bài viết liên quan
Kiến thức SEO Tìm Hiểu Nhóm Từ Khóa và Lợi Ích Trong SEO
Kiến thức SEO Hướng Dẫn Xóa Schema Sai và Dư Thừa để Bảo Vệ SEO
Chào bạn, Bùi Mạnh Đức đây. Bạn đã bao giờ truy cập Google Search Console và thấy thông báo lỗi “Trang được lập chỉ mục nhưng không có nội dung” chưa? Lỗi này thường gây ra nhiều bối rối, bởi vì rõ ràng trang của bạn có đầy đủ nội dung, nhưng Google lại báo là “trống”. Đây không chỉ là một cảnh báo thông thường, nó có thể ảnh hưởng tiêu cực đến nỗ lực SEO và thứ hạng từ khóa của bạn. Google hiểu rằng trang này không mang lại giá trị, từ đó có thể loại bỏ nó khỏi kết quả tìm kiếm. Trong bài viết này, chúng ta sẽ cùng nhau làm rõ nguyên nhân, cách kiểm tra và khắc phục triệt để lỗi này, giúp website của bạn luôn thân thiện với Google.
Lỗi “Trang được lập chỉ mục nhưng không có nội dung” thường xuất phát từ những rào cản kỹ thuật khiến Google không thể đọc được nội dung thực tế trên trang, mặc dù URL đã được phát hiện và lập chỉ mục. Hiểu rõ các nguyên nhân cốt lõi là bước đầu tiên để khắc phục vấn đề một cách hiệu quả.
File robots.txt có vai trò như một người gác cổng, hướng dẫn các bot tìm kiếm nên hoặc không nên truy cập vào những khu vực nào trên website của bạn. Tuy nhiên, một cấu hình sai trong file này có thể vô tình chặn Googlebot thu thập dữ liệu từ các trang quan trọng, chẳng hạn như các tệp CSS hoặc JavaScript. Khi Googlebot không thể tải các tài nguyên này, nó sẽ không thể hiển thị trang một cách đầy đủ và có thể diễn giải rằng trang không có nội dung.

Những sai lầm phổ biến bao gồm việc sử dụng lệnh `Disallow: /` một cách không cần thiết hoặc chặn các thư mục chứa tài nguyên quan trọng. Điều này dẫn đến tình huống trớ trêu: Google biết URL tồn tại (ví dụ, thông qua sitemap hoặc liên kết nội bộ) và lập chỉ mục nó, nhưng khi cố gắng đọc nội dung, nó lại bị chặn lại. Kết quả là một trang được index nhưng trong mắt Google lại hoàn toàn trống rỗng.
Một nguyên nhân phổ biến khác là việc sử dụng thẻ noindex. Thẻ này là một chỉ thị trực tiếp gửi đến Google, yêu cầu không đưa nội dung của trang vào chỉ mục tìm kiếm. Khi Googlebot quét một trang và thấy thẻ ``, nó sẽ tuân thủ và loại bỏ nội dung trang đó khỏi cơ sở dữ liệu của mình. Tuy nhiên, URL của trang vẫn có thể được lập chỉ mục nếu nó được liên kết từ các trang khác.

Lỗi này thường xảy ra khi thẻ `noindex` được áp dụng nhầm lẫn trên toàn bộ website trong quá trình phát triển hoặc được thêm vào bởi một plugin SEO không được cấu hình đúng. Đôi khi, thẻ này cũng được gửi trong phản hồi header HTTP dưới dạng `X-Robots-Tag: noindex`. Dù bằng cách nào, kết quả vẫn là Google chỉ ghi nhận sự tồn tại của URL mà không lưu trữ nội dung, gây ra lỗi “không có nội dung” trong Search Console.
Sau khi đã xác định được các nguyên nhân chính, bước tiếp theo là kiểm tra và sửa chữa các cấu hình sai lệch. May mắn là Google cung cấp các công cụ hữu ích giúp quá trình này trở nên đơn giản hơn.
Để kiểm tra file robots.txt, bạn chỉ cần truy cập vào địa chỉ `tenmiencuaban.com/robots.txt`. Hãy xem xét kỹ các quy tắc `Disallow`. Nếu bạn thấy các dòng như `Disallow: /wp-content/themes/` hoặc `Disallow: /wp-includes/`, đây có thể là nguyên nhân gây ra sự cố, vì chúng ngăn Google tải các tài nguyên cần thiết để hiển thị trang của bạn một cách chính xác.

Công cụ tốt nhất để kiểm tra là Google Robots Testing Tool, có sẵn trong Google Search Console phiên bản cũ hoặc các công cụ bên ngoài. Bạn có thể nhập URL của trang bị lỗi và xem Googlebot có bị chặn hay không. Nếu phát hiện quy tắc chặn không hợp lệ, hãy chỉnh sửa file robots.txt của bạn, loại bỏ hoặc điều chỉnh các dòng `Disallow` gây cản trở và đảm bảo Googlebot có thể truy cập tự do vào các tài nguyên quan trọng.
Để kiểm tra thẻ `noindex`, hãy truy cập trang bị lỗi trên trình duyệt, nhấp chuột phải và chọn “Xem nguồn trang” (View Page Source). Sau đó, sử dụng tổ hợp phím Ctrl + F (hoặc Cmd + F trên Mac) và tìm kiếm từ khóa “noindex”. Nếu bạn thấy một dòng mã như ``, bạn đã tìm ra thủ phạm.

Nếu không tìm thấy thẻ meta trong HTML, bạn cần kiểm tra HTTP header. Sử dụng công cụ “Kiểm tra URL” (URL Inspection) trong Google Search Console. Nhập URL của bạn và xem kết quả. Công cụ sẽ cho bạn biết liệu việc lập chỉ mục có được cho phép hay không và lý do tại sao. Nếu phát hiện thẻ `noindex` được thêm vào bởi một plugin SEO, hãy vào phần cài đặt của plugin đó và bỏ tùy chọn “noindex” cho trang hoặc loại trang tương ứng. Đảm bảo rằng thẻ `noindex` chỉ được sử dụng cho các trang bạn thực sự không muốn xuất hiện trên Google, chẳng hạn như trang quản trị hoặc trang cảm ơn.
Việc khắc phục các lỗi kỹ thuật như robots.txt hay thẻ noindex là rất quan trọng, nhưng đó mới chỉ là một phần của câu chuyện. Để tránh lỗi “không có nội dung”, bạn cũng cần đảm bảo rằng nội dung của mình được cấu trúc và hiển thị một cách rõ ràng để Googlebot có thể dễ dàng đọc và hiểu.
Cấu trúc HTML của trang bạn nên rõ ràng và hợp lý. Nội dung chính cần được đặt trong các thẻ ngữ nghĩa như `
`, `

Hãy chắc chắn rằng phần nội dung quan trọng nhất của bạn có thể được nhìn thấy ngay trong mã HTML gốc mà không cần chạy bất kỳ script nào. Tránh các thiết kế yêu cầu người dùng phải nhấp vào nút “xem thêm” để tải nội dung chính. Một cấu trúc trang sạch sẽ, ưu tiên nội dung sẽ giúp Googlebot thu thập thông tin nhanh chóng và chính xác, giảm thiểu nguy cơ hiểu nhầm rằng trang của bạn không có nội dung. Để hiểu rõ hơn về cách xây dựng nội dung chuẩn, bạn có thể tham khảo bài viết Cách viết bài chuẩn SEO và SEO Onpage là gì.
Sitemap của bạn hoạt động như một bản đồ, chỉ dẫn cho Google biết những trang nào quan trọng trên website của bạn. Hãy đảm bảo rằng sitemap của bạn luôn được cập nhật và chỉ chứa các URL của những trang có nội dung chất lượng, có thể được lập chỉ mục. Đừng bao giờ đưa các trang đã bị chặn bởi robots.txt, các trang có thẻ `noindex` hoặc các trang chuyển hướng vào sitemap.

Bên cạnh đó, cấu trúc URL cũng đóng một vai trò quan trọng. Một URL ngắn gọn, mô tả và chứa từ khóa chính sẽ giúp cả người dùng và Google dễ dàng nhận diện chủ đề của trang. Ví dụ, một URL như `buimanhduc.com/sua-loi-trang-khong-noi-dung` sẽ tốt hơn nhiều so với `buimanhduc.com/?p=123`. Một hệ thống URL thân thiện kết hợp với sitemap sạch sẽ sẽ tạo điều kiện tốt nhất để Google lập chỉ mục nội dung của bạn một cách đầy đủ và chính xác.
Ngoài các nguyên nhân chính liên quan đến robots.txt và thẻ noindex, lỗi “không có nội dung” còn có thể xuất phát từ các xung đột phần mềm hoặc chất lượng nội dung không đảm bảo. Đây là những vấn đề tinh vi hơn nhưng cũng cần được giải quyết triệt để.
Trong hệ sinh thái WordPress, plugin là một phần không thể thiếu, nhưng đôi khi chúng lại là nguồn gốc của sự cố. Một plugin SEO, plugin bảo mật hoặc plugin tạo bộ nhớ đệm (cache) có thể vô tình can thiệp vào cách Googlebot truy cập trang của bạn. Chẳng hạn, một plugin có thể tự động thêm thẻ `noindex` vào một số loại bài đăng hoặc chặn bot truy cập vì nghi ngờ là hành vi độc hại.

Để xác định plugin gây lỗi, phương pháp hiệu quả nhất là vô hiệu hóa lần lượt từng plugin và sau đó sử dụng công cụ “Kiểm tra URL” của Google Search Console để xem sự cố đã được giải quyết chưa. Bằng cách này, bạn có thể tìm ra thủ phạm và tìm kiếm giải pháp thay thế hoặc điều chỉnh lại cài đặt của plugin đó. Hãy luôn kiểm tra kỹ lưỡng sau khi cài đặt một plugin mới có ảnh hưởng đến SEO hoặc bảo mật.
Đôi khi, vấn đề không nằm ở khía cạnh kỹ thuật mà ở chính nội dung của bạn. Nếu một trang có quá ít nội dung (thin content), ví dụ chỉ vài dòng văn bản hoặc một hình ảnh duy nhất, Google có thể đánh giá rằng trang đó không mang lại giá trị cho người dùng và coi nó là “trống”. Hiện tượng này thường xảy ra với các trang danh mục sản phẩm không có mô tả, các trang tag hoặc các bài viết sơ sài.

Ngoài ra, hãy cẩn thận với các kỹ thuật che giấu nội dung (cloaking), tức là hiển thị một phiên bản nội dung cho người dùng và một phiên bản khác cho Googlebot. Đây là một hành vi vi phạm nguyên tắc của Google. Để khắc phục, hãy đảm bảo mỗi trang bạn muốn lập chỉ mục đều cung cấp một lượng thông tin hữu ích, độc đáo và có chiều sâu. Hãy đầu tư vào việc viết mô tả chi tiết, bài viết chất lượng để chứng minh giá trị trang của bạn với cả người dùng và công cụ tìm kiếm. Bạn có thể tham khảo thêm bài viết Seo content là gì để làm rõ các nguyên tắc tạo nội dung chuẩn.
Để chủ động ngăn ngừa lỗi “Trang được lập chỉ mục nhưng không có nội dung” và duy trì một website khỏe mạnh, hãy tuân thủ các nguyên tắc tối ưu sau đây. Đây là những thói quen tốt giúp bạn xây dựng nền tảng SEO tổng thể vững chắc và tránh được những sai lầm phổ biến.
Lỗi “Trang được lập chỉ mục nhưng không có nội dung” trong Google Search Console, dù gây hoang mang, nhưng thường xuất phát từ những nguyên nhân kỹ thuật có thể xác định và khắc phục được. Các thủ phạm chính thường là cấu hình sai trong file robots.txt hoặc việc sử dụng thẻ `noindex` không đúng chỗ, vô tình ngăn cản Googlebot đọc và hiểu nội dung trên trang của bạn.

Bằng cách kiểm tra kỹ lưỡng file robots.txt, rà soát thẻ `noindex`, tối ưu hóa cấu trúc nội dung và đảm bảo chất lượng bài viết, bạn có thể giúp Google thu thập dữ liệu một cách hiệu quả. Việc này không chỉ giải quyết được thông báo lỗi mà còn trực tiếp cải thiện khả năng hiển thị và thứ hạng SEO của website. Hãy coi đây là một cơ hội để rà soát lại sức khỏe kỹ thuật cho trang web của mình.

Đừng để những lỗi kỹ thuật nhỏ âm thầm làm suy giảm hiệu quả SEO mà bạn đã dày công xây dựng. Hãy hành động ngay hôm nay! Áp dụng các hướng dẫn trong bài viết này, sử dụng các công cụ hỗ trợ từ Google để theo dõi và duy trì một website chuẩn SEO, mang lại trải nghiệm tốt nhất cho người dùng và đạt được thứ hạng cao trên trang kết quả tìm kiếm.