Sơ đồ trang web là gì? Nó là một phần quan trọng của tối ưu hóa kỹ thuật SEO cho bất kỳ trang web nào. Đây là vũ khí đắc lực giúp bạn SEO hiệu quả hơn. Vậy chính xác Sơ đồ trang web là gì? Làm cách nào để tạo Sơ đồ trang web cho một trang web?
Hãy cùng GTV SEO tìm hiểu qua bài viết này với hướng dẫn dưới đây nhé!
Sơ đồ trang web là gì?
Sơ đồ trang web (Website map) là một tệp liệt kê thông tin về các trang và tệp khác trên Website. Bản đồ này giúp các công cụ tìm kiếm tìm, thu thập dữ liệu và lập chỉ mục (index) nội dung trang Web của bạn.
Khái niệm Sitemap là gì?
Về cấu trúc: Có 2 loại Sitemap là XML (dành cho bot máy tìm kiếm) và HTML (hiển thị thông tin để người dùng truy cập dễ dàng trên web), và một số loại Sitemap khác. Bạn nên sử dụng cả hai Sơ đồ trang web này cho Công cụ Tìm kiếm và người dùng.
Ngoài ra, Sơ đồ trang web giúp công cụ tìm kiếm xác định các trang quan trọng trong bản đồ trang web của bạn. Từ đó, chức năng cho kết quả tìm kiếm thông minh hơn rất nhiều.
Tại sao Sơ đồ trang web lại quan trọng?
Các công cụ tìm kiếm như Google, Yahoo và Bing sử dụng Sơ đồ trang web để tìm các trang khác nhau trên trang web của bạn.
Sơ đồ trang web đóng một vai trò rất quan trọng
Như Google đã báo cáo:
“Nếu trang web của bạn được liên kết đúng cách, chức năng trình thu thập dữ liệu web của chúng tôi thường có thể khám phá hầu hết các trang trên trang web của bạn”
Nói cách khác: Bạn không cần Sơ đồ trang web. Nhưng nếu bạn làm như vậy, nó chắc chắn sẽ không ảnh hưởng đến nỗ lực SEO của bạn.
Tuy nhiên, cũng có nhiều trường hợp đặc biệt mà Sơ đồ trang web thực sự hữu ích.
Ví dụ, Google thường tìm các trang con thông qua các liên kết. Nếu site của bạn còn mới và chưa có nhiều backlink từ bên ngoài thì Sitemap sẽ góp phần rất lớn trong việc thúc đẩy quá trình tìm kiếm của Google và đưa site của bạn lên kết quả tìm kiếm.
Một ví dụ khác: Người dùng đang tìm kiếm thông tin liên quan đến hình ảnh, video nhưng công cụ của Google không tìm thấy trang của bạn do nội dung không rõ ràng?
Hoặc có thể bạn điều hành một trang web thương mại điện tử với 5 triệu trang con được lưu trữ trong trang web. Trừ khi bạn có liên kết nội bộ HOÀN HẢO và nhiều liên kết bên ngoài, Google sẽ gặp khó khăn trong việc tìm kiếm tất cả chúng. Đó là lúc chúng ta cần đến Sitemap.
Như vậy, Sitemap không có hại mà còn giúp quá trình SEO của bạn hiệu quả hơn. Vậy thì tại sao không sử dụng Sơ đồ trang web phải không?
Các loại Sitemap bạn cần biết
Có hai cách thường được sử dụng để phân biệt các loại Sơ đồ trang web khác nhau:
Sắp xếp theo cấu trúc
Theo cấu trúc, có hai loại Sơ đồ trang web: XML và HTML.
-
Sơ đồ trang web XML: được tạo để giúp các bot của công cụ tìm kiếm thu thập dữ liệu trang web của bạn một cách dễ dàng và nhanh chóng.
Ví dụ: XML Sitemap của gtvseo.com
-
HTML Sitemap: được tạo ra nhằm giúp người dùng dễ dàng tìm kiếm và truy cập các tài nguyên trên website nhờ sự thân thiện và tiện lợi trong thiết kế giao diện. Bạn có thể cải thiện xếp hạng trang web của mình bằng cách tối ưu hóa Trải nghiệm người dùng trên trang Sơ đồ trang web HTML.
Ví dụ: Sơ đồ trang web HTML của Trang web Apple
Vậy bạn nên sử dụng Sơ đồ trang web XML hay HTML? Câu hỏi này gây khá nhiều tranh cãi, nhưng câu trả lời chính xác là sử dụng cả hai. Vì SEO cần cân bằng giữa 2 bên: người dùng và bot của công cụ tìm kiếm. Vì vậy, sử dụng cả 2 loại Sitemap trên là cách tốt nhất bạn cần làm.
Sắp xếp theo định dạng
Theo định dạng thì Sitemap có 4 loại chính như sau:
-
Sơ đồ trang web hình ảnh: Sơ đồ trang web hình ảnh chứa thông tin liên quan đến hình ảnh được lưu trữ trên các trang web. Sử dụng Sơ đồ trang web này để tối ưu hóa khả năng trả về kết quả bằng hình ảnh của Google.
-
Video Sitemap: Đây là sơ đồ chứa thông tin chung, liên quan đến các video nằm trên website của bạn. Google sẽ cần loại Sitemap này để thu thập dữ liệu mà cách tổng hợp thông thường không đáp ứng được.
-
Sơ đồ trang web Tin tức: Sơ đồ trang web này cho phép bạn kiểm soát nội dung được gửi tới Google Tin tức. Bản đồ tin tức này sẽ giúp Google Tin tức tìm thấy nội dung mới trong trang web của bạn nhanh hơn.
-
Mobile Sitemap: Loại Sitemap này chỉ thực sự cần thiết khi website của bạn có các trang hiển thị trên thiết bị di động. Theo John Muller, ngay cả khi bạn tạo Sơ đồ trang web dành cho thiết bị di động, nó sẽ không giúp tăng điểm Thân thiện với thiết bị di động cho trang web của bạn.
Ngoài ra còn có các loại Site maps như Sitemap Index, Sitemap-category.xml, Sitemap-products.xml, Sitemap-articles.xml, Sitemap-tags.xml,..
Những trang web nào cần Sơ đồ trang web XML?
Trong tài liệu của google, gã khổng lồ này đã tiết lộ rằng XML Sitemap rất có lợi cho website:
-
Lớn hoặc rất lớn
-
Có một kho lưu trữ lớn
-
Chỉ có một vài liên kết bên ngoài
-
Sử dụng nội dung đa phương tiện phong phú: hình ảnh, video, v.v.
Trên thực tế, những loại trang web này chắc chắn sẽ được hưởng lợi rất nhiều từ Sơ đồ trang web XML. Nhưng điều đó không có nghĩa là các trang web khác sẽ không được hưởng lợi từ loại kế hoạch này.
Mọi trang web đều cần Google để dễ dàng hiển thị trên trang kết quả tìm kiếm. Thông qua Sơ đồ trang web, Google sẽ có thể tìm thấy các trang quan trọng và xem chúng được cập nhật lần cuối khi nào.
Vậy những trang nào cần sử dụng XML Sitemap?
Làm cách nào để bạn quyết định trang nào sẽ được đưa vào Sơ đồ trang web XML?
Hãy bắt đầu bằng cách suy nghĩ về mức độ liên quan của một URL cụ thể:
Khi khách truy cập vào URL này, nó có cung cấp cho bạn kết quả như mong muốn không? Bạn có muốn khách truy cập vào URL này không?
Nếu không, bạn có thể sẽ không muốn nó trong Sơ đồ trang web XML của mình. Một mẹo nhỏ ở đây, nếu bạn không muốn URL hiển thị trong kết quả tìm kiếm, hãy thêm thẻ 'noindex, follow'. Điều này sẽ ngăn Google lập chỉ mục URL đó.
Hướng dẫn cách tạo Sitemap cho website
Trang web của bạn đang sử dụng WordPress hay không sử dụng WordPress? Để tránh mất thời gian, hãy chọn cho mình nội dung hướng dẫn phù hợp nhất dưới đây:
-
Sơ đồ trang web cho trang web WordPress
-
Với YoastSEO
-
Sơ đồ trang web Google XML
-
-
Tạo Sơ đồ trang web trực tuyến tại XML-Sitemaps.com cho các trang web không phải WordPress
-
Cách xem Sitemap của website sau khi tạo
Tạo Sitemap cho website WordPress
Trường hợp: Nếu bạn đã có tài khoản WordPress, bạn có thể sử dụng WordPress để tạo Sơ đồ trang web.
Bạn có thể chọn các plugin như Sơ đồ trang web Google XML hoặc các plugin bên ngoài như Yoast SEO hoặc bất kỳ plugin nào bạn cảm thấy có chức năng và dễ sử dụng.
Cần chuẩn bị những gì?
Đầu tiên, bạn cần truy cập vào trang quản trị WordPress:
Tiến hành đăng nhập vào WordPress, gõ tên miền và thêm /wp-admin.
Ví dụ website WordPress của bạn là xyz.com thì bạn cần truy cập quản trị theo URL: xyz.com/wp-admin.
Sau khi truy cập, bạn cần đăng nhập bằng tên tài khoản và mật khẩu.
Tạo sơ đồ trang web với Yoast SEO
Quá trình tạo sơ đồ trang web với Yoast rất dễ thực hiện. Bạn chỉ cần làm theo các bước tôi hướng dẫn dưới đây.
Hãy bắt đầu với việc quyết định trang web sẽ lập chỉ mục sơ đồ trang web nào. Sau đó là xem lại từng nội dung.
Bước 1: Đăng nhập vào trang web WordPress của bạn và mở sơ đồ trang web XML trong một tab khác.
Bước 2: Bắt đầu cài đặt Yoast tại Content Types. Trong menu bên trái của trang web WordPress của bạn, hãy di chuột qua plugin Yoast SEO, sau đó nhấp vào Giao diện tìm kiếm.
Lưu ý: menu thả xuống trên tab Loại Nội dung, Phân loại và Tab Lưu trữ. Mỗi menu mở ra một bảng điều khiển để giúp bạn tối ưu hóa nội dung cụ thể xuất hiện trong kết quả tìm kiếm.
Bắt đầu cài đặt Yoast
Mỗi trình đơn thả xuống cũng bao gồm một nút chuyển đổi cho phép thêm hoặc xóa nội dung khỏi sơ đồ trang web XML. Yoast sẽ hỏi một câu hỏi đơn giản: “Hiển thị (sơ đồ trang web riêng lẻ) trong kết quả tìm kiếm?”
Thêm hoặc xóa một phần nội dung khỏi sơ đồ trang web XML
Bước 3: Ở bước này chúng ta sẽ thực hiện với tab Taxonomy và Archives trong giao diện Search của plugin Yoast SEO.
Tại đây bạn có thể hiển thị Danh mục và Thẻ. Tiếp theo, tối ưu hóa các đơn vị phân loại để chúng có giá trị hơn đối với các công cụ tìm kiếm.
Bước 4: Tùy chỉnh sitemap. Mở Chỉ mục sơ đồ trang web XML. Nhấp vào sơ đồ trang web để mở một tab mới.
Mục tiêu: là đánh giá các trang trong mỗi Sơ đồ trang web. Đi qua từng sơ đồ trang web, từng URL và bạn nên tự hỏi liệu mỗi phần nội dung có mang lại lợi ích cho người dùng hay không.
Nếu bạn thấy các trang như /hello-world hoặc /testing-123, chúng có thể có giá trị thấp đối với công cụ tìm kiếm, hãy mở từng trang trong tab mới để đánh giá cấp độ trang. Nếu chúng không chứa nội dung có giá trị cho người dùng, bạn nên loại trừ các trang đó khỏi sơ đồ trang web.
Để loại trừ các URL riêng lẻ khỏi sơ đồ trang web XML, hãy nhấp vào “Chỉnh sửa trang” ở đầu mỗi trang hoặc bài đăng mà bạn muốn loại trừ.
Trong trình chỉnh sửa trang, cuộn xuống Metabox Yoast SEO. Nhấp vào biểu tượng bánh răng “Cài đặt nâng cao” và đặt “Cho phép công cụ tìm kiếm hiển thị Trang này trong kết quả tìm kiếm?” thành "Không".
Bạn vẫn có thể cho phép các công cụ tìm kiếm theo các liên kết trên trang đó – ngay cả khi nó bị ẩn – bằng cách đặt “Các công cụ tìm kiếm có nên theo các liên kết trên Trang này không?” đặt thành “Có“.
Đặt giá trị này thành “Có” khi bạn không muốn trình thu thập thông tin đi theo các liên kết trực tiếp trên trang.
Cuối cùng, nhấp vào “Cập nhật” ở góc trên cùng bên phải của trang để lưu các cài đặt này. Lặp lại quy trình này cho từng trang web mà bạn muốn loại trừ khỏi mỗi Sơ đồ trang web.
Tạo Sơ đồ trang web với Sơ đồ trang web Google XML
Trong trường hợp bạn không sử dụng hoặc không muốn sử dụng Yoast SEO để tạo Sơ đồ trang web thì Plugin Google XML Sitemaps là giải pháp thay thế tốt nhất mà bạn cần cân nhắc.
Bước 1: Cài đặt và kích hoạt Plugin Google XML Sitemaps
Ngay sau khi kích hoạt, plugin này sẽ tự động tạo Sơ đồ trang web XML cho trang web của bạn. Bạn có thể xem Sơ đồ trang web của mình bằng cách thêm sitemap.xml vào cuối địa chỉ trang web.
Ví dụ: https://www.example.com/sitemap.xml
Kiểm tra sơ đồ trang web
Bước 2: Cài đặt cấu hình của plugin.
Plugin này hoạt động tốt cho hầu hết các blog và trang web. Tuy nhiên, bạn vẫn cần xem lại các cài đặt để tinh chỉnh các thông số cho phù hợp với chiến lược SEO của mình và đảm bảo rằng bạn không bỏ sót điều gì.
Chỉ cần đi tới Cài đặt »Sơ đồ trang web XML để đặt lại cấu hình của plugin.
Vào Settings » XML-Sitemap để thiết lập lại cấu hình
Ở đầu hình, Sơ đồ trang web Google XML sẽ hiển thị cho bạn một đoạn cập nhật trạng thái. Plugin này sẽ thông báo cho bạn trong trường hợp nó không thể ping Sơ đồ trang web của bạn tới một công cụ tìm kiếm nhất định.
Nếu cảm thấy phiền phức, bạn có thể tắt tính năng thông báo trong phần cài đặt chung. Điều này làm tăng giới hạn bộ nhớ PHP và hơn thế nữa.
Tiếp theo, bạn sẽ thấy phần Trang bổ sung. Tại đây, bạn có thể thêm trang vào Sơ đồ trang web XML theo cách thủ công. Điều này hữu ích nếu trang web của bạn chứa các trang HTML tĩnh.
Thêm trang vào Sơ đồ trang web XML
Sau đó, bạn có thể tùy chỉnh mức độ ưu tiên cho các URL của bài đăng. Sơ đồ trang web Google XML sẽ sử dụng số nhận xét theo mặc định để tính mức độ ưu tiên của URL.
Tùy chỉnh mức độ ưu tiên cho URL bài viết
Hai phần tiếp theo của trình cài đặt plugin sẽ cho phép bạn bao gồm hoặc loại trừ một số trang không mong muốn khỏi Sơ đồ trang web WordPress. Ví dụ: nếu bạn đang điều hành một trang web thương mại điện tử, thì chắc chắn bạn sẽ phải đưa các trang sản phẩm vào Sơ đồ trang web của mình.
Chọn bao gồm hoặc loại trừ một số trang không mong muốn khỏi Sơ đồ trang web WordPress.
Sau đó, bạn có thể điều chỉnh tần suất (Frequency) và mức độ ưu tiên (Priority) của Nội dung sơ đồ trang web. Việc thay đổi các giá trị này được coi là một gợi ý của các công cụ tìm kiếm. Các bot công cụ tìm kiếm có thể chọn xem xét hoặc bỏ qua các giá trị này dựa trên tiêu chí của riêng chúng.
Điều chỉnh tần suất (Frequency) và mức độ ưu tiên (Priority) của Nội dung Sơ đồ trang web
Cuối cùng, đừng quên nhấp vào nút Tùy chọn cập nhật để lưu các thay đổi của bạn.
Tạo Sơ đồ trang web trực tuyến tại XML-Sitemaps.com
Trường hợp: Không sử dụng WordPress?
Đừng lo. Nếu không sử dụng WordPress, bạn hoàn toàn có thể tạo Sơ đồ trang web trực tuyến thông qua công cụ XML-Sitemaps.com. Nó sẽ tạo một tệp XML mà bạn có thể áp dụng cho Sơ đồ trang web của mình.
Tạo Sơ đồ trang web bằng công cụ XML-Sitemaps.com
Bạn chỉ cần làm theo 5 bước đơn giản như sau:
Bước 1: Bấm vào liên kết: http://www.xml-sitemaps.com/
Bước 2: Điền các thông số cần thiết.
Các thông tin bạn cần điền như sau:
-
URL bắt đầu: Nhập địa chỉ trang web của bạn vào
-
Tần suất thay đổi: Nên chọn là hằng ngày (có thể chọn thông số phù hợp)
-
Sửa đổi lần cuối: Nên chọn Sử dụng Phản hồi của Máy chủ
-
Mức độ ưu tiên: Nên tự động (Ưu tiên được tính toán tự động)
Khi bạn hoàn thành tất cả các thông tin, hãy nhấp vào lệnh Bắt đầu và chờ đợi. Khi hoàn tất, bạn sẽ nhận được danh sách các tệp Sơ đồ trang web (các nội dung cần chú ý: sitemap.xml, ror.xml, sitemap.html và urllist.txt)
Bước 3: Tải xuống tệp XML.
Dùng Notepad++ mở file sitemap.xml thiết lập thông số Priority cho các url theo ý muốn của bạn.
Lưu ý: Thông số Priority quy định mức độ quan trọng của các url đối với website, nếu url nào quan trọng thì nên cho điểm cao hơn, cao nhất là 1.0 và thấp nhất là 0.10
Bước 4: Upload file XML lên website.
Bước 5: Vào Công cụ SEO của Google Webmaster Tools để cập nhật Sitemap.
Cách xem Sitemap của website sau khi tạo
Sau khi bạn đã tạo Sơ đồ trang web, bạn có thể tiến hành xem Sơ đồ trang web của trang web của mình theo cách thủ công.
Xem Sitemap sau khi tạo
(Sơ đồ trang web thường được đặt tại site.com/Sitemap.xml. Nhưng đôi khi nó phụ thuộc vào CMS và loại chương trình bạn sử dụng để tạo Sơ đồ trang web.)
Sơ đồ trang web sẽ hiển thị tất cả các URL của các trang trên trang web của bạn.
Sơ đồ trang web sẽ hiển thị tất cả các URL
13 Mẹo tối ưu sitemap website đẩy SEO trong 20s
Mẹo tối ưu hóa sơ đồ trang web
Tạo Sơ đồ trang web là một phần quan trọng trong việc tối ưu hóa bất kỳ trang web nào.
Như đã đề cập ở các phần trước, Sơ đồ trang web đặc biệt quan trọng đối với các trang web có nội dung lưu trữ không được liên kết với nhau, thiếu liên kết bên ngoài và chứa nhiều trang con (hàng trăm, thậm chí hàng nghìn trang).
Sơ đồ trang web không chỉ cung cấp cho các công cụ tìm kiếm thông tin chi tiết về cách trang web của bạn được bố trí mà còn có thể bao gồm các dữ liệu có giá trị như:
-
Tần suất cập nhật trang
-
Khi trang được thay đổi
-
Tầm quan trọng của mỗi trang và mối quan hệ giữa các trang
Vậy làm sao để tối ưu Sitemap? Hãy cùng tìm hiểu 13 Mẹo tối ưu Sitemap website để đẩy mạnh SEO dưới đây:
1. Sử dụng công cụ plugin để tạo Sitemap tự động
Tạo sơ đồ trang web thật dễ dàng khi bạn có các công cụ phù hợp. Như đã nói ở phần tạo Sitemap, chúng ta có thể sử dụng các phần mềm hoặc plugin như Google XML Sitemaps, Yoast SEO để tạo Sitemap nhanh chóng.
Ngoài ra, bạn có thể tạo sơ đồ trang web theo cách thủ công bằng cách làm theo cấu trúc mã XML của Sơ đồ trang web. Trên thực tế, Sơ đồ trang web của bạn không cần ở định dạng XML. Bạn có thể sử dụng file văn bản bình thường và chia nhỏ từng dòng URL là đủ.
Tuy nhiên, bạn vẫn cần tạo Sơ đồ trang web XML hoàn chỉnh nếu muốn triển khai thuộc tính hreflang. Nghe khá rắc rối phải không?
Vì vậy, nếu bạn là người mới, hãy sử dụng trình tạo Sơ đồ trang web tự động để thực hiện các tác vụ này. Điều này sẽ giúp bạn tiết kiệm rất nhiều thời gian và công sức.
Bạn có thể truy cập liên kết này để biết thêm thông tin về cách thiết lập Sơ đồ trang web theo cách thủ công.
2. Khai báo Sitemap của bạn với Google
Cũng giống như Submit URL, Sitemap có thể được khai báo với Google thông qua Google Search Console. Từ giao diện chính, bạn chọn Crawl > Sitemaps > Add Test Sitemap
Hãy nhớ kiểm tra Sơ đồ trang web của bạn và xem kết quả trước khi bạn nhấp vào nút Gửi Sơ đồ trang web. Mục đích của việc này là để kiểm tra các lỗi có thể xảy ra. Chúng sẽ ảnh hưởng đến việc lập chỉ mục các trang đích của Google.
Thông thường, tất cả người dùng đều muốn các trang đã gửi của họ được lập chỉ mục. Tuy nhiên, không phải tất cả sẽ được Google chấp thuận.
Gửi Sơ đồ trang web cho Google biết trang nào bạn cho là có chất lượng cao và xứng đáng được lập chỉ mục. Nhưng điều đó không đảm bảo rằng chúng sẽ được Google lập chỉ mục.
Thay vào đó, lợi ích của việc gửi sơ đồ trang web của bạn là:
-
Giúp Google hiểu cách trình bày trang web của bạn.
-
Phát hiện các lỗi bạn có thể sửa để đảm bảo các trang của bạn được lập chỉ mục chính xác.
3. Ưu tiên các trang chất lượng cao trong Sơ đồ trang web
Chất lượng trang web là một yếu tố quan trọng. Nó ảnh hưởng trực tiếp đến thứ hạng của kết quả tìm kiếm Google. Do đó, nếu Sitemap của bạn có quá nhiều trang chất lượng không ổn định sẽ ảnh hưởng đến toàn bộ website.
Từ đó, các công cụ tìm kiếm sẽ đánh giá website của bạn là kém chất lượng. Do đó, hãy cố gắng hướng bot đến các trang quan trọng nhất của trang web. Các trang này phải có các đặc điểm sau:
-
Tối ưu hóa cao
-
Chứa hình ảnh hoặc video
-
Có nội dung chuyên biệt
-
Thu hút người dùng thông qua: nhận xét hoặc đánh giá (review)
4. Các vấn đề về lập chỉ mục
Như đã đề cập ở phần trước, google không lập chỉ mục tất cả các trang mà bạn đặt trong Sơ đồ trang web. Trước đây, Google Search Console thậm chí không thông báo cho bạn về các trang có vấn đề về lập chỉ mục.
Ví dụ: nếu bạn gửi 20.000 trang và chỉ 15.000 trang trong số đó được lập chỉ mục, bạn sẽ không được cho biết 5.000 "trang có vấn đề" là gì và vấn đề là gì.
Khi đó, các nhà quản lý phải chia các trang này thành các Sơ đồ trang web khác nhau để thử nghiệm. Sau đó loại bỏ các URL không được lập chỉ mục để trang web của bạn được Google đánh giá cao.
Tuy nhiên, đó chỉ là quá khứ, giờ đây Google Search Console đã cập nhật Index Coverage của mình. Các URL lỗi sẽ được Google liệt kê.
5. Đặt phiên bản chính tắc của URL trong Sơ đồ trang web
Nếu website của bạn có nhiều trang rất giống nhau, chẳng hạn như các trang sản phẩm khác màu (trong 1 sản phẩm). Bạn có thể sử dụng thẻ 'link rel=canonical' để cho Google biết trang nào là trang 'chính'.
Khi bạn đặt phiên bản chuẩn vào Sơ đồ trang web của mình, bạn sẽ giúp các bot tìm thấy trang chính dễ dàng hơn. Từ đó Google có thể thu thập dữ liệu và lập chỉ mục nhanh hơn.
6. Sử dụng thẻ Robots Meta thay vì Robots.txt
Như đã đề cập ở trên, nếu bạn muốn xóa một trang khỏi danh sách lập chỉ mục, bạn có quyền sử dụng thẻ 'noindex,follow'. Thẻ này còn được gọi là meta robot
Đặt thẻ sẽ ngăn URL rơi vào chỉ mục. Nhưng vẫn bảo toàn giá trị liên kết. Điều này đặc biệt hữu ích cho các trang tiện ích của trang web: quan trọng, nhưng không nên hiển thị trong kết quả tìm kiếm.
Bạn chỉ nên sử dụng robots.txt khi muốn chặn một số trang không quan trọng để giảm thiểu thiệt hại khi hết ngân sách.
Trong các trường hợp khác, khi bạn thấy rằng Google đang thu thập lại dữ liệu và lập chỉ mục các trang tương đối không quan trọng (ví dụ: các trang sản phẩm riêng lẻ) thay cho các trang chính, bạn có thể nghĩ đến việc sử dụng robots.txt.
7. Không bao gồm URL 'noindex' trong Sơ đồ trang web
Một khi bạn không muốn bot thu thập dữ liệu và lập chỉ mục một URL nào đó, thì tốt nhất bạn nên xóa URL đó khỏi Sơ đồ trang web.
Đặt các trang không quan trọng ở cùng một vị trí với các trang quan trọng cho thấy sự không nhất quán.
Vui lòng chỉ đặt các URL mà bạn muốn lập chỉ mục vào Sơ đồ trang web.
8. Tạo Sơ đồ trang web XML động cho các trang web lớn
Hoàn toàn không thể kiểm soát từng URL trong Sitemap của các website lớn. Thay vào đó, bạn nên thiết lập các quy tắc để xác định khi nào một trang nên được đưa vào Sơ đồ trang web XML hoặc thay đổi từ 'noindex' thành "index, follow".
Bạn có thể tìm thấy một công cụ phù hợp để nhanh chóng tạo Sơ đồ trang web XML động.
9. Sử dụng Sơ đồ trang web XML và Nguồn cấp dữ liệu RSS/Atom
Nguồn cấp dữ liệu RSS/Atom là một biểu mẫu XML tạo kênh tóm tắt.
RSS có vai trò thông báo cho các công cụ tìm kiếm mỗi khi trang web của bạn cập nhật hoặc có nội dung mới. Từ đó, Google hoặc Bing sẽ luôn giữ những thông tin mới nhất từ trang web của bạn.
Google khuyên bạn nên sử dụng cả Sơ đồ trang web và Nguồn cấp dữ liệu RSS/Atom để giúp các công cụ tìm kiếm hiểu trang nào sẽ được lập chỉ mục và cập nhật.
Bằng cách chỉ bao gồm nội dung cập nhật nhất trong Nguồn cấp dữ liệu RSS/Atom của bạn, bạn sẽ giúp việc tìm kiếm nội dung mới dễ dàng hơn rất nhiều cho cả công cụ tìm kiếm và khách truy cập.
10. Chỉ cập nhật thời gian sửa đổi khi có thay đổi quan trọng
Đừng cố đánh lừa các bot lập chỉ mục lại các trang bằng chức năng cập nhật thời gian sửa đổi mà không thực sự thực hiện bất kỳ thay đổi đáng kể nào.
Google có thể xóa hoàn toàn ngày xuất bản của bạn nếu họ phát hiện thấy các trang trong trang web của bạn liên tục được cập nhật mà không có bất kỳ giá trị gia tăng mới nào.
Vì vậy, chỉ cập nhật thời gian sửa đổi khi bạn thực sự thay đổi các trang này.
11. Đừng quá lo lắng về cài đặt ưu tiên
Một số Sơ đồ trang web sẽ có cột Ưu tiên. Chúng có chức năng báo cho bot biết trang nào là quan trọng nhất. Tuy nhiên, chức năng của tính năng này vẫn chưa được xác nhận
Trên thực tế, một số người dùng đã đăng trên Twitter rằng bot của Google đã bỏ qua những 'ưu tiên' này khi thu thập dữ liệu.
Đặt ưu tiên thu thập dữ liệu
12. Giữ kích thước tệp càng nhỏ càng tốt
Kích thước Sơ đồ trang web càng nhỏ thì áp lực lên máy chủ sẽ càng ít.
Mặc dù Google và Bing đều tăng kích thước tệp sơ đồ trang web tối đa cho các trang web từ 10MB lên 50MB vào năm 2016. Nhưng bạn vẫn nên giữ Sơ đồ trang web của mình gọn gàng nhất có thể để ưu tiên các trang đích chính của mình.
13. Tạo nhiều Sơ đồ trang web nếu trang web của bạn chứa hơn 50.000 URL
Mỗi Sơ đồ trang web chỉ có thể chứa tối đa 50.000 URL.
Con số này là quá đủ cho hầu hết các trang web ở Việt Nam. Tuy nhiên, nếu trang web của bạn có nhiều URL hơn con số này, đừng lo lắng. Bạn hoàn toàn có thể tạo các Sitemap khác nhau để chứa các URL này.
Case study của GTV về Sitemap
Cũng không quá nghiêm trọng, khi website của khách hàng của tôi bị lỗi Sơ đồ trang do xung đột giữa Plugin Yoast SEO và các Plugin tạo Sơ đồ trang khác.
Và bạn biết đấy, lỗi sơ đồ trang web sẽ không ảnh hưởng đến bạn quá nhanh để bạn nhận thấy, nhưng chúng sẽ dần dần. Khoảng thời gian xung đột được tôi xác định là tháng 1, nhưng đến tháng 4 thì website bắt đầu "từ từ tụt dốc" và tốc độ tăng trưởng khá chậm. Lúc đó mình nghĩ thuật toán Google Update nên không check kỹ Sitemap.
Mãi đến đầu tháng 7 mình audit tổng thể website (3 tháng GTV sẽ audit tổng thể dự án 1 lần) và phát hiện ra lỗi về Sitemap này.
Khi đó, tôi đã nhắn tin cho nhóm mã để khắc phục xung đột và gửi lại Sơ đồ trang web. Tình hình đã thay đổi khi lượng truy cập và top đầu tăng trở lại (mặc dù không quá nhanh).
Lỗi sơ đồ trang web là một trong nhiều lỗi SEO kỹ thuật (Technical SEO error) nên mức độ ảnh hưởng của nó không quá nhiều. Tuy nhiên nếu bạn tạo và Submit Sitemap không cẩn thận thì rất có thể đây chính là vấn đề khiến website của bạn không thể phát triển vượt bậc.
Dưới đây là hình ảnh website đang tăng trưởng về lượng truy cập cũng như top dự án:
Hình ảnh tăng trưởng khi gửi Sơ đồ trang web để đo lường trên Google Analytics
Tiếp theo là Google Search Console
Bạn thấy đấy, lỗi sitemap khiến website bị tụt hạng rất mạnh vào đầu tháng 5 – bản cập nhật cốt lõi của Google. Trang web hiện đã ổn định và phát triển trở lại.
Kết luận
Sitemap là một công cụ mang lại nhiều lợi ích và chức năng đáng kể cho quá trình SEO. Nó hỗ trợ bot, giúp Google tìm kiếm bài viết trên website của bạn một cách dễ dàng và nhanh chóng. Từ đó tối ưu hóa khả năng hiển thị của website trên SERPs.
Đây là công cụ hỗ trợ đắc lực cho việc cải thiện khả năng hiển thị của website. Hi vọng bài viết với hướng dẫn sơ đồ trang web là gì này sẽ giúp bạn hiểu rõ hơn về sơ đồ trang web là gì và cách sử dụng chúng. Chúc may mắn!