SEO – Search Engine Optimization hay còn được gọi với cái tên mộc mạc Việt Nam là Tối ưu hóa bộ máy tìm kiếm. Nhưng liệu có phải như vậy? Không, bộ máy hay công cụ tìm kiếm là thứ bạn không thể can thiệp vào, vậy thì chúng ta tối ưu cái gì? Thứ chúng ta cần tối ưu chính là website, biến một mớ tùm lum trở nên “chuẩn” chính là nhiệm vụ của chúng ta. Nhưng thế nào là “chuẩn”? Đó chính là lý do ta cần tìm hiểu về phương thức hoạt động của bộ máy tìm kiếm (mình sẽ thay bằng từ Google bắt đầu từ đây bởi vì công cụ tìm kiếm chính mà chúng ta sử dụng vào thời điểm này vẫn là Google). Hiểu được Google hoạt động như thế nào thì chúng ta mới có thể “chuẩn hóa” website và giúp nó đạt thứ hạng cao trong mắt Google, tức là trong kết quả tìm kiếm.
Các thành phần chính của Google
- Công cụ thu thập dữ liệu: Bot, Spider, Crawler.
- Bộ phận phân tích, đánh chỉ mục.
- Bộ phận xử lý truy vấn tìm kiếm.
Cách hoạt động của Google Bot
Các thành phần chính của Google
- Công cụ thu thập dữ liệu: Bot, Spider, Crawler.
- Bộ phận phân tích, đánh chỉ mục.
- Bộ phận xử lý truy vấn tìm kiếm.
Cách hoạt động của Google Bot
Google bot, spider, crawler đều là một. Về cơ bản, chúng là một phần mềm duyệt web tự động dựa trên các liên kết. Các bạn có thể hiểu thế này. Mạng internet là mạng nhện với liên kết là những đường tơ chạy từ điểm này sang điểm khác. Mỗi điểm đó chính là một website. Vì vậy mà Google bot còn có tên gọi là Spider – Nhện chính vì chúng bò theo những đường tơ – liên kết để đi tới các điểm - website khác nhau. Ngoài ra trong mỗi website lại là một mạng lưới các trang nhỏ hơn với các liên kết nội bộ nên cách thức hoạt động của Google bot ở đây cũng hoàn toàn tương tự.
Hãy luôn nhớ rằng: Không có liên kết thì Google bot sẽ không thể hoạt động.
Cơ chế hoạt động cụ thể:
Xuất phát điểm tại server của Google, Bot sẽ lấy ra danh sách các máy chủ cũng như trang web phổ biến. Khi đi tới một website nào đó, Bot sẽ bắt đầu tải dữ liệu về cho máy chủ và lấy ra những liên kết trên website đó. Bot sẽ lại tiếp tục lần theo các liên kết và câu chuyện của chúng ta lại trở về điểm ban đầu. Đi, đọc, gửi về máy chủ, lấy liên kết, đi tiếp, đọc...
Cách hoạt động của bộ phận lập chỉ mục
Hãy luôn nhớ rằng: Không có liên kết thì Google bot sẽ không thể hoạt động.
Cơ chế hoạt động cụ thể:
Xuất phát điểm tại server của Google, Bot sẽ lấy ra danh sách các máy chủ cũng như trang web phổ biến. Khi đi tới một website nào đó, Bot sẽ bắt đầu tải dữ liệu về cho máy chủ và lấy ra những liên kết trên website đó. Bot sẽ lại tiếp tục lần theo các liên kết và câu chuyện của chúng ta lại trở về điểm ban đầu. Đi, đọc, gửi về máy chủ, lấy liên kết, đi tiếp, đọc...
Cách hoạt động của bộ phận lập chỉ mục
Dựa theo cách mà Spider hoạt động, sẽ có hàng tỉ trang web được gửi về cơ sở dữ liệu của Google. Thực sự là một lượng dữ liệu cực kì khổng lồ được lưu trữ trên hàng ngàn máy chủ. Từ đó, Google xây dựng nên một hệ thống chỉ mục cực kì chi tiết khiến cho việc sắp xếp các website trở nên đơn giản hơn, kể cả là khi phục vụ cho việc tìm kiếm.
Việc sắp xếp dựa trên các từ xuất hiện trong Tiêu đề, mô tả, nội dung của trang... mà Google cho là nội dung chính có thể phục vụ cho việc tìm kiếm của người dùng.
Ví dụ như website của bạn bán đồng hồ thì Google sẽ lưu nó trong thư mục Thương mại->Đồng hồ chứ không phải bên thư mục Giải trí – Ca sĩ. Đó chỉ là ví dụ minh họa, còn hệ thống chỉ mục của Google chắc chắn sẽ chi tiết đến mức chúng ta khó lòng tưởng tượng nổi.
Cách hoạt động của bộ phận xử lý truy vấn tìm kiếm
Việc sắp xếp dựa trên các từ xuất hiện trong Tiêu đề, mô tả, nội dung của trang... mà Google cho là nội dung chính có thể phục vụ cho việc tìm kiếm của người dùng.
Ví dụ như website của bạn bán đồng hồ thì Google sẽ lưu nó trong thư mục Thương mại->Đồng hồ chứ không phải bên thư mục Giải trí – Ca sĩ. Đó chỉ là ví dụ minh họa, còn hệ thống chỉ mục của Google chắc chắn sẽ chi tiết đến mức chúng ta khó lòng tưởng tượng nổi.
Cách hoạt động của bộ phận xử lý truy vấn tìm kiếm
Hãy nhớ một điều: Khi bạn thực hiện việc tìm kiếm trên Google, Google không tìm kiếm trên mạng Internet, nó thực hiện tìm kiếm trên chính kho dữ liệu mà chúng ta vừa nhắc tới ở phía trên. Chỉ có như vậy mới có thể đảm bảo được tốc độ tối ưu của việc tìm kiếm, hàng triệu kết quả trong một phần giây.
Nhưng làm sao để Google lấy ra được dữ liệu chính xác mà chúng ta cần?
Đầu tiên Google lấy ra những trang web được sắp xếp trong chỉ mục tương ứng với từ khóa tìm kiếm. Sau đó, một bộ lọc sẽ hoạt động để loại bỏ những website kém chất lượng, spam từ khóa.... Sau khi có một bộ các website tiêu chuẩn, Google tiếp tục việc sắp xếp chúng vào một danh sách được đánh số thứ tự dựa trên hai tiêu chí: Thứ hạng (Page Rank) và độ liên quan.
Về độ liên quan thì có lẽ mình sẽ không cần phân tích sâu hơn nữa nhỉ. Vậy PageRank là gì? Theo Google, PageRank là một chỉ số dành để xác định độ uy tín của website dựa trên các liên kết mà các website khác liên kết với nó. Có thê hiểu như mỗi liên kết từ website khác sẽ như một phiếu bầu vậy, Google dựa vào các phiếu bầu đó mà đánh giá độ uy tín của một trang web.
Ở trên là tổng quát về quá trình hoạt động của Google, từ lúc lấy dữ liệu cho đến lúc hiển thị ra cho người dùng ở dạng kết quả tìm kiếm.
Vậy nhiệm vụ của SEOer, của chúng ta là ở đâu? Cụ thể hơn là đối với quá trình Onpage, đó là tinh chỉnh, tối ưu website để giúp Google đánh giá website của chúng ta tốt hơn so với những website khác trong quá trình đưa ra kết quả tìm kiếm.
Các bạn có thể xem qua bài viết: Hướng dẫn tổng quan seo onpage để biết rõ về những thứ chúng ta sẽ thực hiện trong quá trình Onpage nhằm gây tác động tới kết quả tìm kiếm của Google.
Nhưng làm sao để Google lấy ra được dữ liệu chính xác mà chúng ta cần?
Đầu tiên Google lấy ra những trang web được sắp xếp trong chỉ mục tương ứng với từ khóa tìm kiếm. Sau đó, một bộ lọc sẽ hoạt động để loại bỏ những website kém chất lượng, spam từ khóa.... Sau khi có một bộ các website tiêu chuẩn, Google tiếp tục việc sắp xếp chúng vào một danh sách được đánh số thứ tự dựa trên hai tiêu chí: Thứ hạng (Page Rank) và độ liên quan.
Về độ liên quan thì có lẽ mình sẽ không cần phân tích sâu hơn nữa nhỉ. Vậy PageRank là gì? Theo Google, PageRank là một chỉ số dành để xác định độ uy tín của website dựa trên các liên kết mà các website khác liên kết với nó. Có thê hiểu như mỗi liên kết từ website khác sẽ như một phiếu bầu vậy, Google dựa vào các phiếu bầu đó mà đánh giá độ uy tín của một trang web.
Ở trên là tổng quát về quá trình hoạt động của Google, từ lúc lấy dữ liệu cho đến lúc hiển thị ra cho người dùng ở dạng kết quả tìm kiếm.
Vậy nhiệm vụ của SEOer, của chúng ta là ở đâu? Cụ thể hơn là đối với quá trình Onpage, đó là tinh chỉnh, tối ưu website để giúp Google đánh giá website của chúng ta tốt hơn so với những website khác trong quá trình đưa ra kết quả tìm kiếm.
Các bạn có thể xem qua bài viết: Hướng dẫn tổng quan seo onpage để biết rõ về những thứ chúng ta sẽ thực hiện trong quá trình Onpage nhằm gây tác động tới kết quả tìm kiếm của Google.