Cách công cụ tìm kiếm hoạt động: thu thập thông tin, lập chỉ mục và xếp hạng

Công cụ tìm kiếm Google? Ở Chương 1 chúng tôi đã đề cập công cụ tìm kiếm như một bộ bách khoa toàn thư. Chúng được tạo ra để khám phá, hiểu và tổ chức nội dung của internet. Nhằm cung cấp các kết quả phù hợp cho các câu hỏi mà người tìm kiếm truy vấn. Để hiển thị trong kết quả tìm kiếm, trước tiên nội dung của bạn phải được thu thập thông tin. Đây là một phần quan trọng của câu đó SEO: Nếu website của bạn không được tìm thấy, bạn sẽ không bao giờ xuất hiện trong SERPs.

Nhiều người thắc mắc về tầm quan trọng của các công cụ tìm kiếm. Ở Việt Nam, hầu hết mọi người đều biết nhiều về công cụ Google nhiều hơn. Số ít mọi người còn lại biết về Bing hay Yahoo. Thực tế trên thế giới có hơn 30 công cụ tìm kiếm lớn. Nhưng cộng đồng SEO thường chú ý nhiều tới đến Google. Tại sao lại vậy? Trả lời cho câu hỏi đó: Google là nơi đại đa số mọi người sử dụng tìm kiếm. Người dùng có thể tìm kiếm hình ảnh, Google Maps và YouTube. Hơn 90% tìm kiếm trên website diễn ra trên Google. Con số này gấp 20 lần Bing và Yahoo cộng lại.

Nội dung chính

Công cụ tìm kiếm Google hoạt động như thế nào?

Công cụ tìm kiếm hoạt động với ba chức năng chính sau:

  • Thu thập thông tin: Tìm kiếm thông tin trên internet. Xem qua mã / nội dung cho từng URL mà nó tìm thấy.
  • Lập chỉ mục: Lưu trữ và sắp xếp nội dung được tìm thấy trong quá trình thu thập thông tin. Khi một trang đã có trong chỉ mục, nó được hiển thị do kết quả của các truy vấn có liên quan.
  • Xếp hạng: Cung cấp phần nội dung sẽ trả lời tốt cho những truy vấn của người tìm kiếm. Có nghĩa là các kết quả sắp xếp theo thứ tự phù hợp nhất đến ít liên quan nhất.

Công cụ tìm kiếm thu thập thông tin là gì?

Thu thập thông tin là quá trình khám phá trong đó công cụ tìm kiếm sử dụng robot để tìm nội dung mới và cập nhật. Nội dung có thể khác – có thể là website, hình ảnh, video, file pdf… Nhưng bất kể ở định dạng nào, nội dung đều được khám phá bởi các liên kết.

Cong-cu-tim-kiem-Google-1

Googlebot bắt đầu bằng cách nạp một vài trang web. Sau đó đi theo các liên kết trên trang web đó để tìm các URL mới. Bằng cách di chuyển dọc theo đường dẫn này, trình thu thập thông tin có thể tìm thấy nội dung mới. Sau đó thêm nội dung đó vào chỉ mục. Đó là một server chứa cở sở dữ liệu khổng lồ về các URL được phát hiện. URL đó sau được truy xuất khi người đang tìm kiếm thông tin phù hợp với nội dung mà URL đó có được.

Chỉ mục công cụ tìm kiếm là gì?

Các công cụ tìm kiếm xử lý và lưu trữ thông tin mà họ tìm thấy trong chỉ mục. Đó là một cơ sở dữ liệu khổng lồ. Cơ sở đó chứa tất cả nội dung thông tin mà họ khám phá. Nó đủ tốt để phục vụ cho người tìm kiếm.

Xếp hạng công cụ tìm kiếm của Google

Khi ai đó thực hiện truy vấn tìm kiếm, các công cụ tìm kiếm đi vào chỉ mục của họ để tìm nội dung có liên quan nhất. Sau đó đưa nội dung đó tới người tìm kiếm với hi vọng giải quyết được truy vấn của người tìm kiếm. Thứ tự kết quả tìm kiếm theo mức độ liên quan được gọi là xếp hạng. Bạn có thể giả định rằng một trang web được xếp hạng càng cao, thì công cụ tìm kiếm càng tin rằng trang web đó có liên quan tới truy vấn.

Có thể chặn trình thu thập thông tin của công cụ tìm kiếm một phần hoặc toàn bộ website của bạn. Bạn cũng có thể hướng dẫn công cụ tìm kiếm tránh lưu trữ một số trang nhất định trong chỉ mục của chúng. Mặc dù có thể có nhiều lý do để làm điều này, nhưng nếu bạn muốn nội dung của mình được người tìm kiếm tìm thấy, trước tiên bạn phải đảm bảo rằng trình thu thập thông tin có thể truy vấn đến nội dung đó và có thể lập chỉ mục. Nếu không, nó được coi là vô hình.

Thu thập thông tin: công cụ tìm kiếm có thể tìm thấy trang của bạn không?

Việc website của bạn được thu thập thông tin và lập chỉ mục là điều cần thiết để được hiển thị trên SERPs. Nếu bạn đã có một website, hãy bắt đầu bằng việc xem có bao nhiêu trang được lập chỉ mục. Điều này sẽ mang lại một số thông tin chi tiết tuyệt vời về việc liệu Google có đang thu thập thông tin. Nó tìm thấy tất cả các trang web của bạn muốn hay không.

Một cách dễ dàng để kiểm tra website của bạn có được lập chỉ mục. Bạn có thể sử dụng cú pháp “site:yourwebsite.com”. Bạn truy cập vào google và sử dụng cú pháp đó vào thanh tìm kiếm. Trình duyệt sẽ trả về cho bạn kết quả mà Google đã lập chỉ mục các URL website của bạn.

Cong-cu-tim-kiem-Google-3

Số lượng chỉ mục kết quả Google hiển thị có thể không đúng đâu nhé. Nhưng nó cung cấp cho bạn một sự thật chắc chắn những trang nào được lập chỉ mục trên website của bạn. Bạn có thể xem chỉ mục chính xác trên Google Search Console. Bạn gửi sơ đồ website lên đó. Sau đó theo dõi có bao nhiêu trang được thêm vào chỉ mục của Google.

Nếu các trang web của bạn không hiển thị bất kỳ đâu trên công cụ tìm kiếm:

  • Webiste mới và chưa được thu thập thông tin.
  • Website không được liên kết đến từ bất kỳ trang web nào bên ngoài.
  • Điều hướng đến trang khiến robot khó thu thập dữ liệu một cách hiệu quả
  • Trang web chặn trình thu thập dữ liệu
  • Trang bị Google phạt vì một lý do nào đó.

Cho các công cụ tìm kiếm như Google biết cách thu thập dữ liệu website của bạn

Bạn đã sử dụng công cụ Google Search Console hoặc cú pháp “site:yourwebsite.com”. Nhận thấy một số trang web quan trọng của bạn bị thiếu trong chỉ mục. Có thể là một số trang không quan trọng bị lập chỉ mục nhầm. Bạn có thể thực hiện một số cách tối ưu hoá để hướng dẫn Googlebot. Tốt hơn cách bạn muốn nội dung trang web của mình được thu thập thông tin tự động. Nói với công cụ tìm kiếm cách thu thập dữ liệu website có thể giúp bạn kiểm soát tốt hơn những gì tự động.

Hầu hết mọi người đều nghĩ đến việc đảm bảo Google có thể tìm thấy trang web quan trọng. Nhưng lại quên rằng bạn cũng có những trang không muốn Google lập chỉ mục. Chúng có thể là những trang có nội dung nghèo nàn, URL trùng lặp, các mã khuyến mãi, trang thử nghiệm… Để chặn Googlebot vào các trang không muốn, bạn có thể sử dụng File robot.txt.

Robot.txt

Tệp tin robot.txt đặt trong thư mục gốc website của bạn. Ví dụ: yourwebsite.com/robot.txt. File này đề xuất với công cụ tìm kiếm những trang nào được và không được thu thập dữ liệu. Cũng như tốc độ chúng thu thập dữ liệu trên webstie của bạn. Trên File sẽ có các lệnh cụ thể.

Cách Googlebot xử lý tệp robot.txt

  • Nếu Googlebot không thể tìm thấy tệp robot.txt trên một website, nó sẽ tiến hành thu thập dữ liệu.
  • Nếu Googlebot tìm thấy tệp robot.txt, nó thường tuân theo các lệnh được viết trên đó. Sau đó mới tiến hành thu thập những gì được cho phép.
  • Nếu Googlebot gặp lỗi khi truy cập vào tệp robot.txt của website và không thể xác định xem tệp đó có tồn tại hay không, nó sẽ không thu thập dữ liệu website.

Không phải tất cả các robot đều tuân theo robot.txt. Những kẻ phá hoại có thể xây dựng những bot không tuân theo giao thức này. Thực tế, một số kẻ xấu sử dụng tệp robot.txt để tìm ra nơi bạn đặt nội dung riêng tư. Mặc dù có vẻ hợp lý khi chặn trình thu thập thông tin khỏi các trang riêng tư như trang đăng nhập và quản trị để chúng không hiển thị trong chỉ mục.

Nhưng việc đặt vị trí của các URL đó trong tệp robot.txt có thể truy cập công khai. Điều đó có nghĩ là những người có ý định xấu có thể dễ dàng thấy chúng hơn. Tốt hơn là đặt thuộc tính noindex các trang này. Đặt chúng sau biểu mẫu đăng nhập hơn là đặt vào File robot.txt.

Xác định các tham số URL

Một số trang web cung cấp nhiều nội dung trên cùng một URL bằng cách thêm một số thông số nhất định. Nếu bạn đã từng mua sắm trực tuyến, bạn có thể thu hẹp phạm vi tìm kiếm của mình bằng các bộ lọc. Ví dụ: bạn mua áo trên một trang bất kỳ. Bạn có thể có thông số về kích cỡ, màu sắc và kiểu dáng. Mỗi lần bạn tinh chỉnh, URL lại thay đổi một chút.

Làm thế nào để công cụ tìm kiếm Google biết phiên bản nào của URL để phân phát cho người tìm kiếm? Google thực hiện công việc này khá tốt trong việc tìm ra URL đại diện. Nhưng bạn có thể sử dụng tính năng tham số URL trong Google Search Console để Google biết chính xác bạn muốn nó xử lý trang của mình.

Nếu bạn sử dụng tính năng này để thông báo cho Googlebot không thu thập thông tin URL nào đó, thì cơ bản đang yêu cầu ẩn nội dung đó. Điều này có thể dẫn đến việc xoá các trang đó khỏi kết quả tìm kiếm. Đó là những gì bạn muốn nếu các thông số tạo ra các trùng lặp. Nhưng không lý tưởng nếu bạn muốn các trang đó được lập chỉ mục.

Trình thu thập thông tin có thể tìm thấy nội dung quan trọng của bạn không?

Đến đây bạn đã biết một số chiến thuật để đảm bảo trình thu thập thông tin của công cụ tìm kiếm tránh xa nội dung quan trọng của bạn. Hãy cùng tìm hiểu về các tối ưu hoá có thể giúp Googlebot tìm thấy các trang quan trọng của bạn.

Đôi khi công cụ tìm kiếm có thể tìm thấy các phần tử của trang web bằng cách thu thập thông tin. Nhưng các trang hoặc phần tử khác có thể bị che khuất vì lý do nào đó. Điều quan trọng là đảm bảo các công cụ tìm kiếm có thể khám phá tất cả các nội dung của bạn muốn lập chỉ mục. Chứ không phải là chỉ là trang chủ của bạn.

Nội dung của bạn có ẩn sau biểu mẫu đăng nhập không?

Bạn yêu cầu người dùng đăng nhập, điền vào biểu mẫu hoặc trả lời khảo sát trước khi truy cập nội dung nhất định. Các công cụ tìm kiếm có thể không tìm thấy các trang được bảo vệ đó. Trình thu thập thông tin chắc chắn sẽ không đăng nhập.

Robot không thể sử dụng các biểu mẫu tìm kiếm. Một số cá nhân tin rằng nếu họ đặt một hộp tìm kiếm trên website của họ, các công cụ tìm kiếm có thể tìm thấy mọi thứ mà khách truy cập của họ tìm kiếm.

Cong-cu-tim-kiem-Google-4

Văn bản có bị ẩn trong nội dung không phải văn bản?

Không nên sử dụng các biểu mẫu không phải văn bản. Đó có thể là hình ảnh, video… để hiển thị văn bản mà bạn muốn được lập chỉ mục. Các công cụ tìm kiếm ngày càng nhận ra hình ảnh tốt hơn. Nhưng không có gì đảm bảo chúng có thể đọc và hiểu. Tốt hơn hết là bạn thêm văn bản vào trong phần đánh dấu <HTML> trên trang của mình.

Công cụ tìm kiếm Google có thể theo dõi điều hướng trang web của bạn không?

Các trình thu thập thông tin cần khám phá website thông qua các liên kết từ các trang web khác. Nó cần một đường dẫn liên kết trên trang web của riêng bạn để điều hướng nó từ trang này sang trang khác. Nếu bạn có một trang mà bạn muốn công cụ tìm kiếm tìm thấy mà không được liên kết đến từ trang khác, tốt nhất là ẩn chúng đi. Nhiều website mắc sai lầm nghiêm trọng. Đó là cấu trúc điều hướng của họ theo cách mà các công cụ tìm kiếm không thể tiếp cận được. Cản trở khả năng được liệt kê trong kết quả tìm kiếm.

Cong-cu-tim-kiem-Google-5

Các lỗi điều hướng khiến trình thu thập thông tin không tìm thấy trang web

  • Điều hướng trên thiết bị di động hiển thị kết quả khác với điều hướng trên máy tính để bàn.
  • Bất kể loại điều hướng nào mà mục Menu không có trong HTML. Chẳng hạn như điều hướng hỗ trợ JavaScipt. Google đã tiến bộ hơn trong việc thu thập dữ liệu và hiểu JavaScipt. Nhưng nó không phải là một trình quá hoàn hảo. Cách chắc chắn hơn để đảm bảo Google có thể tìm thấy, hiểu và lập chỉ mục là đưa nó vào <HTML>.
  • Cá nhân hoá hoặc hiển thị đường dẫn duy nhất cho một loại khác cụ thể. Đó có vẻ là việc đang che giấu trình thu thập thông tin của công cụ tìm kiếm.
  • Quên liên kết đến một trang chính trên website của bạn thông qua điều hướng. Hãy nhớ rằng, liên kết là đường dẫn mà trình thu thập thông tin theo đến một trang mới.

Đây là lý do cần thiết mà website của bạn phải có điều hướng rõ ràng và cấu trúc như mục URL hữu ích.

Bạn có kiến trúc thông tin sạch không?

Kiến trúc thông tin là thực hành tổ chức và gắn nhãn nội dung trên một website để nâng cao hiệu quả. Nó cũng tăng khả năng tìm kiếm cho người dùng. Kiến trúc thông tin tốt nhất là trực quan. Có nghĩa là người dùng không cần phải suy nghĩ nhiều để lướt qua trang web của bạn hoặc để tìm thứ gì đó.

Bạn có sử dụng sitemaps cho website không?

Sơ đồ trang web giống như tên gọi. Đó là một danh sách các URL trên website của bạn mà trình thu thập thông tin có thể sử dụng để khám phá và lập chỉ mục nội dung của bạn. Một trong những cách dễ nhất để đảm bảo Google đang tìm thấy các trang có mức độ ưu tiên cao nhất. Đó là tạo một tệp tin đáp ứng các tiêu chuẩn của Google và gửi tệp đó qua Google Search Console. Mặc dù việc gửi sơ đồ trang web không thay thế nhu cầu điều hướng trang web tốt. Nhưng nó chắc chắn có thể giúp trình thu thập thông tin theo đường dẫn đến tất cả các trang quan trọng của bạn.

Nếu website của bạn không có bất kỳ trang web nào liên kết tới nó. Bạn vẫn có thể lập chỉ mục bằng cách gửi sơ đồ XML của bạn trong Google Search Console. Không có gì đảm bảo rằng, sơ đồ đó có hết các URL đã gửi trong chỉ mục. Nhưng nó cũng rất đáng để thử.

Công cụ tìm kiếm Google có gặp lỗi khi cố gắng truy cập vào URL của bạn?

Trong quá trình thu thập thông tin URL trên website của bạn, nó có thể gặp lỗi. Bạn có thể thấy được báo “Lỗi thu thập thông tin” của Google Search Console. Nó phát hiện ra các URL bị lỗi không thu thập được. Báo cáo này sẽ hiển thị cho các bạn lỗi máy chủ và lỗi không tìm thấy. Tệp nhật ký máy chủ cũng có thể hiển thị cho bạn thấy điều này. Trước khi bạn xử lý các lỗi thu thập thông tin, điều quan trọng là phải hiểu máy chủ lỗi và lỗi không tìm thấy.

Mã 4xx: lỗi máy khách khiến trình thu thập thông tin không tìm thấy nội dung của bạn

Lỗi 4xx là lỗi máy khách. Có nghĩa là URL được yêu cầu có cú pháp sai hoặc không thể thực hiện được. Một trong những lỗi 4xx phổ biến nhất là lỗi “404 – not found”. Những điều này có thể xảy ra trong việc đánh máy, URL bị xoá hoặc chuyển hướng bị hỏng. Khi công cụ tìm kiếm thấy lỗi 404, chúng không thể truy cập URL. Khi người dùng gặp phải lỗi 404, họ có thể thất vọng và rời đi.

Mã 5xx: Lỗi máy chủ khiến trình thu thập không thể truy cập nội dung của bạn

Lỗi 5xx là lỗi máy chủ. Có nghĩa là lỗi máy chủ không thực hiện được yêu cầu của người tìm kiếm hoặc công cụ tìm kiếm truy cập trang. Trong báo cáo “lỗi thu thập thông tin” của Google Search Console, có một Tab dành riêng cho lỗi này. Những điều này thường xảy ra vì URL đã hết thời gian chờ. Vì vậy Googlebot đã từ bỏ yêu cầu. Rất may, có một cách để cả người và công cụ tìm kiếm biết rằng trang của bạn đã di chuyển. Đó là chuyển hướng 301(Vĩnh viễn).

Cong-cu-tim-kiem-Google-6

Bản thân mã trạng thái 301 là trang vĩnh viễn chuyển đến một vị trí mới. Vì vậy, hãy tránh chuyển hướng URL đến trang không liên quan. Đó là những URL mà nội dung của URL cũ không thực sự tồn tại. Nếu một trang đang được xếp hạng cho một truy vấn và bạn chuyển hướng nó đến một URL có nội dung khác, nó sẽ bị tụt hạng. Vì nội dung làm cho nó có liên quan đến truy vấn cụ thể đó không còn nữa. 301 rất mạnh mẽ – di chuyển URL một cách có trách nhiệm.

Lập chỉ mục: Công cụ tìm kiếm lưu trữ các trang web của bạn như thế nào?

Đảm bảo rằng các trang web của bạn đã được thu thập thông tin. Yêu cầu tiếp theo của công việc là đảm bảo rằng nó thể được lập chỉ mục. Chỉ vì website của bạn có thể được phát hiện và thu thập thông tin bởi công cụ tìm kiếm không nhất thiết nó được lưu trữ trong chỉ mục của họ. Ở phần trước về việc thu thập thông tin, chúng tôi đã chia sẻ về cách trang của bạn được Google khám phá.

Chỉ mục là nơi các trang web được khám phá của bạn. Sau khi trình thu thập thông tin thấy một trang, công cụ tìm kiếm sẽ hiển thị trang đó giống như một trình duyệt. Trong quá trình như vậy, công cụ tìm kiếm sẽ phân tích nội dung của trang đó. Tất cả thông tin đó được lưu trữ trong chỉ mục của nó.

luu-tru-google

Bạn có biết Googlebot thu thập thông tin trang của bạn?

Câu trả lời là có. Phiên bản đã lưu trong bộ nhớ các trang của bạn sẽ cho biết lần cuối Googlebot thu thập trang đó. Google thu thập thông tin và lưu trữ các trang web ở tần suất khác nhau. Đặc biệt là các trang về tin tức, việc cập nhật tin luôn diễn ra liên tục.

Các trang có thể bị xoá khỏi chỉ mục không?

Có, các trang có thể bị xoá khỏi chỉ mục! Một số lý do khiến trang có thể bị xoá khỏi chỉ mục:

  • URL trả về lỗi “không tìm thấy”(4xx) hoặc lỗi máy chủ(5xx). Điều này có thể là do ngẫu nhiên(trang được di chuyển và chuyển hướng 301 không được thiết lập). Cũng có thể cố ý xoá và chuyển hướng 404 để lấy nó ra khỏi chỉ mục.
  • URL được thêm vào File Robot.txt ngăn lập chỉ mục. Chủ website có thể thêm thẻ này để hướng dẫn công cụ tìm kiếm loại bỏ trang đó trong chỉ mục.
  • URL có thể bị phạt theo cách thủ công. Lý do có thể là do vi phạm nguyên tắc quản trị trang web của công cụ tìm kiếm. Kết quả là URL đã bị xoá khỏi chỉ mục.
  • URL bị chặn thu thập thông tin với việc bổ sung mật khẩu bắt buộc trước khi khách truy cập có thể truy cập trang web.

Nếu nhận thấy một URL của mình không còn nằm trong chỉ mục của Google, bạn có thể sử dụng Google Search Console để kiểm tra trạng thái.

Cho các công cụ tìm kiếm như Google biết cách lập chỉ mục website của bạn

Sử dụng thẻ meta robot

Chỉ thị thẻ meta là hướng dẫn để bạn cung cấp cho các công cụ tìm kiếm về cách trang web của bạn được xử lý. Bạn có thể nói với Googlebot những điều như “không lập chỉ mục trang này trong kết quả tìm kiếm”. Hoặc “không chuyển bất kỳ liên kết nào đến bất kỳ liên kết trên trang nào”. Các thực thi này được hướng dẫn thông qua thẻ meta robot. Nó nằm trong thẻ <head> ở thư mục gốc trang.

Thẻ meta robot có thể loại trừ các công cụ tìm kiếm cụ thể. Index/noindex cho công cụ tìm kiếm biết trang nào được thu thập và không cho thu thập. Nếu sử dụng “noindex”, bạn đang báo là đừng thu thập trang đó. Theo mặc định tất cả các trang web có thể được lập chỉ mục. Vì vậy việc sử dụng giá trị “index” là không cần thiết.

X-Robots-Tag

Thẻ x-robots được sử dụng trong tiêu đề HTTP của URL. Nó mang tính linh hoạt và chức năng hơn các thẻ meta. Nếu bạn muốn chặn các công cụ tìm kiếm trên quy mô lớn, bạn có thể sử dụng các biểu thức chính quy. Chặn các tệp không phải HTML và áp dụng các thẻ noindex trên trang web.

Hiểu các cách làm mà có thể ảnh hưởng tới việc thu thập thông tin và lập chỉ mục sẽ tránh được những cạm bẫy phổ biến. Có thể ngăn việc công cụ tìm kiếm tìm thấy trang quan trọng của bạn.

Xếp hạng: Công cụ tìm kiếm Google xếp hạng URL như thế nào?

Làm thế nào để công cụ tìm kiếm đảm bảo rằng khi ai đó nhập truy vấn vào thanh tìm kiếm, họ sẽ nhận được kết quả có liên quan? Quá trình đó được gọi là xếp hạng. Thứ tự các kết quả tìm kiếm từ liên quan nhất đến ít liên quan nhất từ một truy vấn.

Xep-hang-ket-qua-google

Để xác định được mức độ liên quan, công cụ tìm kiếm sử dụng các thuật toán. Đó là một quy trình và công thức mà thông tin được lưu trữ truy vấn và sắp xếp theo cách có ý nghĩa. Các thuật toán này đã trả qua nhiều lần thay đổi trong nhiều năm. Nó đã được cải thiện chất lượng kết quả tìm kiếm.

Tại sao thuật toán lại luôn thay đổi như vậy? Có phải Google đang cố gắng giữ chân chúng ta không? Google không phải lúc nào cũng tiết lộ chi tiết cụ thể lý do tại sao việc họ làm. Nhưng chúng ta biết, mục tiêu của Google khi thực hiện các điều chỉnh thuật toán là cải thiện chất lượng tìm kiếm tổng thể.

Đó là lý do tại sao Google luôn thay đổi và cập nhật các thuật toán. Điều này cho thấy rằng, nếu trang của bạn bị ảnh hưởng sau khi Google điều chỉnh thuật toán, hãy so sánh nó với nguyên tắc chất lượng của Google. Hoặc cũng có thể là nguyên tắc đánh giá chất lượng tìm kiếm. Cả hai đều rõ ràng về những gì công cụ tìm kiếm muốn.

Công cụ tìm kiếm như Google muốn gì?

Các công cụ tìm kiếm luôn làm điều tương tự nhau: cung cấp câu trả lời hữu ích cho các câu hỏi của người tìm kiếm hữu ích nhất. Nếu điều đó đúng, tại sao SEO bây giờ khác với những năm trước đó?

Lấy ví dụ về một ai muốn học một ngôn ngữ mới. Lúc đầu, sự hiểu biết của họ về ngôn ngữ rất thô sơ. Theo thời gian, sự hiểu biết của họ bắt đầu sâu sắc hơn. Họ học ngữ nghĩa – ý nghĩa đằng sau một ngôn ngữ và mối quan hệ giữ các cụm từ. Cuối cùng là thực hành, biết ngôn ngữ đủ tốt, thậm chí là sâu sắc. Sau đó là có thể cung cấp câu trả lời cho các hỏi thậm chí là mơ hồ và không đầy đủ.

Đối với công cụ tìm kiếm cũng thế. Khi nó mới bắt đầu học ngôn ngữ của chúng ta, việc đánh lừa hệ thống bằng cách sử dụng các thuật ngữ và chiến thuật thực sự đi ngược lại với nguyên tắc về chất lượng sẽ dễ dàng hơn. Ví dụ như nhồi nhét từ khoá chẳng hạn. Nếu bạn muốn xếp hạng cho một từ khoá nào đó, bạn có thể đưa nhiều từ khoá đó vào.

Cách nói trên tạo ra trải nghiệm người dùng khủng khiếp. Thay vì cười với những trò đùa hài hước, mọi người lại bị gây khó chịu với những văn bản khó đọc. Nó có thể được áp dụng trong quá khứ, nhưng bây giờ không phải là điều mà các công cụ tìm kiếm muốn.

Vai trò của các liên kết trong SEO

Khi nói về các liên kết, chúng ta nói về hai điều. Liên kết ngược là những liên kết từ trang web khác trỏ đến trang của bạn. Nó được gọi là backlink. Trong khi các liên kết nội bộ là liên kết trên trang web này trỏ sang trang web cùng trên trang của bạn.

internal-link-external-link

Các liên kết trong lịch sử đóng vai trò lớn trong SEO. Ngay từ rất sớm, các công cụ tìm kiếm như Google đã cần trợ giúp để tìm ra các URL tin cậy hơn những URL khác để giúp họ xác định cách xếp hạng kết quả tìm kiếm. Tính toán số lượng liên kết trỏ đến bất kỳ trang web nhất định nào để giúp họ thực hiện điều này.

Đó là lý do tại sao pagerank được tạo ra như một phần thuật toán của Google. PageRank là một thuật toán phân tích liên kết. Nó ước tính tầm quan trọng của một trang web, bằng cách đo lường chất lượng và số lượng liên kết trỏ đến. Giả định một trang web càng có liên quan, quan trọng và đáng tin cậy thì trang web đó sẽ kiếm được nhiều liên kết.

Bạn càng có nhiều liên kết ngược tự nhiên từ các trang web uy tín và có thẩm quyền, thì tỉ lệ uy tín của bạn càng cao. Giúp được xếp hạng cao hơn trong kết quả tìm kiếm.

Vai trò của nội dung trong SEO

Sẽ không có điểm liên kết nào nếu chúng không hướng người tìm kiếm đến một thứ gì đó. Đó là nội dung – content marketing. Nội dung là bất kỳ thứ gì mà người dùng tìm kiếm sử dụng. Nó có thể là video, hình ảnh, văn bản… Nếu công cụ tìm kiếm là máy trả lời, thì nội dung là phương tiện cung cấp nội dung các câu trả lời.

Khi ai đó thực hiện một tìm kiếm, có thể có cả hàng nghìn kết quả. Vậy làm thế nào để các công cụ tìm kiếm quyết định trang nào mà người tìm kiếm sẽ tìm thấy giá trị? Một phần trong việc xác định vị trí trang của bạn được xếp hạng cho một truy vấn là mức độ phù hợp với nội dung trên trang. Trang này có khớp với các từ được tìm kiếm và giúp người tìm kiếm giải quyết vấn đề.

Điều này sẽ tập trung vào sự hài lòng của người dùng. Không có tiêu chí nghiêm ngặt về thời lượng nội dung của bạn, số lần nội dung phải chứa một từ khoá hoặc những gì bạn đặt trong thẻ tiêu đề của mình. Tất cả những gì đó có thể đóng một vai trò trong việc một trang hoạt động tốt như thế nào trong tìm kiếm. Nhưng trọng tâm là những người dùng sẽ đọc nội dung.

Ngày nay, có cả nghìn yếu tố để xếp hạng. Nhưng ba yếu tố chính khá nhất quán: liên kết đến trang của bạn(đóng vai trò là tín hiệu uy tín của bên thứ ba), nội dung(nội dung chất lượng đáp ứng ý muốn của người tìm kiếm) và RankBrain.

RankBrain là gì?

RankBrain là thành phần máy học thuật toán cốt lõi của công cụ tìm kiếm Google. Máy học là một chương trình máy tính tiếp tục cải thiện các dự đoán của nó theo thời gian thông qua quan sát và dữ liệu đào tạo mới. Nói cách khác, nó luôn học hỏi. Do đó kết quả tìm kiếm luôn được cải thiện.

Ví dụ: nếu RankBrain nhận thấy một URL được xếp hạng thấp hơn cung cấp kết quả tốt hơn cho người dùng so với các URL xếp hạng cao hơn, bạn có thể chắc chắn RankBrain sẽ điều chỉnh các kết quả đó. Chuyển kết quả phù hợp hơn lên cao và hạ thấp các trang ít liên quan như một sản phẩm phụ.

ket-qua-tim-kiem-theo-gio

Điều này có ý nghĩa gì với người làm SEO?

Google sẽ sử dụng RankBrain để quảng bá nội dụng hữu ích, phù hợp nhất. Chúng ta cần tập trung vào việc thực hiện ý định của người tìm kiếm hơn bao giờ hết. Cung cấp thông tin và trải nghiệm tốt nhất có thể cho người tìm kiếm có thể truy cập trang. Bạn đã thực hiện một bước quan trọng đầu tiên để hoạt động tốt trong thế giới RankBrain.

Các chỉ số tương tác: tương quan – nhân quả

Xếp hạng của Google, các chỉ số tương tác rất có thể là một mối tương quan một phần và một phần nhân quả. Khi chúng ta nói chỉ số tương tác, là muốn đề cập đến dữ liệu đại diện cho cách người tìm kiếm tương tác với trang web của bạn từ kết quả tìm kiếm. Điều này bao gồm những thứ như sau:

  • Số lần nhấp(lượt truy cập từ tìm kiếm)
  • Thời gian trên trang(lượng thời gian khách truy cập ở trên trang của bạn trước khi rời đi)
  • Tỷ lệ thoát(Tỷ lệ phần trăm của tất cả các phiên trang web mà người dùng chỉ xem một nội dung)
  • Pogo-stick(nhấp vào một kết quả mà không phải trả tiền và sau đó nhanh chóng quay SERP để chọn một kết quả khác)

Nhiều bài kiểm tra đã chỉ ra rằng các chỉ số tương tác với thứ hạng cao. Nhưng quan hệ nhân quả đã được tranh luận sôi nổi. Các chỉ số tương tác có phải là dấu hiệu của các trang web được xếp hạng cao hay không? Hay các trang web được xếp hạng cao bởi vì chúng sở hữu những chỉ số tương tác tốt?

Công cụ tìm kiếm Google đã nói gì

Mặc dù họ chưa bao giờ sử dụng thuật ngữ “tín hiệu xếp hạng trực tiếp”, Google đã nói rõ rằng, họ hoàn toàn sử dụng dữ liệu nhấp chuột để sửa đổi SERP cho các truy vấn cụ thể.

Theo cựu Giám đốc chất lượng tìm kiếm của Google, Udi Manber:

“Bản thân thứ hạng bị ảnh hưởng bởi những nhấp chuột. Nếu chúng tôi phát hiện ra rằng, đối với những truy vấn cụ thể nếu 80% người nhấp vào vị trí 2 và chỉ 10% nhấp vào vị trí 1. Sau một thời gian, chúng tôi nhận ra có lẽ vị trí 2 là thứ mọi người cần, vì vậy chúng tôi chuyển nó lên”.

Một nhận xét khác từ Edmond, cựu kỹ sư của Google chứng thực điều này:

“Khá rõ ràng rằng bất cứ công cụ tìm kiếm hợp lý nào sẽ sử dụng dữ liệu nhấp chuột cho kết quá tìm kiếm của mình để đưa lại xếp hạng nhằm cải thiện kết chất lượng kết quả tìm kiếm. Cơ chế thực tế về các dữ liệu nhấp chuột được sử dụng thường là độc quyền. Nhưng Google cho thấy rõ ràng rằng họ sử dụng dữ liệu nhấp chuột với các bằng sáng chế của mình trên các hệ thống như các mục nội dung được xếp hạng”.

Bởi vì Google cần duy trì và cải thiện chất lượng tìm kiếm. Dường như không thể tránh khỏi các chỉ số tương tác là tương quan. Nhưng có vẻ Google không gọi các chỉ số tương tác là “tín hiệu xếp hạng”. Vì những chỉ số đó được sử dụng để cải thiện chất lượng tìm kiếm và xếp hạng của các URL riêng lẻ chỉ là sản phẩm phụ của việc đó.

Những chỉ số nào đã xác nhận

Những thử nghiệm khác nhau đã cho thấy rằng công cụ tìm kiếm Google sẽ điều chỉnh thứ tự SERP để đáp ứng sự tương tác của người tìm kiếm:

  • Thử nghiệm năm 2014 của Rand Fishkin đã dẫn đến kết quả thứ 7 tiến lên vị trí số 1. Nó có được sau khi có khoảng 200 người nhấp vào URL từ SERP. Thật thú vị, việc cải thiện thứ tự xếp hạng dường như được tách biệt với vị trí của những người đã truy cập liên kết. Vị trí xếp hạng tăng đột biết ở Mỹ. Nơi có nhiều người tham gia. Trong khi xếp hạng vẫn thấp hơn trên trang trong Google, Canada, Úc…
  • So sánh của Larry Kim về các trang hàng đầu. Thời gian dừng chân trung bình trước và sau RankBrain dường như chỉ ra rằng thành phần máy học trong thuật toán của Google làm giảm vị trí xếp hạng của các trang mà mọi người không dành nhiều thời gian.
  • Thử nghiệm của Darren Shaw đã cho thấy sự tác động của hành vi người dùng đối với kết quả tìm kiếm địa phương và gói bản đồ.

Các chỉ số tương tác của người dùng để sử dụng điều chỉnh SERP về chất lượng và xếp hạng các thay đổi vị trí như một chỉ số sản phẩm phụ. Nên có thể an toàn nói rằng SEO nên tối ưu hóa cho sự tương tác. Sự tương tác không thay đổi chất lượng khách quan trên website của bạn. Nó là giá trị của bạn đối với người tìm kiếm so với kết quả khác cho truy vấn đó. Đó là lý do tại sao, sau đó không có sự thay đổi nào với trang của bạn.

Sự phát triển của kết quả trên công cụ tìm kiếm Google

Trước đây các công cụ tìm kiếm không tinh vi như bây giờ. Thuật ngữ “10 liên kết xanh” được đặt ra để mô tả cấu trúc của SERP. Bất cứ lúc nào tìm kiếm được thực hiện Google sẽ trả về một trang có mười kết quả tìm kiếm không phải trả tiền. Mỗi kết quả có cùng một định dạng.

Ket-qua-tim-kiem-do-SEO

Trong bối cảnh trên, giành vị trí số 1 là đỉnh cao của SEO. Nhưng rồi Google đã đưa vào những định dạng mới trong kết quả tìm kiếm của họ. Đó được gọi là các tính năng SERP. Một số tính năng SERP bao gồm:

  • Quảng cáo trả tiền
  • Các đoạn trích nổi bật
  • Gói địa phương(bản đồ)
  • Bảng tri thức
  • Liên kết trang web

Google luôn đưa ra những cái mới. Việc thay đổi hoặc bổ sung gây ra một số vấn đề với hai lý do chính.

  • Nhiều trang không phải trả tiền bị đẩy xuống SERP.
  • Một sản phẩm phụ ít người tìm kiếm nhấp vào kết quả tìm kiếm không phải trả tiền vì nhiều truy vấn hơn đang được trả lời trên chính SERP.

Tại sao công cụ tìm kiếm Google làm điều này?

Hành vi người dùng chỉ ra rằng mỗi truy vấn được các định dạng nội dung khác nhau đáp ứng tốt hơn. Lưu ý các loại tính năng SERP khác nhau khớp với các loại ý định truy vấn khác nhau.

Mục đích truy vấnTính năng SERP có thể được kích hoạt
Thông tinĐoạn trích nổi bật
Thông tin với mỗi câu trả lờiSơ đồ trí thức / câu trả lời tức thì
Địa phươngBản đồ
Giao dịchMua sắm

Tìm kiếm bản địa hoá

Công cụ tìm kiếm như Google có chỉ mục độc quyền của riêng mình về danh sách doanh nghiệp địa phương. Từ đó tạo ra kết quả tìm kiếm địa phương.

Nếu bạn đang thực hiện công việc SEO địa phương cho một doanh nghiệp mà có một vị khách vị trí địa lý có thể truy cập(ví dụ: phòng tập Gym). Hoặc cho một doanh nghiệp đi đến nơi của khách hàng(ví dụ: sửa chữa tủ lạnh). Hãy chắc chắn rằng bạn yêu cầu, xác minh và tối ưu Google Business.

Khi nói đến kết quả tìm kiếm được bản địa hoá, Google sử dụng ba yếu tố chính để xác định xếp hạng:

  • Sự liên quan
  • Khoảng cách
  • Sự nổi bật

Sự liên quan

Mức độ liên quan là mức độ phù hợp của doanh nghiệp địa phương với những gì người dùng đang tìm kiếm. Để đảm bảo doanh nghiệp đang làm mọi cách để có thể liên quan đến người tìm kiếm. hãy đảm bảo rằng thông tin của doanh nghiệp đầy đủ và chính xác.

Khoảng cách

Công cụ tìm kiếm Google sử dụng vị trí địa lý của bạn để cung cấp các kết quả địa phương tốt hơn. Kết quả tìm kiếm cục bộ cực kỳ nhạy cảm với vùng lân cận. Đề cập đến vị trí của người tìm kiếm hoặc vị trí được chỉ định trong truy vấn. Kết quả tìm kiếm không phải trả tiền nhạy cảm với vị trí của người tìm kiếm.

Sự nổi bật

Sự nổi bật là một yếu tố, Google tìm cách thưởng cho các doanh nghiệp địa phương nổi tiếng trong thế giới thực. Ngoài ra Google cũng xem xét một số yếu tố trực tuyến để xác định xếp hạng địa phương. Các yếu tố đó:

Nhận xét: Số lượng đánh giá mà một doanh nghiệp địa phương nhận được. Cảm xúc của những người đánh giá đó có tác động đáng kể đến khả năng xếp hạng của họ trong kết quả địa phương.

Trích dẫn: “Trích dẫn doanh nghiệp” hoặc “danh sách doanh nghiệp” là tham chiếu dựa trên web đến “NAP” của doanh nghiệp địa phương(tên, địa chỉ và số điện thoại) trên nền tảng bản địa hoá.

Thứ hạng địa phương ảnh hưởng bởi số lượng và tính nhất quán của các trích dẫn kinh doanh địa phương. Google lấy dữ liệu từ nhiều nguồn khác nhau. Liên tục tạo nên chỉ mục địa phương của bạn. Khi Google tìm thấy nhiều tham chiếu nhất quán đến tên, địa chỉ và số điện thoại của doanh nghiệp địa phương, điều đó tạo sự củng cố niềm tin của Google về tính hợp lệ của dữ liệu đó. Sau đó, điều này dẫn đến việc Google có thể hiển thị doanh nghiệp với mức độ tin cậy cao hơn.

Xếp hạng không phải trả tiền: Các phương pháp hay nhất về SEO cũng áp dụng cho địa phương. Vì Google cũng xem xét vị trí của trang web trong kết quả tìm kiếm không phải trả tiền khi xếp hạng địa phương.

Tương tác địa phương trên công cụ tìm kiếm Google

Mức độ tương tác không được Google liệt kê như một yếu tố xếp hạng địa phương. Nhưng vai trò của mức độ tương tác sẽ chỉ tăng lên khi thời gian trôi qua. Google tiếp tục làm phong phú kết quả địa phương bằng cách kết hợp dữ liệu trong thế giới thực như thời gian phổ biến để truy cập và thời gian truy cập trung bình… Thậm chí cung cấp cho người tìm kiếm khả năng đặt câu hỏi cho địa phương.

Hơn bao giờ hết, các kết quả địa phương đang bị ảnh hưởng bởi dữ liệu trong thế giới thực. Tính tương tác này là cách người ta tìm kiếm tương tác. Cũng có thể là phản hồi với các doanh nghiệp địa phương. Thì vì để thông tin thuần tuý tĩnh như liên kết và trích dẫn hãy tạo tương tác tốt.

Google cung cấp doanh nghiệp địa phương tốt nhất và phù hợp cho người tìm kiếm. Vậy nên sử dụng chỉ số tương tác trong thời gian thực để xác định chất lượng và mức độ phù hợp là rất hợp lý.

Phần kết

Bạn cần phải biết chi tiết về thuật toán của Google. Điều này không còn là bí mật nữa. Qua chương 2, bạn sẽ có kiến thức cơ bản tuyệt vời về công cụ tìm kiếm tìm, diễn giải, lưu trữ và xếp hạng nội dung.

Chương 3 chúng tôi sẽ chia sẻ kiến thức: cách chọn từ khoá mà nội dung của bạn sẽ nhắm mục tiêu.( nghiên cứu từ khoá)

Tham khảo thêm:

Công cụ Google làm việc như thế nào?

Xu hướng SEO năm 2021

Xu hướng content marketing 2021

CÔNG TY TNHH KNY

Điện thoại: 0933888859

Email: contact@kny.com.vn

Website: https://kny.com.vn

Facebook: Digital Marketing Online

Văn phòng: 100/C2 Hùng Vương, Phường 9, Quận 5, TP.HCM

Địa chỉ: A5/13C, Ấp 1, Xã Bình Chánh, Huyện Bình Chánh, TP.HCM

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *