Thuật toán Google Panda? Nguyên nhân, dấu hiệu và cách khắc phục

SES 17/09/2020

1. Thuật toán Google Panda là gì?

Thuật toán Google Panda là một trong số các thuật toán được Google công bố chính thức vào 23/2/2011, thay thế cho thuật toán Google Cafein trước kia.

Thuật toán Google Panda được ra mắt nhằm loại bỏ những website có chất lượng nội dung kém: nội dung copy, nhiều backlink rác, spam từ khóa, chèn nội dung quảng cáo quá mức… và hỗ trợ công cụ tìm kiếm, trả về các kết quả chính xác, phù hợp nhất với nhu cầu người dùng.

Thuật toán Google Panda xét cho cũng chỉ là một ngôn ngữ máy móc và hoạt động dựa trên những thiết lập cài đặt sẵn của con người, vì vậy nếu nói chính xác ra thì các bạn vẫn có thể biết một số những quy tắc của nó trong phương thức làm việc nhằm tìm ra giải pháp tối ưu hóa website của mình một cách tốt nhất.

2. Các tiêu chí đánh giá của thuật toán Google Panda

2.1 Time on page

Time on Page – thời gian truy cập trang là một giá trị dùng để tính toán thời lượng xem trang của người dùng khi truy cập một trang nào đó trên site. Đây là một trong những chỉ số đo lường khá quan trọng trong Google Analytics, là một mảnh ghép không thể thiếu trong việc xây dựng lên một bức tranh toàn cảnh về trải nghiệm người dùng trên trang.

2.2 Users visit often

Users visit often là số người truy cập thường xuyên website. Khi một website người dùng thường xuyên truy cập sẽ là website có giá trị và không rơi vào bộ lọc của Google Panda.

2.3 Returning User

Returning User là số người dùng quay trở lại website của bạn. Tỷ lệ người dùng quay trở lại là cách để biết được trang web đang có thứ hạng cao trên kết quả tìm kiếm của Google có hữu ích hay không. Google tin rằng chỉ có website chất lượng mới khiến người dùng quay trở lại website thường xuyên hơn.

2.4 Bounce rate

Bounce RateTỷ lệ bỏ trang là một trong các chỉ số quan trọng đối với một website. Thông qua chỉ số này, nhà google có thể đánh giá một cách khách quan trải nghiệm của người dùng trên một trang, hay thậm chí là trên toàn site. Hơn nữa, Bounce Rate còn phần nào thể hiện được chất lượng và uy tín của một website.

2.5 Social

Mục đích của Google Panda là để giúp chọn lọc ra các website hoạt động thực sự bởi con người chứ không phải máy móc (Auto post). Do đó những mạng xã hội là tiêu chí đánh giá khá quan trọng khi tại đây những yếu tố tương tác rất mạnh chỉ có con người mới có thể làm được như trên Facbook, Youtube, Twister…

3. 7 lỗi SEOer làm website dính án phạt Panda

3.1  Thin content – Content ngắn, chất lượng content thấp

– Content ngắn (< 300 ký tự) và thông tin ít, không cung cấp đẩy đủ thông tin, làm cho tỷ lệ thoát trang cao. Bạn biết rồi đó, thời gian người dùng ở trên trang website của bạn là một tiêu chí đầu tiên của thuật toán Google Panda.

– Chất lượng content thấp có thể kể đến các lỗi: Nội dung coppy, sao trộn từ các website khác, không ghi nguồn rõ ràng; Nội dung ở mỗi bài viết không liên quan đến chủ đề hay lĩnh vực của website.

3.2  Duplicate content – Trùng lặp nội dung

Trùng lặp nội dung có 2 dạng:

– Sao chép nội dung bài viết của người khác được lấy từ nhiều nguồn Internet ở nhiều nơi.

– Duplicate content cũng xảy ra ngay trên chính website của bạn khi bạn có nhiều trang chứa cùng một nội dung. Hoặc có rất ít sự biến đổi trong nội dung giữa các trang.

Khi website có các nội dung trùng lặp, giống nhau sẽ gây khó khăn cho các công cụ tìm kiếm (SE) để quyết định thứ hạng của website bạn tùy theo các truy vấn tìm kiếm. Google tính trùng lặp về nội dung theo: Nội dung từng trang; Thẻ meta description; Thẻ heading; Code HTML; Khung giao diện; Khung design mặc định của website;…

Duplicate content là một điều vô cùng tối kị và cực kì nguy hiểm cho website của bạn. Mọi công sức của bạn có thể sẽ “đổ sông đổ bể” chỉ vì đạo một vài câu văn.

3.3 Content farm

Content Farm là một hình thức spam tồn tại đã khá lâu. Những website này thường chỉ thu thập nội dung của các website khác, có thể tự động hoặc thủ công, cùng với đó Content Farm cũng được tối ưu hóa tìm kiếm (SEO) so với các website gốc nên thường được xếp hạng khá cao. Chính vì điều này, các website gốc có nội dung chất lượng lại không được quan tâm nhiều và phải chịu thiệt thòi.

Một mánh khóe được sử dụng cho content farm là họ tối ưu những content farm này với việc nhồi nhét rất nhiều từ khóa. Sự kết hợp của content farm và việc nhồi nhét từ khóa giúp content farm có thứ hạng cao trên SERPs. Nhưng từ khi Google phát hành thuật toán Panda, nó đã hoàn thành nhiệm vụ của mình khá tốt, đảm bảo các website có nội dung kém chất lượng không được xếp hạng cao trên SERPs.

3.4 Website có quá nhiều quảng cáo

Đó là những website được tạo ra để kiếm tiền từ việc đặt banner quảng cáo. Tuy nhiên, quảng cáo trên trang quá nhiều, che mất nội dung website, quảng cáo tự hiển thị và không thể tắt cũng sẽ sớm bị google sờ gáy.

3.5 Lỗi Schema

Schema sẽ giúp website của bạn trở nên thu hút và cung cấp nhiều thông tin hữu ích hơn. Ví dụ, khi người dùng muốn tham gia một sản phẩm nào đó, Schema giúp hiển thị các website có thông tin liên quan đến sản phẩm, giá tiền, đánh giá,… từ đó, làm tăng tỷ lệ truy cập website

Google đưa ra quy luật rõ ràng về vấn đề Schema như sau: Nếu bạn khai gì trên Schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.

3.6 Spin content

Spin Content là “Trộn nội dung” thông qua các phần mềm, công cụ spin chuyên dụng.

Bằng cách xáo trộn từ ngữ này chúng ta có thể nhanh chóng tạo được nhiều nội dung mới nhưng nó lại chẳng hề có ý nghĩa gì đối với người dùng. Vì việc spin content này khiến cho nội dung bạn tạo ra có câu văn lủng củng, sai lệch về nội dung đối với văn bản gốc, điều này thường sẽ khiến cho người dùng trở nên vô cùng thất vọng đối với website bạn qua đó giảm uy tín website bạn trong mắt người dùng.

3.7 Keyword cannibalization

Keyword Cannibalization – Tranh chấp từ khóa: là hiện tượng xảy ra khi bạn vô tình hay cố ý nhắm mục tiêu cùng một từ khóa cho hai hay nhiều bài viết trên website của mình.

Điều này dẫn tới sự cạnh tranh nội bộ lẫn nhau giữa các page ngay trên 1 site. Nó khiến cho Google (công cụ tìm kiếm nói chung) khó xác định đâu là trang đích xứng đáng được xếp hạng hay nó làm cho người dùng trở nên bối rối đâu là nội dung thực sự họ đang tìm kiếm

Keyword Cannibalize thuộc một lỗi nhỏ nằm trong Duplicate Content – Trùng lặp nội dung.

Keyword Cannibalize sẽ làm Giảm độ uy tín của trang (Authority Page); pha loãng liên kết và anchortext; ảnh hưởng để tỷ lệ chuyển đổi và chất lượng nội dung; khiến google bối rối;…

4. Những dấu hiệu website bạn đang bị google panda phạt

4.1 Organic traffic giảm dần theo thời gian

Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất. Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng gì nhiều.

Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn vài tuần, bạn sẽ nhận ra ngay độ giảm sút traffic ngày càng mạnh mẽ, trầm trọng. Nó kéo theo hàng loạt ảnh hưởng tiêu cực khác mà Google Panda mang đến cho website của bạn.

Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.

4.2 Traffic giảm một nửa

Một dấu hiệu nhận biết Google Panda khác nữa là: Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic.

Từ đó khiến website từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.

4.3 Không bao giờ lên trang nhất

Khi dính phạt từ thuật toán Panda, website của bạn vẫn có thứ hạng nhưng không bao giờ lên trang nhất, từ khóa phụ dù dễ nhưng vài tháng vẫn không thể nào lên nổi.

Hình phạt của google có nhiều mức độ, ngoài ra còn một số triệu chứng khác liên quan: Link SEO đứng yên top 20x trở xuống, link SEO mất index, website mất index,…

5. Giải pháp khắc phục khi website bị Google Panda

5.1. Kỹ thuật Noindex và thẻ Canonical

Chặn bọ index nội dung website của bạn. Việc này làm cho webmaster tool báo lỗi 404 thì Google sẽ xóa cache tạm thời và sau đó bạn cần tiến hành Onpage lại toàn bộ website. Sau khi onpage xong, bạn bỏ lệnh chặn bọ rồi ping lại web, nên chạy adword từ một đến hai ngày.

5.2. Cải thiện content kém chất lượng và content mỏng

Với mục đích ban đầu của Panda được thiết kế để cải thiện số thời gian online của người dùng trên website(Time on Site), vì vậy nội dung của bạn càng dài, càng chất lượng thì sẽ giữ được số người truy cập lâu hơn, đồng thời nội dung điều hướng tốt cũng là cách giữ thời gian, số page view(lượt đọc) hiệu quả bạn nên quan tâm.

Tiến hành xóa nội dung trang con và viết lại bằng nội dung của bạn: Hãy để nội dung trên website của mình mang thương hiệu, đặc trưng riêng mà không website nào có. Chỉ có như vậy bạn mới tranh được google panda.

Nội dung chất lượng cao cần hội tụ được những yếu tố sau:

– Bạn cần cung cấp thông tin chi tiết cho người truy cập một cách thành thực và chân thành nhất

– Ngôn ngữ sử dụng trong bài viết phải rõ ràng, dễ hiểu, sử dụng ngôn ngữ toàn dân.

– Điều hướng nội dung tốt, tức là bạn vừa có thể trỏ link các từ khóa liên kết đến những nội dung khác mà người dùng cũng quan tâm ngay trong bài viết.

5.3. Nâng cao chất lượng tổng thể website

Chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó. Bạn cần phải xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:

– Nâng cao chất lượng nội dung, liên kết nội bộ cho từng site.

– Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…

Cách tốt nhất để tránh Google Panda là hãy phát triển thương hiệu cho riêng bạn.  Cùng đó là xây dựng một trang web của bạn trở thành một nguồn thông tin đáng tin cậy. Với nội dung tuyệt vời, mang lại giá trị cho người đọc.

6. Công cụ hỗ trợ

Copy scape

Copy scape là công cụ trả phí. Nó giúp bạn theo dõi những nội dung bạn đã copy từ trang khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất. Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.

Siteliner

Thêm 1 công cụ khác là siteliner với chức năng tìm nội dung copy dựa trên gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo cho bạn chỉ số phần trăm giống nhau giữa các bài. Đây cũng là 1 công cụ trả phí!

Kết luận

Qua bài viết trên đã giúp cho các bạn có cái nhìn tổng quan về thuật toán Google Panda, không mắc phải sai lầm trong quá trình triển khai dự án có thể lên kế hoạch SEO website phù hợp với máy tìm kiếm Google. Chúc các bạn thành công!

Liên hệ ngay tới KBI để được tư vấn miễn phí nếu quý khách hàng cần tham khảo các dịch vụ liên quan đến: Digital marketing, Tư vấn chiến lược thương hiệu, Thiết kế nhận diện thương hiệu, Quản trị doanh nghiệp,….

WEALTHY CONNECTION…

KBI – KEY BRANDS INTERNATIONAL
102 Trần Phú – Mộ Lao – Hà Đông – Hà Nội
Hotline: 0936 223 332 – Zalo: 0989 679 262
Mail: info@kbi.vv – Website: https://kbi.vn

BÀI VIẾT LIÊN QUAN

Trả lời