Gần đây, Google CEO Sundar Pichai đã được gọi để làm chứng trước Quốc hội về sự thiên vị tiềm ẩn trong các thuật toán của Google. Đây không phải là lần đầu tiên Google bị buộc tội thiên vị và có thể sẽ không phải là lần cuối cùng. Google cáo buộc rằng không có sự thiên vị, nhưng nhiều người theo Đảng Bảo thủ cho rằng Google có thành kiến với họ.
Với kiến thức chuyên môn của chúng tôi về tối ưu hóa công cụ tìm kiếm (SEO) Và lượng dữ liệu khổng lồ của Ahrefs, chúng tôi muốn xem liệu chúng tôi có thể xác định bất kỳ sự thiên vị nào từ Google hay không bằng cách xem xét dữ liệu cho các trang web tin tức Bảo thủ và Tự do phổ biến. Nếu bạn không quen thuộc với Ahrefs, chúng tôi là một trong những SEO các công cụ có dữ liệu lớn nghiêm túc về web.
Google thực hiện hàng trăm chỉnh sửa đối với các thuật toán xếp hạng của mình mỗi năm. Hầu hết chúng không được chú ý vì chúng nhỏ, nhưng thường xuyên, có một bản cập nhật “cốt lõi” lớn ảnh hưởng đến một tỷ lệ lớn kết quả tìm kiếm. Khi Google cho chúng tôi biết ngày của những cập nhật này, chúng tôi nhận thấy rằng chúng tôi có thể tìm kiếm sự thiên vị bằng cách nghiên cứu lưu lượng truy cập không phải trả tiền đến các trang tin tức Tự do và Bảo thủ nổi tiếng trước và sau những cập nhật này.
Ví dụ: đây là lưu lượng tìm kiếm không phải trả tiền ước tính đến Fox News kể từ năm 2015. Mỗi dòng đại diện cho Bản cập nhật cốt lõi của Google:
Tuy nhiên, việc xem xét dữ liệu này cho một trang web không cho chúng tôi biết nhiều điều, vì vậy chúng tôi đã làm như vậy và đối với các trang tin tức Bảo thủ và Tự do hàng đầu. Chúng tôi đã lấy những thứ này từ Xếp hạng thiên vị phương tiện trên AllSides (xếp hạng thiên vị trái và phải). Đây là danh sách các trang web đó:
Các trang tin tức thận trọng:
- New York Post
- Nơi ẩn náu cuối cùng
- Báo cáo Drudge
- Người liên bang
- Sổ đăng ký Quận Cam
- Đại Kỷ Nguyên
- Washington Times
- Mạng truyền thanh Christian
- Đánh giá quốc gia
- Thị trấn
- Chương trình Mark Levin
- Chương trình Rush Limbaugh
- Breitbart
- Newsmax
- Lợi ích quốc gia
- Gateway Pundit
- RedState
- PJ Phương tiện truyền thông
- Giám khảo Washington
- Tin tức Fox
- Christian Today
- Zero Hedge
- Người gọi hàng ngày
- TheBlaze
- Dây hàng ngày
Các trang tin tức tự do:
- Vox
- Tin tức Hoa Kỳ & Báo cáo Thế giới
- Các bài viết washington
- CNN
- Nhộn nhịp
- NBC Tin tức
- Hollywood Reporter
- thời LA
- Tin tức yahoo
- Al Jazeera
- Đá lăn
- HuffPost
- The Verge
- Thời báo New York
- ABC Tin tức
- THỜI GIAN
- CBS Địa phương
- Người giám hộ
- Bloomberg
- NPR
- CBS Tin tức
- Đại Tây Dương
- Politico
- Univision
Trước khi chúng ta đi đến kết quả, tôi nên giới thiệu một chút về dữ liệu Ahrefs. Chúng tôi có hàng trăm triệu cụm từ tìm kiếm và lượng lớn dữ liệu dòng nhấp chuột. Chúng tôi sử dụng dữ liệu này để ước tính lưu lượng truy cập không phải trả tiền bằng cách xem xét tất cả các truy vấn khác nhau mà mọi người tìm kiếm, vị trí mà trang web chiếm trong kết quả tìm kiếm và nơi người dùng nhấp vào. Đối với Bản cập nhật cốt lõi, chúng tôi quyết định xem xét lưu lượng truy cập khi bắt đầu Bản cập nhật cốt lõi của Google và lưu lượng truy cập 14 ngày sau đó. Điều này giúp Google có thời gian để triển khai các thay đổi đối với các trung tâm dữ liệu khác nhau của họ. Nó cũng cho chúng tôi thời gian để dữ liệu của chúng tôi phản ánh những thay đổi.
Dữ liệu của chúng tôi được chuẩn hóa theo nghĩa là khối lượng được tính trung bình trong 12 tháng, do đó, dữ liệu này chủ yếu mang tính thời vụ, với các cuộc bầu cử là ngoại lệ vì không phải diễn ra hàng năm. Chúng tôi cũng sẽ không sớm thấy các câu chuyện hoặc chủ đề tìm kiếm mới hơn, nhưng chúng tôi nên chọn bất kỳ tìm kiếm phổ biến nào và dữ liệu dòng nhấp có liên quan sau đó.
Từ năm 2015 đến nay, chúng tôi nhận thấy sự sụt giảm lưu lượng truy cập trung bình cho các trang web tin tức hàng đầu trong mỗi danh mục trong thời gian Google Core Update.
Tổng lưu lượng truy cập thận trọng giảm: -2,65%
Tổng lưu lượng truy cập tự do giảm: ‑1,78%
Những con số này thực sự rất giống nhau và không có ý nghĩa thống kê, vì chúng tôi đang tính đến lưu lượng truy cập của 50 trang web và xem xét trong khoảng thời gian 6 năm. Trước cuộc bầu cử cuối cùng vào năm 2016, tác động lên cả hai hạng mục gần như ngang nhau. Trước cuộc bầu cử năm 2020, nếu bạn nhìn vào kết quả từ năm trước hoặc lâu hơn, bạn sẽ thấy rằng tác động gần như ngang nhau cho cả hai danh mục, với bản cập nhật gần đây nhất có vẻ tốt hơn cho các trang web Bảo thủ.
Nếu chúng ta xem xét các điểm dữ liệu riêng lẻ, cả các trang web tin tức Bảo thủ và Tự do đều thấy những tác động tích cực và tiêu cực trong mỗi một trong những Bản cập nhật cốt lõi này của Google. Mỗi ô vuông bên dưới đại diện cho các trang web hàng đầu trong mỗi danh mục và tôi sẽ nhắc lại rằng mỗi bản cập nhật đều có người thắng và người thua cho cả hai danh mục. Thông thường, việc một trang web thắng hay thua trong một bản cập nhật cốt lõi liên quan nhiều đến chất lượng của nó hơn bất kỳ thứ gì khác.
Mặc dù chúng tôi không thể kết luận từ dữ liệu này rằng không có sự thiên vị trong kết quả tìm kiếm của Google, nhưng chúng tôi có thể nói rằng trong vòng 6 năm qua, chúng tôi không thấy bất kỳ sự thiên vị mới nào được giới thiệu trong các Bản cập nhật cốt lõi của Google.
Có một sự thiên vị lưu lượng truy cập?
Một trong những điều nổi bật với chúng tôi là các trang web Tự do chắc chắn nhận được nhiều lưu lượng truy cập hơn các trang web Bảo thủ.
Bây giờ câu hỏi là, tại sao lại như vậy? Điều này có cho thấy xu hướng tiềm ẩn trước tập dữ liệu từ khóa của chúng tôi không? Hãy cùng tìm hiểu xem liệu chúng ta có thể giải thích sự khác biệt về lưu lượng truy cập hay không.
Lượng nội dung
Khi nhìn vào số lượng trang được lập chỉ mục, các nguồn tin của Đảng Tự do có hơn 8 trang được lập chỉ mục so với các nguồn tin của Đảng Bảo thủ. Trên thực tế, biểu đồ gần giống với biểu đồ ở trên về tỷ lệ lưu lượng truy cập. Kết quả là, các trang tin tức Tự do hàng đầu thường có nhiều cơ hội xếp hạng cho những thứ khác nhau hơn các trang tin tức Đảng Bảo thủ hàng đầu.
Lưu lượng truy cập được gắn thương hiệu và không có thương hiệu
Lưu lượng truy cập được gắn thương hiệu cho CNN và Fox News cũng gần giống nhau, có nghĩa là một số lượng người tương tự đang đặc biệt tìm kiếm chúng trong tìm kiếm không phải trả tiền. Tuy nhiên, lưu lượng truy cập có thương hiệu chiếm một tỷ lệ nhỏ hơn CNNLà lưu lượng truy cập tổng thể, có thể là vì họ chỉ đơn giản là có nhiều nội dung hơn. CNN có ~ 2,5 lần số trang được lập chỉ mục như Fox News, vì vậy họ có nhiều cơ hội xếp hạng cho những thứ khác nhau hơn.
Các giải thích khác cho sự khác biệt lưu lượng
Chỉ với dữ liệu tìm kiếm của Google, thật khó để xác định rõ ràng lý do tại sao các trang web Tự do nhận được nhiều lưu lượng truy cập hơn các trang web Bảo thủ. Có thể những người Bảo thủ có xu hướng sử dụng Google ít hơn. Cũng có thể những người Bảo thủ nhận được nhiều tin tức hơn từ TV, ứng dụng hoặc mạng xã hội hơn Google. Tất cả những điều này có thể đúng, nhưng nếu không có dữ liệu bổ sung, những tuyên bố này không thể được xác nhận và chỉ là phỏng đoán.
Nhiều cách khác mà chúng tôi có thể đã tìm kiếm sự thiên vị
Nếu chúng ta xem xét các ví dụ cụ thể về truy vấn, tôi chắc chắn rằng chúng ta sẽ tìm thấy những gì dường như là ví dụ về sự thiên vị. Vấn đề với việc sử dụng các ví dụ riêng lẻ là có sự thiên vị cố hữu từ người thực hiện phân tích. Dữ liệu phức tạp và bạn cần một cách tốt để xác định xem các trang web và nội dung có liên quan đến các truy vấn cụ thể hay không. Thật không may, điều này sẽ khó khăn và cực kỳ chủ quan, đó là lý do tại sao chúng tôi chọn không theo đuổi con đường này.
Chúng tôi cũng có thể xem xét dữ liệu liên kết hoặc liên kết từ các trang web khác đến các trang tin tức này. Một lần nữa, tôi không nghi ngờ rằng dữ liệu này bị sai lệch vì các trang web phổ biến hơn và xếp hạng cao hơn với nhiều trang hơn sẽ có xu hướng nhận được nhiều liên kết hơn một cách tự nhiên. Chúng tôi đã chứng minh điều này trong nghiên cứu tăng trưởng backlink của chúng tôi.
Chúng tôi có thể đã xem xét các ví dụ cụ thể về các cụm từ tìm kiếm do Google đề xuất thông qua hệ thống tự động điền của họ, nhưng chúng tôi đã biết rằng họ xóa nhiều cụm từ phủ định khỏi các kết quả này. Một lần nữa, điều này đã là thành kiến, và sẽ rất khó để chứng minh bất kỳ thành kiến ác ý nào ở đây.
Suy nghĩ cuối cùng
Có một sự thiên vị cố hữu trong mọi thứ. Mặc dù dữ liệu của chúng tôi cho thấy rằng Nội dung cập nhật cốt lõi của Google dường như không thiên vị theo cách này hay cách khác trong vài năm qua, chúng tôi vẫn không thể tự tin nói rằng không có sự thiên vị nào ở nơi khác trong hệ thống của Google.
Có câu hỏi về dữ liệu này? Ping tôi trên Twitter.
The post Google có thiên vị đối với các trang web tin tức cụ thể không? appeared first on Google Entity Stacking.
from Google Entity Stacking https://googleentitystacking.com/google-co-thien-vi-doi-voi-cac-trang-web-tin-tuc-cu-the-khong/
via google entity stacking
Dịch vụ tạo Google Entity Stacking chuẩn nhất ✅ Social index > 90% ✅ Có hỗ trợ khai báo Schema chuẩn cho website ✅ 09 6666 4361
https://googleentitystacking.com/
#googleentitystacking #googlestack #seoentity #dịchvụtạogoogleentity #dịch_vụ_tạo_google_entity #dichvutaogoogleentity #dich_vu_tao_google_entity