Search Engine Bots (Crawler) |
Thu thập dữ liệu để lập chỉ mục (index website) cho các công cụ tìm kiếm |
Google (Googlebot), Bingbot, Baidu, v.v. |
Tốt / Trung bình |
✅ Tích cực |
Có thể có |
Tăng pageviews hoặc session ảo trong analytics nếu không lọc bot traffic |
Monitoring Bots |
Giám sát uptime website hoặc kiểm tra bảo mật |
UptimeRobot, Pingdom, SSL Labs, v.v. |
Nhẹ |
✅ Tích cực |
Có thể có |
Có thể tăng nhẹ traffic khi kiểm tra định kỳ |
Scraper Bots |
Thu thập nội dung website trái phép (hình ảnh, mô tả sản phẩm, bài viết, v.v.) |
Bên thứ ba (đối thủ, tool AI, spammer) |
Trung bình đến nặng |
❌ Tiêu cực |
Có |
Tăng traffic không thực (sessions), làm sai bounce rate, thời gian trên site giảm |
Spam Bots |
Gửi form rác, bình luận spam, đăng ký giả, hoặc truy cập lặp |
Spammer, tool tự động |
Nặng |
❌ Tiêu cực |
Có |
Dữ liệu form, số chuyển đổi (conversion), email giả — làm sai lệch tỉ lệ chuyển đổi |
Click Bots / Ad Fraud Bots |
Tự động click quảng cáo để tạo doanh thu giả hoặc gây tổn thất |
Hacker, đối thủ, ad fraud tool |
Rất nặng |
❌ Tiêu cực |
Có nhiều |
Tăng CPC ảo, CTR sai, ngân sách quảng cáo tiêu hao sai cách, ảnh hưởng dữ liệu quảng cáo |
Social Bot / Crawler mạng xã hội |
Lấy preview bài viết (ảnh, tiêu đề, mô tả khi chia sẻ link) |
Facebook (Facebot), Twitterbot, LinkedIn |
Nhẹ |
✅ Tích cực |
Ít hoặc không |
Có thể tạo hit truy cập nhẹ nếu nhiều người chia sẻ link cùng lúc |
Testing Bots |
Kiểm thử chức năng website (QA, automation testing, CI/CD tool) |
Dev nội bộ / công ty |
Tùy theo tần suất |
✅ Trung lập |
Có |
Nếu không tắt tracking trong quá trình test — có thể gây traffic ảo |
AI Bots / Language Model Bots |
Dùng để thu thập dữ liệu cho mô hình AI (đọc content, đánh giá hành vi, v.v.) |
OpenAI, Anthropic, You.com, v.v. |
Đang tăng |
❌ Trung lập |
Có |
Truy cập sâu, có thể tăng pageviews không thực, hoặc khiến tốc độ server chậm |
Malicious Bots (DDoS/Exploit) |
Tấn công DDoS, dò lỗ hổng, tấn công brute-force |
Hacker, botnet |
Cực kỳ nặng |
❌ Rất tiêu cực |
Không chính xác |
Không nhằm mục đích lấy dữ liệu nhưng có thể khiến website ngừng hoạt động hoặc mất dữ liệu |