Chống truy cập bằng font chữ
Ngày cập nhật: 2021-01-30 | Số lần xem: 7500 | Số từ: 86 | Phân loại: Crawler
Tìm kiếm
Ví dụ điển hình là trên trang 58.com, cùng một số điện thoại có thể xuất hiện dưới nhiều dạng ký tự khác nhau mỗi khi tải lại trang. Điều này xảy ra do mối quan hệ ánh xạ giữa các ký tự và font chữ được thay đổi ngẫu nhiên sau mỗi lần tải. Dưới đây là hai ví dụ minh họa cho cùng một số điện thoại nhưng được mã hóa bằng hai bộ font chữ hoàn toàn khác nhau.
|
|
Mỗi chuỗi trông hoàn toàn khác nhau, nhưng thực chất chúng đều đại diện cho cùng một dãy số điện thoại. Đây là kỹ thuật phổ biến mà các trang web sử dụng để chống lại các chương trình thu thập dữ liệu tự động. Với cách làm này, robot sẽ khó có thể nhận diện chính xác nội dung cần thu thập nếu không giải mã được mối liên hệ giữa các ký tự và con số thật.