css-font-anti-web-crawler - nổ hũ 28

css-font-anti-web-crawler - nổ hũ 28

F88 Casino Download Game Bài

Chống truy cập bằng font chữ

Ngày cập nhật: 2021-01-30 | Số lần xem: 7500 | Số từ: 86 | Phân loại: Crawler

Tìm kiếm

Ví dụ điển hình là trên trang 58.com, cùng một số điện thoại có thể xuất hiện dưới nhiều dạng ký tự khác nhau mỗi khi tải lại trang. Điều này xảy ra do mối quan hệ ánh xạ giữa các ký tự và font chữ được thay đổi ngẫu nhiên sau mỗi lần tải. Dưới đây là hai ví dụ minh họa cho cùng một số điện thoại nhưng được mã hóa bằng hai bộ font chữ hoàn toàn khác nhau.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
> python3
Python 3.8.5 (default, Jul 28 2020, 12:59:40)
[GCC 9.3.0] trên nền tảng Linux
Nhập "help", "copyright", "credits" hoặc "license" để biết thêm thông tin.
>>> s = ""
>>> s
'\ue842\ue76d\uf65a\ue76d\ue2ff\ue76d\ue2ff\ue0d0\ue2ff\uee66\uf65a'
>>>
>>>
>>> s2 = ""
>>> s2
'\uf64f\ueeae\uf778\ueeae\ue9c1\ueeae\ue9c1\uf450\ue9c1\ue049\uf778'
>>>

Mỗi chuỗi trông hoàn toàn khác nhau, nhưng thực chất chúng đều đại diện cho cùng một dãy số điện thoại. Đây là kỹ thuật phổ biến mà các trang web sử dụng để chống lại các chương trình thu thập dữ liệu tự động. Với cách làm này, robot sẽ khó có thể nhận diện chính xác nội dung cần thu thập nếu không giải mã được mối liên hệ giữa các ký tự và con số thật.

comments powered by Disqus
Built with Hugo
Theme Stack thiết kế bởi Jimmy