Giải pháp hiệu quả tăng Traffic cho website
Traffic Exchange Site

Lấy nội dung của các phần tử trang với PHP

By
Thời gian vừa qua tôi khá bận nên cũng ít có bài viết mới trên Blog này, nay công việc cũng đã tạm ổn nên tôi sẽ dành nhiều thời gian chăm chút cho Blog hơn. Và trong bài viết hôm nay tôi sẽ giới thiệu đến các bạn một thư viện PHP dùng để lấy nội dung của các phần tử trang.
Hiểu nôm na là một trang web có các phần tử khác nhau và bạn muốn lấy nội dung của 1 phần tử nào đó, chẳng hạn một table, thì chúng ta có thể dùng jQuery hay cURL để lấy nhưng với thư viện dưới đây, mọi chuyện sẽ trở nên đơn giản hơn.
Thư viện mà tôi muốn giới thiệu đến chính là PHP Simple HTML DOM Parser. Đây là một thư viện được đánh giá khá cao với những tính năng hữu ích, đặc biệt là khả năng parser dữ liệu rất tốt. Các bạn có thể download tại đây.

1, Cách sử dụng

Cách sử dụng của thư viện này tương đối dễ dàng, nếu bạn nào quen với jQuery sẽ nắm bắt thư viện này nhanh hơn. Dưới đây là một ví dụ dễ hiểu để các bạn làm quen

Các bạn thấy thế nào? Cũng khá dễ hiểu đó chứ. Sau khi tải thư viện này về, giải nén thư mục, các bạn sẽ tìm thấy rất nhiều ví dụ từ đơn giản đến phức tạp khi sử dụng thư viện này.

2, Các phương thức (hàm) chính

Sau khi tìm hiểu và làm quen với vài ví dụ, tôi nhận thấy có các phương thức (hàm) chính sau đây:

a) Tạo đối tượng phần tử trang (DOM)


b) Tìm kiếm phần tử (phương thức quan trọng nhất)

Đó là hàm find(), chức năng và cú pháp tương tự như hàm find() trong jQuery. Bạn có thể tìm tất cả các thẻ hoặc từng thẻ riêng biệt với những tham số thích hợp.

c) Truy xuất đến thuộc tính của đối tượng


Với ví dụ trên các bạn có thể thấy chúng ta hoàn toàn lấy được các thuộc tính của đối tượng (sau khi đã được tìm kiếm) như thẻ <a href=””></a> thì chứa thuộc tính href hay thẻ <img src=”” /> có chứa thuộc tính src

d) Đọc nội dung phần tử trang

  • plaintext : Lấy nội dung (text) từ trang web
  • innertext : Chỉ lấy nội dung bên trong thẻ (tag), tương tự như hàm text() trong jQuery.
  • outertext : Lấy cả thẻ và nội dung bên trong, tương thự như hàm html() trong jQuery.

e) Thao tác với các phần tử trang web

Với sự linh hoạt của các tính năng trên, bạn có thể thao tác với nội dung từng phần tử hoặc cả trang web với ví dụ dưới đây


Chúc các bạn làm việc hiệu quả với thư viện này. Thân ái!


Loading...