GIỚI THIỆU
Có lẽ cũng không cần giới thiệu nhiều về nhu cầu "giấu diếm" này vì hiện nay có khá nhiều site sử dụng cách quản lý download như vậy và cũng có số lượng cũng nhiều không kém các site mới muốn tìm hiểu và sử dụng nó ;-) Tuy nhiên, có lẽ không thừa nếu như chúng ta tìm hiểu kỹ hơn một chút về lý do sử dụng một chương trình download manager trên website để giấu đường dẫn thực sự đến các file download.
Quản lý băng thông và "tài sản" là 2 lý do chính để sử dụng 1 chương trình quản lý download trên website. Bạn thử tưởng tượng có 1 website cho download nhạc hoặc ebook với 1 mức phí nho nhỏ, nếu mà link để download trực tiếp các file bị lộ tùm lum thì thứ nhất là "lỗ vốn", thứ hai là bandwidth sẽ hết sạch nhanh đến nỗi trước khi bạn kịp hiểu chuyện gì đã xảy ra.
Một số lý do khác cũng "chính đáng" không kém ví dụ như bạn muốn đếm số lần download file; hoặc website của bạn tự upload file của mình lên và các file này lại nằm trong database hoặc được để trong 1 thư mục mà từ ngoài web không đọc được. Trong những trường hợp như vậy, sử dụng 1 chương trình quản lý download trên website sẽ khá tiện lợi.
Tuy nhiên, cũng có vài điều cần chú ý trước khi bạn quyết định sử dụng 1 chương trình quản lý download trên website của mình:
- Tốc độ download sẽ chậm hơn rất nhiều so với download file trực tiếp.
- Server sẽ phải xử lý nhiều công việc hơn so với khi cho phép download file trực tiếp.
- Nếu file được lưu trữ trong database, bạn nên chú ý rằng số lượng kết nối đồng thời vào database là có hạn, trong khi với 1 file có dung lượng lớn, có thể phải mất tới nửa tiếng hoặc hơn để download.
Giả sử bạn có 1 file document.zip trong cùng thư mục với file download.php. Nhưng chỉ mình bạn biết là file document.zip này nằm ở đâu, người khác muốn download thì phải truy cập vào file download.php của bạn. Mã nguồn của file download.php sẽ như sau:
PHP Code:
//file download.php
<?php
$filename = "document.zip";$fp = fopen($filename, "rb");
header("Content-type: application/octet-stream");header("Content-length: " . filesize($filename));
fpassthru($fp);fclose($fp);?>
Đầu tiên, ta mở file document.zip để đọc ở chế độ nhị phân (binary):
PHP Code:
$fp = fopen($filename, "rb");.
PHP Code:
header("Content-type: application/octet-stream");
Đồng thời ta cũng báo cho browser biết dung lượng của file sẽ được tải xuống:
PHP Code:
header("Content-length: " . filesize($filename));
Và cuối cùng là đọc nội dung file và echo lại cho browser download:
PHP Code:
fpassthru($fp);
Lệnh fpassthru($fp); tương đương với 2 lệnh:
PHP Code:
$content = fread($handle, filesize($filename));
echo $content;
PHP Code:
header("Content-length: " . filesize($filename));
PHP Code:
header("Content-type: application/octet-stream");
Lệnh
PHP Code:
header("Content-type: application/octet-stream");
Thử chạy ví dụ trên vài lần, thay thế file document.zip bằng một số file khác nhau (ví dụ file Word, PDF, Excel...) và thử trên vài browser khác nhau, bạn sẽ nhận thấy có vài chỗ hơi khó chịu:
- Browser sẽ mặc định lưu file lên đĩa với tên là download.php. Bạn phải đổi tên file lại cho đúng trước khi mở file ra đọc.
- Trong một số trường hợp, thay vì hỏi save file lên đĩa, browser sẽ mở luôn file (ví dụ chạy Word hoặc Acrobat mở luôn file vừa được download).
PHP Code:
header('Content-disposition: attachment; filename="'.$filename.'"');
Cho tới bây giờ chương trình của chúng ta vẫn còn thô sơ, chúng ta vẫn cần them vào chức năng nữa để chương trình hoàn thiện hơn.
- Cho phép người dùng chọn file để download. Hiện tại chương trình của chúng ta chỉ mới cho phép download 1 file duy nhất.
- Kiểm tra dữ liệu nhập từ người dùng. Đây là một việc luôn nên làm. Chương trình cho phép nguời dùng chọn file để download thì cũng cần nên kiểm tra kỹ kẻo chính file config, file source hoặc file password của bạn bị download thì phiền.
PHP Code:
$filename = isset($_GET['file'])?$_GET['file']:'';
-------------------> BỔ SUNG BÀI VIẾT<--------------------
---------------------------------------------------------------
Kiểm tra dữ liệu nhập: Ta cần kiểm tra các điều kiện sau:
- File có tồn tại và được phép đọc hay không? PHP cung cấp sẵn cho ta 2 hàm ls is_file() và is_readable() để làm việc này: PHP Code:
if ( $filename == "" || !is_file($filename) || !is_readable($filename) ) {
echo "Error: ...";
exit(-1);
} - Tên file có chứa các ký tự đặt biệc hay không? Thường các file
upload sẽ được để trong 1 thư mục riêng. Như vậy tên file chỉ có thể
chứa các ký tự a-z, 0-9, gạch ngang (-), gạch dưới (_), khoảng trắng và
dấu chấm (.). Ta có thể xem như các kỹ tự khác trong tên file là không
hợp lệ. Đoạn mã kiểm tra như sau: PHP Code:
if ( !preg_match('/^[a-z0-9\_\-\. ]*$/i', $filename) ) {
echo "Error: ...";
exit(-1);
}PHP Code:if ( !preg_match('/^[a-z0-9\_\-][a-z0-9\_\-\. ]*$/i', $filename) ) {
echo "Error: ...";
exit(-1);
}
PHP Code:
<?php//các file upload được để trong 1 thư mục riêng$upload_dir = "../upload/";
//lấy tên file cần download từ URL$filename = isset($_GET['file'])?$_GET['file']:'';
//thực hiện quá trình kiểm traif ( !preg_match('/^[a-z0-9\_\-][a-z0-9\_\-\. ]*$/i', $filename) )
|| !is_file($upload_dir.$filename) || !is_readable($upload_dir.$filename) ) {
echo "Loi: Ten file khong hop le hoac file khong ton tai!";
exit(-1);
} //end if
//mở file để đọc với chế độ nhị phân (binary)$fp = fopen($upload_dir.$filename, "rb");
//gởi header đến cho browserheader('Content-type: application/octet-stream');header('Content-disposition: attachment; filename="'.$filename.'"');header('Content-length: ' . filesize($upload_dir.$filename));
//đọc file và trả dữ liệu về cho browserfpassthru($fp);fclose($fp);
Tới đây xem như chương trình của chúng ta xem như là đã hoàn chỉnh. Tuy nhiên, có thể bạn sẽ còn một thắc mắc nho nhỏ: ngoài kiểu dữ liệu application/octet-stream thì còn kiểu dữ liệu nào khác không? và mặc định thì PHP sẽ dùng kiểu dữ liệu gì để trả về cho browser?
Mặc định PHP sẽ trả về dữ liệu kiểu text/html cho browser. Một số kiểu dữ liệu tương ứng với các kiểu file thông dụng:
.GIF: image/gif
.JPG: image/jpeg
.PNG: image/png
.WAV: audio/wav
.MP3: audio/mpeg3
.DOC: application/msword
.PDF: application/pdf
Tuỳ vào kiểu của dữ liệu trả về mà browser có thể sẽ có những cách ứng khác nhau. Ví dụ nếu dữ liệu trả về là file ảnh thì browser sẽ hiển thị luôn, nếu là file nhạc thì browser sẽ gọi WMP lên để play, nếu là file PDF thì chương trình Acrobat sẽ được gọi...
Kiểu application/octet-stream để chỉ dữ liệu nhị phân (binary) chung chung. Nếu bạn chỉ muốn browser download và save file thì bạn chỉ cần trả về kiểu dữ liệu application/octet-stream là đủ.
Vậy thì nảy sinh 1 vấn đề nữa: tìm danh sách các kiểu dữ liệu tương ứng với từng loại file ở đâu? Google là trợ thủ đắt lực của bạn ;-) Hoặc bạn có thể xem mục "CÁC TÀI LIỆU THAM KHẢO" ở cuối bài viết.
VÀI LỜI NGỎ TRƯỚC KHI KẾT THÚC
Sau khi đọc hết bài viết, chắc bạn cũng thấy rằng việc viết 1 chương trình quản lý download file cho website cũng không phải là quá phức tạp. Cũng như tiêu đề của bài viết đã nói "Việt một chương trình download manager đơn giản", chương trình của chúng ta khá đơn giản nhưng cũng có đủ các chức năng cơ bản cần thiết. Các chức năng "tiền download" hoặc "hậu download" bạn có thể dễ dàng tự phát triển thêm tuỳ vào nhu cầu của bạn, ví dụ như tăng biến đếm số lần download của file, kiểm tra login trước khi cho download. Bạn chỉ cần chú ý một số điểm sau khi viết 1 chương trình download manager:
- Để các file upload lên trong 1 thư mục riêng để dễ bề quản lý. Tốt nhất là để trong 1 thư mục không thể truy cập trực tiếp được từ Web mà chỉ có thể đọc bởi chương trình PHP của bạn.
- Kiểm tra kỹ tên file được người dùng nhập vào.
- Mở file để đọc ở chế độ nhị phân (binary). Bạn tham khảo thêm các tham số của hàm fread trong PHP.
- Trả về kiểu dữ liệu của file và các thông số cần thiết khác qua lệnh header().
- Nếu không thật sự cần thiết thì nên để đường dẫn download trực tiếp thay vì dùng download manager, vì như vậy sẽ download nhanh hơn và server ít phải xử lý thêm nhiều công việc.
Blog tổng hợp những kinh nghiệm được học, áp dụng và chia sẻ