Rsync là công cụ đồng bộ hóa dữ liệu mạnh mẽ trên các hệ điều hành Linux và Unix, giúp bạn sao chép, quản lý tệp hiệu quả, đặc biệt là khi làm việc với nhiều máy chủ và lượng dữ liệu lớn. Với khả năng chỉ sao chép những thay đổi thay vì toàn bộ tệp, Rsync tiết kiệm thời gian và băng thông đáng kể. Bài viết này sẽ hướng dẫn chi tiết và tỉ mỉ các trường hợp sử dụng Rsync, từ đồng bộ hóa nội bộ, qua mạng, đến tự động hóa với cronjob, giúp bạn làm chủ công cụ này một cách hiệu quả nhất.
Trước tiên, hãy kiểm tra xem hệ thống của bạn đã có Rsync hay chưa. Chạy lệnh sau để kiểm tra:
--inplace
Khi đồng bộ hóa nhiều tệp nhỏ, sử dụng tùy chọn –whole-file để không chia tệp thành các khối dữ liệu, giúp tăng tốc độ đồng bộ hóa.
rsync -av --whole-file /local/source/ /local/destination/
Để tự động hóa quá trình đồng bộ hóa, bạn có thể tích hợp Rsync vào cronjob để thực hiện theo lịch trình.
Mở tệp cronjob bằng lệnh:
crontab -e
Thêm dòng sau để đồng bộ hóa mỗi ngày vào lúc 2 giờ sáng:
0 2 * * * rsync -av /local/source/ /local/destination/
Nếu bạn muốn kiểm tra trước những gì sẽ thay đổi mà không thực hiện, sử dụng tùy chọn –dry-run.
rsync -av --dry-run /local/source/ /local/destination/
Điều này sẽ hiển thị các tệp sẽ được sao chép, xóa, hoặc thay đổi mà không thực sự thực hiện.
Rsync là công cụ mạnh mẽ và linh hoạt cho việc đồng bộ hóa dữ liệu trên các hệ thống Linux và Unix. Từ việc đồng bộ nội bộ đến sao chép dữ liệu giữa các máy chủ từ xa, Rsync cung cấp nhiều tùy chọn để phù hợp với mọi nhu cầu. Bằng cách nắm vững các trường hợp sử dụng và tùy chọn trong Rsync, bạn có thể tối ưu hóa quy trình quản lý và sao lưu dữ liệu của mình một cách hiệu quả.