Rsync là công cụ đồng bộ hóa dữ liệu mạnh mẽ trên các hệ điều hành Linux và Unix, giúp bạn sao chép, quản lý tệp hiệu quả, đặc biệt là khi làm việc với nhiều máy chủ và lượng dữ liệu lớn. Với khả năng chỉ sao chép những thay đổi thay vì toàn bộ tệp, Rsync tiết kiệm thời gian và băng thông đáng kể. Bài viết này sẽ hướng dẫn chi tiết và tỉ mỉ các trường hợp sử dụng Rsync, từ đồng bộ hóa nội bộ, qua mạng, đến tự động hóa với cronjob, giúp bạn làm chủ công cụ này một cách hiệu quả nhất.

1. Cài đặt Rsync

1.1. Kiểm tra cài đặt Rsync

Trước tiên, hãy kiểm tra xem hệ thống của bạn đã có Rsync hay chưa. Chạy lệnh sau để kiểm tra:

--inplace

6.2. Đồng bộ hóa với nhiều tệp nhỏ

Khi đồng bộ hóa nhiều tệp nhỏ, sử dụng tùy chọn –whole-file để không chia tệp thành các khối dữ liệu, giúp tăng tốc độ đồng bộ hóa.

rsync -av --whole-file /local/source/ /local/destination/

7. Đồng bộ hóa bằng cronjob

Để tự động hóa quá trình đồng bộ hóa, bạn có thể tích hợp Rsync vào cronjob để thực hiện theo lịch trình.

7.1. Tạo cronjob chạy Rsync mỗi ngày

Mở tệp cronjob bằng lệnh:

crontab -e

Thêm dòng sau để đồng bộ hóa mỗi ngày vào lúc 2 giờ sáng:

0 2 * * * rsync -av /local/source/ /local/destination/

8. Kiểm tra trước khi thực hiện đồng bộ

Nếu bạn muốn kiểm tra trước những gì sẽ thay đổi mà không thực hiện, sử dụng tùy chọn –dry-run.

8.1. Kiểm tra trước khi đồng bộ

rsync -av --dry-run /local/source/ /local/destination/

Điều này sẽ hiển thị các tệp sẽ được sao chép, xóa, hoặc thay đổi mà không thực sự thực hiện.


Kết luận

Rsync là công cụ mạnh mẽ và linh hoạt cho việc đồng bộ hóa dữ liệu trên các hệ thống Linux và Unix. Từ việc đồng bộ nội bộ đến sao chép dữ liệu giữa các máy chủ từ xa, Rsync cung cấp nhiều tùy chọn để phù hợp với mọi nhu cầu. Bằng cách nắm vững các trường hợp sử dụng và tùy chọn trong Rsync, bạn có thể tối ưu hóa quy trình quản lý và sao lưu dữ liệu của mình một cách hiệu quả.