Những vấn đề liên quan đến MIGRATE dữ liệu trong DSpace

Discussion in 'Tin tức về Dspace' started by Phạm Quang Quyền, Apr 29, 2019.

  1. Phạm Quang Quyền

    Phạm Quang Quyền Administrator Staff Member

    Chú ý: Lưu trữ dữ liệu trên DSpace gồm 02 phần:
    - Các file dữ liệu (tài liệu số) được lưu ở trong mục ASSETSTORE
    - Các siêu dữ liệu (metadata - dublin core) được lưu trên DATABASE.
    Vì vậy, sao lưu và phục hồi là 2 thằng song song
    Sao lưu (nén) thư mục assetstore lại.
    Sao lưu database (lưu ý cùng thời điểm) để siêu dữ liệu trỏ đúng bằng assetstore. Có 100 file thì sẽ có 100 siêu dữ liệu trỏ đúng đến từng file đó - đại loại như vậy.
    Vậy những khi gặp sự cố là gì?
    1. Dữ liệu trên assetstore nhiều hơn so với database
    Mình đang gặp vấn đề này nó làm mất toi 03 ngày nghỉ lễ. Giờ mới ra vấn đề viết ngay
    Còn các phần đằng sau mong rằng anh em có ai gặp vấn đề gì chia sẻ tiếp để dreamlib.vn thực sự là một "SỔ TAY" đúng nghĩa của THƯ VIỆN ĐIỆN TỬ, THƯ VIỆN SỐ tại Việt Nam.
    Cách xử lý của mình:
    1.1. Copy assetstore (thời điểm dữ liệu số nhiều hơn trong database).
    1.2. Đánh chỉ mục lại tí nhé, khá mất thời gian (bình quân 1300 tài liệu số mất khoảng 10 phút - Theo hướng dẫn của anh @Tran huu Trung ) bằng lệnh /dspace/bin/dspace index-discovery
    1.3. Xóa sạch sẽ các bitstream "thừa" - lệch so với siêu dữ liệu bằng lệnh
    /dspace/bin/dspace cleanup -l -v
    CHÚC CÁC BẠN THÀNH CÔNG NẾU GẶP TÌNH HUỐNG NHƯ MÌNH!
    2. Khi có metadata muốn xóa nhưng dữ liệu quá lớn sẽ như thế nào (xóa trên giao diện đồ họa GUI),...

Share This Page