Tiêu dùng h5 để đọc ghi dữ liệu

digi2936

Tiểu thương mới
Tham gia
9 Tháng sáu 2019
Bài viết
82
Điểm tương tác
0
lúc làm cho việc mang Deep Learning, bạn chuẩn bị python là gì tinh thần khiến việc sở hữu đủ dòng dữ liệu khác nhau: ảnh, số, text.... Tiêu dùng CSDL quan hệ với vẻ khá thừa mứa bởi để đào tạo chúng ta cần 1 bảng dữ liệu đã được phẳng hóa ko còn kết liên chỉ mục tới bảng khác nữa. Trong bài này mình bàn đến chuẩn định dạng file HDF5 để lưu trữ, đọc dữ liệu.

Đặc điểm của HDF5 là:

thuận lợi san sớt vì nó ở dạng file mà !
truy tốc độ cao và tiết kiệm dung lượng lưu trữ
Đa nền tảng, thư viện thao tác HDF5 với phổ quát tiếng nói như C/C++, Java, Python, Golang....
ko ngừng kích thước
Lưu biểu lộ định dạng cộng sở hữu dữ liệu !
sở hữu Python, Deep Learning, độc giả dữ liệu dạng mảng, ma trận Numpy hay dạng dictionary vào ra HDF5 rất dễ dàng.

Keras lưu hệ số weights những node sau lúc đào tạo vào file hd5.

Line 4: lưu cấu trúc model ra file model.json
Line 6: lưu weight ra model.h5
thời kỳ đọc ngược lại từ file vào Keras model như sau

Lưu bổ các dữ liệu ảnh vào h5
Mình đang sở hữu một Công trình nghịch sẽ kêu gọi cộng sách học lập trình c đồng (anh đi qua, chị đi lại) mỗi người vẽ vài chữ số trong khoảng 0 đến 9 để đào tạo thay thế cho bộ chữ số MNIST. Ban đầu khiêm tốn là vậy, sau đó theo như anh Vũ Hữu Tiệp gợi ý nhờ mọi người vẽ ký tự chữ mẫu tiếng Việt. Bộ dữ liệu này cũng san sớt lại.

Vấn đề đặt ra là làm sao lưu được các ảnh chữ số vào 1 mảng chứ không lưu ra từng file png nhỏ lẻ. Phần giao diện màn hình tôi đang vẽ giờ bằng SketchApp. Song song sở hữu đó, tôi thí nghiệm lấy một số ảnh từ dữ liệu MNIST, rồi lưu lại vào h5 xem sao. Chạy thử vận dụng này ban sơ là ghi vào h5, sau đấy đọc ra trong khoảng h5 rồi vẽ bằng MatplotLib khoảng 15 ảnh.

Rút ra được hai điểm:

h5 với thể lưu đa dạng dataset có cấu trúc khác nhau. Cứ đặt tên riêng từng dataset là sẽ ghi vào và lấy ra được
dataset mang thể ghi thêm (append) những bản ghi mới, miễn sao phải đúng cấu trúc
Chú ý line 16 h5f.create_dataset(dataset_name, data=small_set, maxshape=(100, 28, 28))
Tôi khai báo thêm lựa chọn maxshape=(100, 28, 28) để cho phép dataset với thể lưu đến 100 ảnh. Ko mang lựa chọn này, bạn sẽ không thể bổ xung dữ liệu thêm vào dataset sẵn sở hữu.

Bổ xung thêm dữ liệu vào h5

Xem thêm =>> https://mindx.edu.vn/blog/post/top-ngon-ngu-lap-trinh-cho-tre-em-thong-dung-nhat-hien-nay

Line 13: chỉnh lại kích thước, nới rộng ra bằng đúng kích thước dữ liệu sẽ thêm vào
Line 14: khoanh vùng dữ liệu tính từ điểm cuối và có kích thước bằng dữ liệu thêm vào, sau đấy gán dữ liệu cần thêm vào vùng này...

h5 hỗ trợ đọc ghi xong xong từ phổ biến process
Đây là 1 chức năng rất nhu yếu của h5. Ví như không sở hữu nó, thì các tác vụ xử lý song song (parallel) lúc đọc ghi vào ổ cứng sẽ biến thành tuần tự hết.
Tôi chưa có điều kiện thí điểm trong hôm này, để mai đây lúc hệ thống nhận dữ liệu đóng góp từ cộng đồng tối sẽ thực hiện

45692902022_9f6ce14a41_k.jpg
 

Bình luận bằng Facebook

Bên trên