Hiệu suất của hệ thống lưu trữ mảng đĩa trong kết nối máy chủ đơn

Nói chung, đĩa hoặc mảng đĩa có hiệu suất tốt nhất trong một kịch bản kết nối máy chủ duy nhất. Hầu hết các hệ điều hành đều dựa trên hệ thống tệp độc quyền, có nghĩa là hệ thống tệp chỉ có thể được sở hữu bởi một hệ điều hành duy nhất. Nhờ đó, cả hệ điều hành và phần mềm ứng dụng đều tối ưu hóa việc đọc và ghi dữ liệu cho hệ thống lưu trữ đĩa dựa trên đặc điểm của nó. Việc tối ưu hóa này nhằm mục đích giảm thời gian tìm kiếm vật lý và giảm thời gian phản hồi cơ học của đĩa. Các yêu cầu dữ liệu từ mỗi quy trình chương trình được hệ điều hành xử lý, dẫn đến các yêu cầu đọc và ghi dữ liệu được tối ưu hóa và có trật tự cho đĩa hoặc mảng đĩa. Điều này dẫn đến hiệu suất tốt nhất của hệ thống lưu trữ trong thiết lập này.

Đối với mảng đĩa, mặc dù bộ điều khiển RAID bổ sung được thêm vào giữa hệ điều hành và các ổ đĩa riêng lẻ, bộ điều khiển RAID hiện tại chủ yếu quản lý và xác minh các hoạt động chịu lỗi ổ đĩa. Họ không thực hiện việc hợp nhất, sắp xếp lại hoặc tối ưu hóa yêu cầu dữ liệu. Bộ điều khiển RAID được thiết kế dựa trên giả định rằng các yêu cầu dữ liệu đến từ một máy chủ duy nhất, đã được hệ điều hành tối ưu hóa và sắp xếp. Bộ đệm của bộ điều khiển chỉ cung cấp khả năng đệm trực tiếp và tính toán mà không xếp dữ liệu vào hàng đợi để tối ưu hóa. Khi bộ đệm nhanh chóng được lấp đầy, tốc độ sẽ ngay lập tức giảm xuống tốc độ thực tế của hoạt động trên đĩa.

Chức năng chính của bộ điều khiển RAID là tạo một hoặc nhiều đĩa có khả năng chịu lỗi lớn từ nhiều đĩa và cải thiện tốc độ đọc và ghi dữ liệu tổng thể bằng tính năng bộ nhớ đệm trên mỗi đĩa. Bộ đệm đọc của bộ điều khiển RAID tăng cường đáng kể hiệu suất đọc của mảng đĩa khi cùng một dữ liệu được đọc trong một thời gian ngắn. Tốc độ đọc và ghi tối đa thực tế của toàn bộ mảng đĩa bị giới hạn bởi giá trị thấp nhất trong số băng thông kênh máy chủ, tính toán xác minh của CPU điều khiển và khả năng điều khiển hệ thống (công cụ RAID), băng thông kênh đĩa và hiệu suất đĩa (hiệu suất thực tế tổng hợp của tất cả các đĩa). Ngoài ra, sự không khớp giữa cơ sở tối ưu hóa các yêu cầu dữ liệu của hệ điều hành và định dạng RAID, chẳng hạn như kích thước khối của yêu cầu I/O không khớp với kích thước phân đoạn RAID, có thể ảnh hưởng đáng kể đến hiệu suất của mảng đĩa.

Các biến thể hiệu suất của hệ thống lưu trữ mảng đĩa truyền thống trong truy cập nhiều máy chủ

Trong nhiều tình huống truy cập máy chủ, hiệu suất của mảng đĩa giảm so với kết nối máy chủ đơn lẻ. Trong các hệ thống lưu trữ mảng đĩa quy mô nhỏ, thường có một cặp bộ điều khiển mảng đĩa đơn hoặc dự phòng và một số lượng đĩa được kết nối hạn chế, hiệu suất bị ảnh hưởng bởi các luồng dữ liệu không có thứ tự từ nhiều máy chủ khác nhau. Điều này dẫn đến tăng thời gian tìm kiếm đĩa, thông tin đầu và đuôi phân đoạn dữ liệu cũng như sự phân mảnh dữ liệu để đọc, hợp nhất, tính toán xác minh và ghi lại. Do đó, hiệu suất lưu trữ giảm khi có nhiều máy chủ được kết nối.

Trong các hệ thống lưu trữ mảng đĩa quy mô lớn, sự suy giảm hiệu suất khác với các mảng đĩa quy mô nhỏ. Các hệ thống quy mô lớn này sử dụng cấu trúc bus hoặc cấu trúc chuyển mạch điểm chéo để kết nối nhiều hệ thống con lưu trữ (mảng đĩa) và bao gồm bộ đệm dung lượng lớn và mô-đun kết nối máy chủ (tương tự như trung tâm kênh hoặc bộ chuyển mạch) để có nhiều máy chủ hơn trong xe buýt hoặc chuyển mạch kết cấu. Hiệu suất phần lớn phụ thuộc vào bộ đệm trong các ứng dụng xử lý giao dịch nhưng có hiệu quả hạn chế trong các tình huống dữ liệu đa phương tiện. Trong khi các hệ thống con mảng đĩa bên trong trong các hệ thống quy mô lớn này hoạt động tương đối độc lập, một đơn vị logic duy nhất chỉ được xây dựng trong một hệ thống con đĩa đơn. Vì vậy, hiệu suất của một đơn vị logic duy nhất vẫn còn thấp.

Tóm lại, mảng đĩa quy mô nhỏ bị suy giảm hiệu suất do luồng dữ liệu không có thứ tự, trong khi mảng đĩa quy mô lớn với nhiều hệ thống con mảng đĩa độc lập có thể hỗ trợ nhiều máy chủ hơn nhưng vẫn gặp phải những hạn chế đối với các ứng dụng dữ liệu đa phương tiện. Mặt khác, hệ thống lưu trữ NAS dựa trên công nghệ RAID truyền thống và sử dụng giao thức NFS và CIFS để chia sẻ bộ nhớ với người dùng bên ngoài thông qua kết nối Ethernet ít bị suy giảm hiệu suất hơn trong nhiều môi trường truy cập máy chủ. Hệ thống lưu trữ NAS tối ưu hóa việc truyền dữ liệu bằng cách sử dụng nhiều lần truyền TCP/IP song song, cho phép tốc độ chia sẻ tối đa khoảng 60 MB/s trong một hệ thống lưu trữ NAS. Việc sử dụng kết nối Ethernet cho phép dữ liệu được ghi vào hệ thống đĩa một cách tối ưu sau khi được quản lý và sắp xếp lại bởi hệ điều hành hoặc phần mềm quản lý dữ liệu trong máy chủ mỏng. Do đó, bản thân hệ thống đĩa không bị suy giảm hiệu suất đáng kể, giúp việc lưu trữ NAS phù hợp với các ứng dụng yêu cầu chia sẻ dữ liệu.


Thời gian đăng: 17-07-2023