BÀI TOÁN NỘI SUY VÀ MẠNG NƠRON RBF

Trong luận án chúng tôi đề xuất một thuật toán lặp hai pha huấn luyện mạng nội suy RBF. Pha thứ nhất xác định tham số độ rộng cho các hàm cơ sở bán kính sao cho các trọng số tầng ra được tìm nhờ phép lặp xác định điểm bất động của một ánh xạ co trong pha sau. Phân tích toán học và kết quả thực nghiệm cho thấy thuật toán có những ưu điểm vượt trội so với những thuật toán thông dụng: dùng được khi số mốc nội suy lớn (hàng chục ngàn mốc), dễ ước lượng sai số huấn luyện, thời gian huấn luyện ngắn, tính tổng quát cũng tốt hơn và dễ song song hoá. Trong trường hợp bài toán nội suy có mốc cách đều, thay cho khoảng cách Euclide, chúng tôi dùng khoảng cách Mahalanobis thích hợp và cải tiến thuật toán hai pha thành thuật toán một pha. Phân tích toán học và kết quả thực nghiệm cho thấy thuật toán này cải thiện đáng kể chất lượng mạng so với thuật toán hai pha cả về thời gian huấn luyện và tính tổng quát. Đối với bài toán thời gian thực, đặc biệt là bài toán động, chúng tôi đề xuất kiến trúc mạng địa phương. Mạng này chia miền xác định thành các miền con chứa số mốc nội suy tương đối bằng nhau, nhờ phương pháp phỏng theo thuật toán xây dựng cây k-d quen biết. Sau đó dùng thuật toán huấn luyện hai pha để huấn luyện mạng RBF trên mỗi miền con và ghép chúng lại theo ý tưởng nội suy spline. Phân tích toán học và kết quả thực nghiệm cho thấy chất lượng mạng có nhiều ưu điểm nổi trội.

Trong 30 năm gần đây. Mạng nơron nhân tạo là cách tiếp cận tốt để khắc phục những nhược điểm trên. Mô hình đầu tiên về mạng nơron nhân tạo được McCelland và Pit (1943) đề xuất để nhận dạng mẫu. Rosenblatt (1953) và Widrow (1960) đã xây dựng các perceptron một tầng theo mô hình này, với các luật học sửa lỗi và bình phương tối thiểu. Việc nghiên cứu tiếp theo bị chững lại gần một thập niên do nhận xét của Minsky và Papett(1969) về các nhược điểm của perceptron một tầng. Đến giữa những năm 1980 mạng MLP được nghiên cứu và ứng dụng lại nhờ thuật toán lan truyền ngược sai số (Rumelhart và McCelland 1986; Parker 1985) và trở thành công cụ mạnh để xấp xỉ hàm nhiều biến. Tuy vậy, mạng MLP có thời gian huấn luyện lâu, chất lượng mạng tùy thuộc vào hiệu quả giải bài toán cực trị và đến nay chưa có phương pháp tốt nào để xác định kiến trúc đủ tốt cho mạng. Hơn nữa chủ yếu nó chỉ dùng để xấp xỉ hàm chứ không bảo đảm có thể giải được bài toán nội suy.

Powell (1987) đề xuất dùng các hàm cơ sở bán kính để giải quyết bài toán nội suy nhiều biến [49]. Kỹ thuật này được Broomhead và Low (1988) giới thiệu như là mạng nơron [16]. Mạng RBF với hàm cơ sở bán kính có thể xem là dạng lai của các phương pháp học dựa trên mẫu (k-lân cận gần nhất và hồi quy trọng số địa phương) và mạng nơron MLP. Như mạng nơron MLP, hàm nội suy của mạng xác định từ dữ liệu huấn luyện sau khi học, chất lượng mạng tùy thuộc vào thuật toán huấn luyện. Mạng RBF giống với các phương pháp học dựa trên mẫu ở chỗ hàm nội suy là tổ hợp tuyến tính của các hàm RBF, các hàm này chỉ có ảnh hưởng địa phương nên có thể xử lý chúng mà không ảnh hưởng nhiều lên toàn miền xác định.

Mạng RBF chủ yếu dùng để xấp xỉ hàm (mà nội suy là bài toán riêng). Ưu điểm của mạng RBF là thời gian huấn luyện nhanh và luôn đảm bảo hội tụ đến cực trị toàn cục của sai số trung bình phương. Việc xác định tâm, số hàm cơ sở thế nào là tốt vẫn là bài toán mở. Trường hợp số dữ liệu huấn luyện ít (Looney khuyên là nhỏ hơn 200 [38]) thì có thể lấy các mốc nội suy là tâm hàm RBF ở tầng ẩn, mạng này có thể cho nghiệm đúng của hệ phương trình nội suy nên gọi là mạng nội suy RBF. Khi số mốc nhiều, do các hạn chế trong kỹ thuật giải hệ phương trình tuyến tính, nên các phương pháp xây dựng mạng và huấn luyện hiện có vẫn tốn thời gian và hiệu quả chưa cao. Mặc dù so với mạng MLP thì việc huấn luyện chúng vẫn nhanh và dễ hơn nhiều. Đến nay cùng với mạng MLP, mạng RBF tỏ ra là một phương pháp hiệu quả và được ứng dụng rộng rãi để nội suy và xấp xỉ hàm nhiều biến.

Thuật toán huấn luyện mạng có vai trò rất quan trọng, nó ảnh hưởng trực tiếp đến tính hội tụ và tổng quát của mạng. Trong những năm gần đây đã có nhiều tác giả đề xuất cải tiến thuật toán huấn luyện mạng RBF. Như N. Benoudjit và các cộng sự (2002) đã cải tiến bằng cách tối ưu tham số độ rộng bán kính. M. Lazaro và cộng sự (2003) đề xuất thuật toán mới để tăng tốc độ hội tụ. K.Z Mao và cộng sự (2005) đưa ra cách chọn số nơron tầng ẩn dựa trên cấu trúc dữ liệu để tăng tính tổng quát của mạng. Ta thấy rằng hầu hết những thuật toán này vẫn xác định trọng số tầng ra theo phương pháp Gradient hoặc biến thể của nó. Thời gian huấn luyện lâu, chưa ước lượng được sai số. Khi số lượng dữ liệu lớn sẽ gặp nhiều khó khăn.

Tải về miễn phí bản đầy đủ luận văn tại địa chỉ:

https://www.file-upload.com/0592pbmup7n4

Tác giả

Đặng Thị Thu Hiền

Chuyên ngành

Khoa học máy tính

Mã số

62 48 01 01

Đánh giá

Chưa có đánh giá nào.

Hãy là người đầu tiên đánh giá “BÀI TOÁN NỘI SUY VÀ MẠNG NƠRON RBF”

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *