Neural Network With Matlab #2.5: Cấu trúc mạng nơ-ron (TT)

Thảo luận trong 'TRÍ TUỆ NHÂN TẠO' bắt đầu bởi Cu Bo, 14 Tháng bảy 2016.

Chia sẻ trang này

Lượt xem: 1,483

  1. Cu Bo

    By:Cu Boin: 14 Tháng bảy 2016
    Cu Bo

    Tham gia ngày:
    25 Tháng bảy 2014
    Bài viết:
    13
    Đã được thích:
    8
    Neural Network With Matlab #2.5:
    Cấu trúc mạng nơ-ron (TT)

    [​IMG]

    Mạng đa lớp , đa nơ-ron


    Một mạng có thể có nhiều lớp. Mỗi lớp đều có một ma trận weight W, một vector bias b, và một vector đầu ra a. Để có thể phân biệt giữa các ma trận weight, vector đầu ra ... của các lớp, ta thêm chỉ số lớp ở phần mũ của các biến số quan tâm. Ta có thể thấy các ký hiệu cho các lớp được thể hiện trong hình sau:

    [​IMG]

    Mạng trên thể hiện có R{1} đầu vào, S{1} nơ-ron ở lớp 1. S{2} nơ-ron cho lớp 2... Điểm khác nhau chung của các lớp chính là số nơ-ron khác nhau. Chỉ có một đầu vào với mỗi nơ-ron.

    Chú ý: Đầu ra của lớp trước sẽ là đầu vào của lớp tiếp theo. Như vậy, lớp 2 có thể được xem như mạng đơn lớp với S{1} đầu vào, S{2} nơ-ron, và ma trận weight W{2} có kích thước S{2}xS{1}. Đầu vào của lớp 2 là a{1}; đầu ra là a{2}. Lúc này chúng ta đã xác định được các vector và ma trận của lớp 2, ta có thể xem nó như một mạng đơn lớp. Cách áp dụng này có thể được dùng cho bất kỳ lớp nào ở trong mạng.

    Các lớp của mạng đa lớp có vai trò khác nhau. Lớp cuối là kết quả đầu ra của mạng được gọi là lớp đầu ra (output layer). Các lớp khác gọi là lớp ẩn (hidden layers). Mạng 3 lớp ở trên có 1 lớp output (lớp 3) và 2 lớp ẩn (lớp 1 và 2). Một số tác giả sẽ cho rằng đầu vào là một lớp, ở đây chúng ta không sử dụng quan điểm này.

    Xét mạng 3 lớp ở trên, ta có thể vẽ lại một cách ngắn gọn hơn:

    [​IMG]
    Mạng nhiều lớp rất mạnh.Ví dụ xét 1 mạng 2 lớp, trong đó lớp 1 có hàm truyền sigmoid và lớp 2 có hàm truyền linear, có thể xấp xỉ một hàm bất kỳ (với số điểm gián đoạn hạn chế). Loại mạng 2 lớp này sẽ được sử dụng nhiều ở phần "Mạng lan truyền ngược"(Backpropagation).

    Ta có thể giả sử đầu ra của lớp thứ 3 là a{3}, cũng chính là đầu ra của mạng 3 lớp ở hình trên. Ta ký hiệu đầu ra này của mạng là y. Ta sẽ sử dụng ký hiệu này cho đầu ra của mạng đa lớp.