[Google DeepMind] - Tìm hiểu sâu về phân đoạn hình ảnh y tế với mã tương tác
phi tuyến tính → Để cung cấp cho mô hình sức mạnh để tính toán hàm phi tuyến tính
Đơn điệu → Để ngăn không tạo thêm tối thiểu cục bộ
Hình ảnh trung bình → Một chức năng đang giảm đơn điệu
Hình ảnh bên phải → Một chức năng không đơn điệu
- Về mặt lý thuyết, có thể mô hình hóa bất kỳ chức năng nào chỉ với hai lớp, điều này có nghĩa là chúng ta thực sự không cần phải có một mô hình sâu hơn 2 lớp.
- Nhưng lợi ích của việc sử dụng mạng nơ ron sâu thực sự là hiệu quả của nút. Có thể ước tính các hàm phức tạp với độ chính xác cao hơn khi chúng ta có NN nhỏ hơn nhưng sâu hơn.
b. Không có ràng buộc trong các khu vực tích cực.
Tuy nhiên, nó vẫn có thể được sử dụng vì chúng không làm giảm độ dốc trong khi thực hiện lan truyền ngược (đạo hàm là 1). Tôi không biết rằng lớp kích hoạt ReLU () đã được tạo để khắc phục vấn đề độ dốc biến mất.
Vì hai mạng kia khá giống nhau từ mạng này, chúng ta hãy thực hiện mạng đầu tiên. Tôi chưa bao giờ thực sự thực hiện phân đoạn với mạng được kết nối đầy đủ, nhưng tôi nghĩ rằng điều này sẽ rất thú vị. Ngoài ra, xin lưu ý do sử dụng tập dữ liệu khác nhau, tôi sẽ thêm một lớp nữa để phù hợp với dữ liệu của chúng tôi. Tuy nhiên, cấu trúc chung của mạng là tương tự nhau.
Hình chữ nhật màu đỏ → Lớp được kết nối đầy đủ (Hình ảnh đầu vào được vector hóa)
Hình chữ nhật màu cam → Lớp tối đa mềm
** LƯU Ý ** Do giới hạn phần cứng, tôi đã phải thay đổi một nửa kích thước bộ lọc cho cả hai lớp chập, cũng như kích thước lô (2).
Hình ảnh bên trái → Mặt nạ nhị phân được tạo từ mạng
- * LƯU Ý **: Tôi không muốn lưu trữ Dữ liệu y tế tư nhân trên github của mình, vì tôi có thể phá vỡ chính sách sử dụng dữ liệu của họ. Vì vậy, mã này không thể được chạy trực tuyến.
- Với hy vọng làm cho thử nghiệm này minh bạch hơn, tôi đã tải tất cả đầu ra lệnh của mình lên Github của mình, nếu bạn muốn xem thử, vui lòng bấm vào đây.
Không có nhận xét nào