Mạng Nơ-ron (Neural Network)
Mạng nơ-ron là một chương trình máy tính hoạt động theo cách được lấy cảm hứng từ mạng nơ-ron tự nhiên trong não bộ.
Giới thiệu
Mạng nơ-ron (Neural Network) là một chương trình máy tính hoạt động theo cách được lấy cảm hứng từ mạng nơ-ron tự nhiên trong não bộ. Mục tiêu của các mạng nơ-ron nhân tạo như vậy là thực hiện các chức năng nhận thức như giải quyết vấn đề và học máy.
Nền tảng lý thuyết của mạng nơ-ron được phát triển vào năm 1943 bởi nhà sinh lý học thần kinh Warren McCulloch thuộc Đại học Illinois và nhà toán học Walter Pitts thuộc Đại học Chicago.
Năm 1954, Belmont Farley và Wesley Clark thuộc Viện Công nghệ Massachusetts (MIT) đã thành công trong việc chạy mạng nơ-ron đơn giản đầu tiên.
Điểm hấp dẫn chính của mạng nơ-ron là khả năng mô phỏng kỹ năng nhận dạng mẫu (pattern recognition) của não bộ. Trong số các ứng dụng thương mại của khả năng này, mạng nơ-ron đã được sử dụng để đưa ra quyết định đầu tư, nhận dạng chữ viết tay, và thậm chí phát hiện bom.
Cấu trúc và hoạt động
Một đặc điểm phân biệt của mạng nơ-ron là kiến thức về lĩnh vực của nó được phân phối trong toàn bộ mạng thay vì được viết rõ ràng vào chương trình.
Kiến thức này được mô hình hóa dưới dạng các kết nối giữa các phần tử xử lý (nơ-ron nhân tạo) và các trọng số thích ứng (adaptive weights) của mỗi kết nối này. Mạng sau đó học thông qua việc tiếp xúc với các tình huống khác nhau.
Lớp đầu vào (input layer) của các nơ-ron nhân tạo nhận thông tin từ môi trường, và lớp đầu ra (output layer) truyền đạt phản hồi; giữa các lớp này có thể có một hoặc nhiều 'lớp ẩn' (hidden layers) - không tiếp xúc trực tiếp với môi trường - nơi hầu hết quá trình xử lý thông tin diễn ra.
Đầu ra của mạng nơ-ron phụ thuộc vào các trọng số của các kết nối giữa các nơ-ron ở các lớp khác nhau. Mỗi trọng số chỉ ra tầm quan trọng tương đối của một kết nối cụ thể.
Nếu tổng của tất cả các đầu vào có trọng số mà một nơ-ron cụ thể nhận được vượt quá một giá trị ngưỡng (threshold) nhất định, nơ-ron đó sẽ gửi tín hiệu đến mỗi nơ-ron mà nó được kết nối trong lớp tiếp theo.
Huấn luyện mạng nơ-ron
Hai sửa đổi của mạng nơ-ron truyền thẳng (feedforward) đơn giản này giải thích cho sự phát triển của các ứng dụng, như nhận dạng khuôn mặt.
Thứ nhất, một mạng có thể được trang bị cơ chế phản hồi, được gọi là thuật toán lan truyền ngược (back-propagation algorithm), cho phép nó điều chỉnh các trọng số kết nối ngược lại qua mạng, huấn luyện nó để phản hồi với các ví dụ đại diện.
Thứ hai, mạng nơ-ron hồi quy (recurrent neural networks) có thể được phát triển, liên quan đến các tín hiệu tiến hành theo cả hai hướng cũng như bên trong và giữa các lớp, và các mạng này có khả năng xử lý các mẫu liên kết phức tạp hơn nhiều.
Việc huấn luyện mạng nơ-ron thường bao gồm học có giám sát (supervised learning), trong đó mỗi ví dụ huấn luyện chứa các giá trị của cả dữ liệu đầu vào và đầu ra mong muốn.
Ngược lại, một số mạng nơ-ron được huấn luyện thông qua học không giám sát (unsupervised learning), trong đó mạng được cung cấp một tập hợp dữ liệu đầu vào và được giao mục tiêu khám phá các mẫu - mà không được cho biết cụ thể phải tìm kiếm gì.
Học sâu (Deep Learning)
Mạng nơ-ron đang ở tuyến đầu của điện toán nhận thức (cognitive computing), được dự định để công nghệ thông tin thực hiện một số chức năng tâm thần tiên tiến hơn của con người.
Các hệ thống học sâu (deep learning) dựa trên mạng nơ-ron đa lớp và cung cấp năng lượng cho, ví dụ, khả năng nhận dạng giọng nói của trợ lý di động Siri của Apple.
Kết hợp với sức mạnh tính toán tăng trưởng theo cấp số nhân và các tập hợp khổng lồ của dữ liệu lớn (big data), mạng nơ-ron học sâu ảnh hưởng đến sự phân phối công việc giữa con người và máy móc.
📖 Nguồn tham khảo: https://www.britannica.com/technology/neural-network