Mạng Nơ-ron: Cơ bản về huấn luyện mạng nơ-ron

5 min read

Training neural network

Để tạo ra một bộ não nhân tạo, chúng ta có thể xây dựng một mạng nơ-ron, có thể chứa hàng triệu nơ-ron và hàng tỷ kết nối giữa chúng. Hiện nay, một số mạng nơ-ron đủ nhanh và mạnh để thực hiện một số nhiệm vụ tốt hơn cả con người, như chơi cờ vua hoặc dự báo thời tiết!

Ví dụ về huấn luyện một mạng nơ-ron

Giả sử tôi quản lý một hồ bơi và muốn dự đoán số lượng người sẽ đến vào tuần tới để sắp xếp đủ nhân viên cứu hộ. Một cách đơn giản là vẽ biểu đồ số lượng người bơi và nhiệt độ (độ F) mỗi ngày trong vài tuần qua. Sau đó, chúng ta tìm kiếm một mô hình trong biểu đồ đó để dự đoán. Máy tính thực hiện điều này bằng cách sử dụng hồi quy tuyến tính.

Chúng ta bắt đầu bằng cách vẽ một đường thẳng ngẫu nhiên trên biểu đồ, sao cho nó phù hợp với các điểm dữ liệu. Để tối ưu hóa, chúng ta tính khoảng cách giữa đường thẳng và mỗi điểm dữ liệu, cộng tất cả lại để biết lỗi. Mục tiêu của hồi quy tuyến tính là điều chỉnh đường thẳng để làm cho lỗi nhỏ nhất có thể, tức là đường thẳng phù hợp nhất với dữ liệu.


Chúng ta có thể sử dụng đường thẳng này để dự đoán số lượng người bơi ở bất kỳ nhiệt độ nào, nhưng có những phần không hợp lý. Ví dụ, những ngày rất lạnh có số lượng người bơi âm, trong khi những ngày quá nóng lại có quá nhiều người so với sức chứa của hồ bơi. Để có kết quả chính xác hơn, chúng ta có thể xem xét thêm các yếu tố khác như độ ẩm, biến đồ thị 2D thành 3D. Khi đó, đường hồi quy tốt nhất sẽ trở thành một mặt phẳng hồi quy.

Về cơ bản, bằng cách kết nối nhiều neuron đơn giản với các trọng số, mạng nơ-ron có thể học cách giải quyết các vấn đề phức tạp, nơi mà đường hồi quy tốt nhất trở thành một hàm đa chiều phức tạp.

Đào tạo mạng nơ-ron: Dữ liệu đầu vào

Hãy cung cấp cho John Green-bot một mạng nơ-ron chưa được huấn luyện. Trong ví dụ này, lớp đầu vào của mạng nơ-ron sẽ nhận các đặc trưng như nhiệt độ, độ ẩm, mưa, v.v. Và lớp đầu ra sẽ dự đoán số lượng người bơi sẽ đến hồ bơi.

Chúng ta sẽ không lo lắng về việc thiết kế kiến trúc của mạng nơ-ron của John Green-bot ngay bây giờ. Hãy chỉ tập trung vào các trọng số thôi. Anh ấy sẽ bắt đầu, như mọi khi, bằng cách đặt các trọng số thành những số ngẫu nhiên, giống như đường ngẫu nhiên trên biểu đồ mà chúng ta đã vẽ trước đó. Nhưng lần này, không chỉ là một đường ngẫu nhiên. Vì chúng ta có rất nhiều đầu vào, nên có rất nhiều đường được kết hợp lại để tạo thành một hàm lớn và phức tạp. Tổng thể, hàm của mạng nơ-ron này giống như một hình dạng đa chiều kỳ lạ mà chúng ta không thực sự có tên gọi.

Quy trình

Để huấn luyện mạng nơ-ron này, chúng ta sẽ bắt đầu bằng cách cung cấp cho John Green-bot một loạt các số liệu từ 10 ngày qua tại bể bơi, vì đây là những ngày mà chúng ta cũng biết được số lượng người tham dự. Chúng ta sẽ bắt đầu với một ngày, khi nhiệt độ là 80 độ Fahrenheit, độ ẩm 65% và không mưa (chúng ta sẽ biểu thị điều này bằng 0). Các nơ-ron sẽ thực hiện chức năng của chúng bằng cách nhân các đặc trưng với trọng số, cộng các kết quả lại với nhau, và truyền thông tin đến các lớp ẩn cho đến khi nơ-ron đầu ra có được câu trả lời.

John Green-bot: Có 145 người ở hồ bơi!

Lỗi xảy ra

Giống như trước đây, có sự khác biệt giữa đầu ra của mạng nơ-ron và số lượng người thực tế tại bể bơi – được ghi nhận là 100 người. Vì chúng ta chỉ có một nơ-ron đầu ra, sự khác biệt 45 người này là lỗi.

Tuy nhiên, trong một số mạng nơ-ron, lớp đầu ra có thể có nhiều nơ-ron. Vì vậy, sự khác biệt giữa câu trả lời dự đoán và câu trả lời đúng không chỉ là một con số. Trong những trường hợp này, lỗi được biểu diễn bằng cái gọi là hàm mất mát. Tiến tới, chúng ta cần điều chỉnh trọng số của mạng nơ-ron để lần sau khi chúng ta cung cấp cho John Green-bot các đầu vào tương tự, kết quả toán học và đầu ra cuối cùng của nó sẽ chính xác hơn.

Về cơ bản, chúng ta cần John Green-bot học từ những sai lầm của mình, giống như khi chúng ta nhấn nút để giám sát việc học của nó khi nó có chương trình perceptron. Nhưng điều này phức tạp hơn vì mạng nơ-ron phức tạp hơn. Để giúp mạng nơ-ron học, các nhà khoa học và nhà toán học đã nghĩ ra một thuật toán gọi là lan truyền ngược lỗi, hoặc chỉ đơn giản là lan truyền ngược.

Reference

https://curiositystream.com/crashcourse

https://ant.ncc.asia/post.php?post=15303

Avatar photo

Leave a Reply

Your email address will not be published. Required fields are marked *