Trí Tuệ Nhân Tạo

Trí tuệ nhân tạo (AI) là khả năng của máy tính số hoặc robot được điều khiển bằng máy tính để thực hiện các nhiệm vụ thường được liên kết với các thực thể thông minh.

Giới thiệu

Trí tuệ nhân tạo (AI - Artificial Intelligence) là khả năng của máy tính số hoặc robot được điều khiển bởi máy tính để thực hiện các nhiệm vụ thường được liên kết với các sinh vật thông minh. Thuật ngữ này thường được áp dụng cho dự án phát triển các hệ thống được trang bị các quá trình trí tuệ đặc trưng của con người, như khả năng suy luận, khám phá ý nghĩa, tổng quát hóa, hoặc học hỏi từ kinh nghiệm trong quá khứ.

Kể từ khi được phát triển vào những năm 1940, máy tính số đã được lập trình để thực hiện các nhiệm vụ rất phức tạp - như tìm ra các chứng minh cho các định lý toán học hoặc chơi cờ vua - với độ thành thạo cao. Mặc dù có những tiến bộ liên tục về tốc độ xử lý và dung lượng bộ nhớ của máy tính, nhưng vẫn chưa có chương trình nào có thể sánh được với sự linh hoạt hoàn toàn của con người trên các lĩnh vực rộng hơn hoặc trong các nhiệm vụ đòi hỏi nhiều kiến thức đời thường.

Mặt khác, một số chương trình đã đạt được mức hiệu suất của các chuyên gia và nhà chuyên môn trong việc thực hiện một số nhiệm vụ cụ thể, do đó trí tuệ nhân tạo theo nghĩa hạn chế này được tìm thấy trong các ứng dụng đa dạng như chẩn đoán y tế, công cụ tìm kiếm, nhận dạng giọng nói hoặc chữ viết tay, và chatbot.

Trí thông minh là gì?

Hầu hết mọi hành vi của con người, trừ những hành vi đơn giản nhất, đều được quy cho trí thông minh, trong khi ngay cả những hành vi phức tạp nhất của côn trùng thường không được coi là dấu hiệu của trí thông minh. Vậy sự khác biệt là gì?

Hãy xem xét hành vi của ong bắp cày đào hang, Sphex ichneumoneus. Khi con cái quay về hang với thức ăn, nó đầu tiên đặt thức ăn ở ngưỡng cửa, kiểm tra xem có kẻ xâm nhập bên trong hang không, và chỉ sau đó, nếu an toàn, mới mang thức ăn vào trong. Bản chất thực sự của hành vi bản năng của ong bắp cày được bộc lộ nếu thức ăn bị di chuyển vài inch ra khỏi lối vào hang khi nó đang ở bên trong: khi ra ngoài, nó sẽ lặp lại toàn bộ quy trình mỗi khi thức ăn bị di chuyển.

Trí thông minh - điều rõ ràng vắng mặt trong trường hợp của con ong bắp cày - phải bao gồm khả năng thích ứng với hoàn cảnh mới.

Các nhà tâm lý học thường mô tả trí thông minh của con người không chỉ bởi một đặc điểm mà bởi sự kết hợp của nhiều khả năng đa dạng. Nghiên cứu về AI chủ yếu tập trung vào các thành phần sau của trí thông minh: học tập (learning), suy luận (reasoning), giải quyết vấn đề (problem solving), nhận thức (perception), và sử dụng ngôn ngữ (language).

Học tập (Learning)

Có nhiều hình thức học tập khác nhau được áp dụng cho trí tuệ nhân tạo. Đơn giản nhất là học bằng phương pháp thử và sai (trial and error).

Ví dụ, một chương trình máy tính đơn giản để giải các bài toán chiếu hết trong một nước cờ có thể thử các nước đi ngẫu nhiên cho đến khi tìm được nước chiếu hết. Chương trình sau đó có thể lưu lại lời giải cùng với vị trí để lần sau khi máy tính gặp lại vị trí đó, nó sẽ nhớ lại lời giải.

Việc ghi nhớ đơn giản các mục và quy trình riêng lẻ này - được gọi là học thuộc lòng (rote learning) - tương đối dễ triển khai trên máy tính.

Thách thức hơn là vấn đề triển khai cái gọi là tổng quát hóa (generalization). Tổng quát hóa liên quan đến việc áp dụng kinh nghiệm trong quá khứ vào các tình huống mới tương tự.

Ví dụ, một chương trình học thì quá khứ của các động từ tiếng Anh có quy tắc bằng cách học thuộc lòng sẽ không thể tạo ra thì quá khứ của từ như 'jump' trừ khi chương trình đã được trình bày trước với 'jumped', trong khi một chương trình có khả năng tổng quát hóa có thể học quy tắc 'thêm -ed' cho các động từ có quy tắc kết thúc bằng phụ âm và do đó tạo thành thì quá khứ của 'jump' dựa trên kinh nghiệm với các động từ tương tự.

Suy luận (Reasoning)

Suy luận là rút ra các suy diễn phù hợp với tình huống. Các suy diễn được phân loại thành suy diễn diễn dịch (deductive) hoặc suy diễn quy nạp (inductive).

Ví dụ về suy diễn diễn dịch: 'Fred phải ở trong viện bảo tàng hoặc quán cà phê. Anh ấy không ở quán cà phê; do đó, anh ấy ở trong viện bảo tàng.' Ví dụ về suy diễn quy nạp: 'Các tai nạn trước đây thuộc loại này được gây ra bởi lỗi thiết bị. Tai nạn này cùng loại; do đó, nó có thể được gây ra bởi lỗi thiết bị.'

Sự khác biệt quan trọng nhất giữa các hình thức suy luận này là trong trường hợp diễn dịch, tính đúng đắn của các tiền đề đảm bảo tính đúng đắn của kết luận, trong khi trong trường hợp quy nạp, tính đúng đắn của các tiền đề hỗ trợ kết luận nhưng không đảm bảo tuyệt đối.

Suy luận quy nạp phổ biến trong khoa học, nơi dữ liệu được thu thập và các mô hình dự kiến được phát triển để mô tả và dự đoán hành vi trong tương lai - cho đến khi xuất hiện dữ liệu bất thường buộc phải sửa đổi mô hình.

Suy luận diễn dịch phổ biến trong toán học và logic, nơi các cấu trúc phức tạp của các định lý không thể bác bỏ được xây dựng từ một tập hợp nhỏ các tiên đề và quy tắc cơ bản.

Giải quyết vấn đề (Problem Solving)

Giải quyết vấn đề, đặc biệt trong trí tuệ nhân tạo, có thể được mô tả là một quá trình tìm kiếm có hệ thống thông qua một loạt các hành động có thể để đạt được một mục tiêu hoặc giải pháp được xác định trước.

Các phương pháp giải quyết vấn đề được chia thành phương pháp chuyên dụng và phương pháp tổng quát. Phương pháp chuyên dụng được thiết kế riêng cho một vấn đề cụ thể và thường khai thác các đặc điểm rất cụ thể của tình huống mà vấn đề được đặt trong đó.

Ngược lại, phương pháp tổng quát có thể áp dụng cho nhiều loại vấn đề khác nhau. Một kỹ thuật tổng quát được sử dụng trong AI là phân tích phương tiện-mục đích (means-end analysis) - một quá trình giảm dần từng bước sự khác biệt giữa trạng thái hiện tại và mục tiêu cuối cùng.

Nhận thức (Perception)

Trong nhận thức, môi trường được quét bằng các cơ quan cảm giác khác nhau, thực hoặc nhân tạo, và cảnh được phân tách thành các đối tượng riêng biệt trong các mối quan hệ không gian khác nhau.

Việc phân tích trở nên phức tạp bởi thực tế rằng một đối tượng có thể xuất hiện khác nhau tùy thuộc vào góc nhìn, hướng và cường độ chiếu sáng trong cảnh, và mức độ tương phản của đối tượng với môi trường xung quanh.

Hiện tại, nhận thức nhân tạo đã đủ tiên tiến để cho phép các cảm biến quang học nhận dạng cá nhân và cho phép xe tự hành di chuyển ở tốc độ vừa phải trên đường mở.

Ngôn ngữ (Language)

Ngôn ngữ là một hệ thống các ký hiệu có ý nghĩa theo quy ước. Theo nghĩa này, ngôn ngữ không nhất thiết phải giới hạn ở lời nói. Ví dụ, các biển báo giao thông tạo thành một ngôn ngữ thu nhỏ, theo quy ước ⚠ có nghĩa là 'nguy hiểm phía trước' ở một số quốc gia.

Một đặc điểm quan trọng của ngôn ngữ con người đầy đủ - khác với tiếng chim kêu và biển báo giao thông - là tính sản sinh (productivity). Một ngôn ngữ có tính sản sinh có thể tạo ra vô số các câu khác nhau.

Các mô hình ngôn ngữ lớn (Large Language Models - LLM) như ChatGPT có thể phản hồi trôi chảy bằng ngôn ngữ con người với các câu hỏi và phát biểu. Mặc dù các mô hình như vậy thực sự không hiểu ngôn ngữ như con người mà chỉ chọn các từ có xác suất cao hơn các từ khác, chúng đã đạt đến mức mà khả năng sử dụng ngôn ngữ của chúng không thể phân biệt được với người bình thường.

Học máy (Machine Learning)

Khả năng của mạng nơ-ron (neural networks) trong việc thêm các lớp và do đó xử lý các vấn đề phức tạp hơn đã tăng lên vào năm 2006 với việc phát minh kỹ thuật 'tiền huấn luyện tham lam theo lớp' (greedy layer-wise pretraining).

Sự cải tiến này trong việc huấn luyện mạng nơ-ron đã dẫn đến một loại học máy gọi là 'học sâu' (deep learning), trong đó mạng nơ-ron có bốn lớp trở lên, bao gồm đầu vào ban đầu và đầu ra cuối cùng.

Trong số các thành tựu của học sâu có những tiến bộ trong phân loại hình ảnh, trong đó các mạng nơ-ron chuyên biệt gọi là mạng nơ-ron tích chập (Convolutional Neural Networks - CNN) được huấn luyện trên các đặc trưng tìm thấy trong một tập hợp hình ảnh của nhiều loại đối tượng khác nhau.

Học máy đã tìm thấy ứng dụng trong nhiều lĩnh vực ngoài trò chơi và phân loại hình ảnh. Công ty dược phẩm Pfizer đã sử dụng kỹ thuật này để nhanh chóng tìm kiếm hàng triệu hợp chất có thể trong việc phát triển thuốc điều trị COVID-19 Paxlovid. Google sử dụng học máy để lọc thư rác khỏi hộp thư của người dùng Gmail. Các ngân hàng và công ty thẻ tín dụng sử dụng dữ liệu lịch sử để huấn luyện các mô hình phát hiện các giao dịch gian lận.

Mô hình ngôn ngữ lớn và Xử lý ngôn ngữ tự nhiên (NLP)

Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) liên quan đến việc phân tích cách máy tính có thể xử lý và phân tích ngôn ngữ tương tự như cách con người làm. Để làm điều này, các mô hình NLP phải sử dụng ngôn ngữ học tính toán, thống kê, học máy và các mô hình học sâu.

Các ví dụ nổi bật của NLP hiện đại là các mô hình ngôn ngữ sử dụng AI và thống kê để dự đoán dạng cuối cùng của câu dựa trên các phần hiện có. Trong mô hình ngôn ngữ lớn (Large Language Model - LLM), từ 'lớn' đề cập đến các tham số (parameters), hoặc các biến và trọng số, được mô hình sử dụng để ảnh hưởng đến kết quả dự đoán.

Một mô hình ngôn ngữ phổ biến là GPT-3, được OpenAI phát hành vào tháng 6 năm 2020. Là một trong những LLM đầu tiên, GPT-3 có thể giải các bài toán cấp trung học cũng như tạo các chương trình máy tính. GPT-3 là nền tảng của phần mềm ChatGPT, được phát hành vào tháng 11 năm 2022.

Một vấn đề với LLM là 'ảo giác' (hallucinations): thay vì thông báo cho người dùng rằng nó không biết điều gì đó, mô hình phản hồi bằng văn bản có vẻ hợp lý nhưng không chính xác dựa trên các lời nhắc của người dùng.

Rủi ro và thách thức

AI đặt ra một số rủi ro về hậu quả đạo đức và kinh tế-xã hội. Khi nhiều nhiệm vụ trở nên tự động hóa, đặc biệt trong các ngành như tiếp thị và chăm sóc sức khỏe, nhiều người lao động có nguy cơ mất việc làm.

Hơn nữa, AI có một số thiên kiến (bias) khó khắc phục nếu không có đào tạo phù hợp. Ví dụ, các sở cảnh sát Hoa Kỳ đã bắt đầu sử dụng các thuật toán dự đoán tội phạm để chỉ ra nơi tội phạm có khả năng xảy ra nhất. Tuy nhiên, các hệ thống như vậy dựa một phần vào tỷ lệ bắt giữ, vốn đã cao không cân xứng trong các cộng đồng người da đen.

Quyền riêng tư là một khía cạnh khác của AI khiến các chuyên gia lo ngại. Vì AI thường liên quan đến việc thu thập và xử lý lượng lớn dữ liệu, có nguy cơ dữ liệu này sẽ bị truy cập bởi những người hoặc tổ chức không phù hợp.

Các LLM được đặt tại các trung tâm dữ liệu đòi hỏi lượng điện lớn. Một truy vấn ChatGPT đòi hỏi khoảng 10 lần điện năng so với một tìm kiếm Google.

📖 Nguồn tham khảo: https://www.britannica.com/technology/artificial-intelligence