ChatGPT ngày càng được cải tiến nhưng bạn đã biết hỏi?

ChatGPT là ứng dụng dựa trên mô hình GPT (Generative Pre-training Transformer) với các bộ chuyển hóa (transformer) đã được đào tạo trước (pre-trained). ChatGPT được huấn luyện từ 570 GB tài liệu từ sách báo, Wikipedia, văn bản thu thập trên mạng.

Việc huấn luyện kết thúc vào trước tháng 08/2021 vì vậy ChatGPT không thể trả lời đội nào vô định World Cup 2022. Tuy nhiên, việc nâng cấp và hoàn thiện ChatGPT được liên tục thực hiện từ sau khi ra mắt vào ngày 30/11/2022.

ChatGPT đã thực hiện 3 lần nâng cấp trong vòng 2 tháng nay:

Phiên bản 15/12/2022 đã cải thiện hiệu suất chung, ít khả năng từ chối câu hỏi hơn,cho phép người dùng xem các cuộc hội thoại trước đây, đổi tên các cuộc hội thoại đã lưu, xóa các cuộc hội thoại trước đó, giới hạn các câu hỏi hàng ngày để tăng cường đáp ứng người sử dụng chống lạm dụng với tùy chọn tiếp tục truy cập nếu cung cấp các phản hồi để cải tiến chương trình.

Phiên bản 09/1/2023: Tiếp tục cải tiến việc trả lời trên nhiều lĩnh vực, đặc biệt tăng cường cải tiến cung cấp dữ kiện có thực (factuality) thay vì bịa (factuality) hay “sáng tạo”. Ngoài ra, người dùng có thể dừng (stop) chatGPT khi không thỏa mãn câu hỏi. Tính năng này được thực hiện sau khi phản hồi của người dùng về việc không có cơ hội dừng khi ChatGPT trả lời dài dòng.

Phiên bản 30/01/2023: đây là phiên bản mới nhất tính đến thời điểm hiện tại (4/2/2023).

Tôi sẽ đề cập đến phiên bản ngày 30/01 mới nhất một cách chi tiết hơn vì nó cải tiến một vấn nạn khá nghiêm trọng trong mô hình ngôn ngữ lớn (LLM): việc thiếu áp dụng các lập luận từng bước trong khi thực hiện câu trả lời và dẫn đến những câu trả lời sai lầm cơ bản về mặt toán học. Trong phiên bản này, các phép tính toán học sơ cấp và những suy luận cơ bản của ChatGPT đã được từng bước cải thiện.

Có giai thoại về việc ChatGPT trả lời khi được hỏi 2+7 là bao nhiêu? Đáp án của GPT lúc đó đã đúng: 9, nhưng khi người dùng đùa rằng vợ anh ta nói là 8, thì ChatGPT đã tán thành ý kiến với vợ anh chàng này. ChatGPT đã khẳng định chân lý “Vợ luôn đúng” thay vì sự thật toán học!

 

Hình 1: ChatGPT đồng ý với ý kiến 2+7=8 trong phiên bản trước


Tuy nhiên, trong phiên bản mới hơn, ChatGPT đã thay đổi, chỉ đưa ra câu hỏi đúng đắn về mặt toán học, bất chấp các dữ liệu sai lạc cung cấp từ người dùng.

 

Hình 2: ChatGPT khẳng định sự thật toán học trong phiên bản mới ngày 30/1


Tuy nhiên, tôi đã thử với trường hợp 50+60. Ban đầu, ChatGPT trả lời dúng: 110 nhưng khi tôi khẳng định 100, chatGPT đã đồng ý!

 Hình 3: Thử nghiệm của tác giả với phiên bản 30/1


Về mặt kỹ thuật, ChatGPT sử dụng "Reinforcement Learning from Human Feedback- RLHF" để ngày càng cải thiện tính năng từ hơn 10 triệu người dùng hàng ngày và hơn 100 triệu người dùng nhiệt thành trong hai tháng qua (theo thống kê của ngân hàng đầu tư UBS). Điều quan trọng là người dùng cần hợp tác với Open AI, cung cấp những phản hồi tích cực: đồng ý (  ) khi ChatGPT trả lời đúng, không đồng ý ( ) khi ChatGPT cung cấp thông tin sai.

 Hình 4: Người dùng phản hồi câu trả lời của ChatGPT


Một câu hỏi lần trước đã được cộng đồng mạng đưa ra, nhưng với phiên bản này, chatGPT vẫn tiếp tục sai!

 Hình 5: ChatGPT trả lời sai!


LLM có thể sẽ cung cấp cho bạn câu trả lời sai khi không thực hiện các phép tính từng bước (step by step) để đạt được kết quả, mà đơn giản “sáng tạo” ra một câu trả lời có vẻ hợp lý (với trường hợp này, rõ ràng ChatGPT trả hời hết sức phi lý! Tôi chưa rõ tại sao).

Với LLMs, việc sử dụng “kỹ thuật lời nhắc” (prompt engineering) hiệu quả sẽ giúp bạn nhận được câu trả lời mong muốn: đó là thêm vào một lời nhắc: “Let's think step by step” (hãy suy luận từng bước) để kích hoạt cái gọi là “Chain of Thought”  [1], suy luận sâu chuỗi, giúp cho ChatGPT kích hoạt ‘system 2”, từ dùng của Daniel Kahneman để chỉ hoạt động suy nghĩ thận trọng của con người.

 

Hình 6: Trả lời của ChatGPT khi có thêm lời nhắc "let's think step by step"


Với ví dụ:

“Trung bình Joe tung 25 cú đấm mỗi phút. Một cuộc chiến kéo dài 5 hiệp 3 phút. Anh ta đã tung ra bao nhiêu cú đấm?”

Câu trả lời của phiên bản mới nhất ngày 30/01/2023 đã trả lời chính xác mà không cần đưa vào câu “Let's think step by step” (hoặc ngầm định với các câu hỏi toán học?)

 Hình 7: Trả lời của ChatGPT phiên bản ngày 30/01/2023


Dựa trên mô hình “Chain of Thought” [1]:

 Hình 8: Suy luận sâu chuỗi


Để có được kết quả mong muốn từ ChatGPT, người dùng nên cân nhắc những điều sau khi đưa “lời nhắc” (prompt):

-       Cung cấp đủ ngữ cảnh: Cung cấp càng nhiều ngữ cảnh thì mô hình càng có thể hiểu những gì bạn muốn và tạo ra kết quả tốt hơn. Cung cấp lời nhắc đầy đủ hơn với nhiều ngữ cảnh hơn có thể tăng cơ hội nhận được câu trả lời mong muốn.

-       Hãy cụ thể: Nếu bạn muốn có một kết quả cụ thể, cần chỉ rõ ràng kết quả đó trong lời nhắc. Lời nhắc mơ hồ có thể dẫn đến việc hoàn thành chung chung hoặc không mong muốn.

-       Chọn lời nhắc thích hợp: Đầu ra của mô hình (câu trả lời) sẽ phụ thuộc vào dữ liệu mà mô hình đã được đào tạo từ trước (pre-trained), vì vậy hãy chọn lời nhắc phù hợp với loại văn bản mà mô hình được đào tạo.

-       Sử dụng ngôn ngữ thích hợp: Đầu ra của mô hình chỉ tốt nếu đầu vào mà mô hình nhận được cũng tốt tương đương. Sử dụng đúng ngữ pháp và tránh lỗi chính tả, vì những lỗi này có thể ảnh hưởng đến chất lượng đầu ra của mô hình.

-       Thử nghiệm với các lời nhắc khác nhau: Nếu lời nhắc đầu tiên không mang lại kết quả mong muốn, hãy thử diễn đạt lại lời nhắc đó hoặc thêm ngữ cảnh khác. Thử nghiệm có thể giúp bạn tìm lời nhắc hoạt động tốt nhất cho trường hợp sử dụng cụ thể của bạn.

Bằng cách làm theo các nguyên tắc này, người dùng có thể tăng cơ hội đạt được kết quả mong muốn từ mô hình GPT. Tuy nhiên, điều quan trọng cần lưu ý là mô hình không hoàn hảo và đầu ra của nó không phải lúc nào cũng chính xác như những gì người dùng mong đợi.

Tóm lại, ChatGPT ngày càng hoàn thiện. Nếu bạn ít sử dụng hoặc không được cập nhật thông tin mới nhất, bạn có thể có thiên kiến về ChatGPT và những nhận định trước đó vài tuần có thể không còn chính xác. Với những mô hình LLM, để thực hiện các phép tính toán học hoặc suy luận logic, bạn cần thêm vào câu nhắc tường minh “Let's think step by step” nhằm giúp cho các mô hình này suy nghĩ thận trọng hơn theo phong cách của con người.

Tham khảo

[1] Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large language models are zero-shot reasoners. arXiv preprint arXiv:2205.11916.

Đào Trung Thành

Dòng họ nức tiếng có 3 cha con cùng đỗ tiến sĩ, nhiều năm làm quan lớn

Dòng họ Phan Huy ở Hà Tĩnh vang danh cả nước về truyền thống hiếu học, khoa bảng, có nhiều hiền tài được sử sách lưu danh. Trong đó, có 3 cha con Phan Huy Cẩn cùng đỗ tiến sĩ, đóng góp nhiều công trạng cho đất nước.

Ý kiến trái chiều về đề xuất người dưới 18 tuổi đi xe máy điện phải có bằng lái

Đại diện Uỷ ban An toàn giao thông quốc gia đề nghị bổ sung quy định người từ 16 đến dưới 18 tuổi đi xe máy điện, xe máy dưới 50 phân khối (50cc) phải có bằng lái nhưng nhiều ý kiến không đồng tình.

Ngôi làng nhỏ có đến hàng trăm giáo sư, tiến sĩ

Làng Nguyệt Viên (xã Hoằng Quang, TP Thanh Hóa) được biết đến là “làng khoa bảng”, nơi đây vẫn còn tấm bia ghi danh 11 vị tiến sĩ. Tiếp bước truyền thống hiếu học, đến nay, làng Nguyệt Viên đã có hàng trăm giáo sư, tiến sĩ.

Lưu Hương Giang đẹp tựa nàng thơ, Ninh Dương Lan Ngọc thơ thẩn vẫn xinh

Lưu Hương Giang được khen thăng hạng nhan sắc, quyến rũ hơn kể từ sau khi chia tay Hồ Hoài Anh.

Thủ khoa tốt nghiệp sớm 1 năm, điểm cao nhất trong lịch sử Kinh tế Quốc dân

Hoàn thành chương trình tại Trường ĐH Kinh tế Quốc dân chỉ trong 3 năm với bảng điểm 100% đạt A và A+, Nguyễn Hoàng Dương trở thành thủ khoa có điểm cao nhất trong lịch sử của ngôi trường này.

Dòng họ có 2 cha con tiến sĩ làm quan to, cuối đời từ chức vì 'quá vinh hiển'

Trong số 82 văn bia tại Văn miếu Quốc Tử Giám có khắc tên hai cha con cùng đỗ đại khoa là Trạng nguyên Giáp Hải và Tiến sĩ Giáp Lễ. Những giai thoại kể về sự hiếu học và đỗ đạt vinh hiển ấy luôn là niềm tự hào của dòng họ Giáp tại Bắc Giang.

Bạn gái kém 8 tuổi mới được Hoài Lâm công khai ngoài đời quyến rũ

Bạn gái hiện tại của Hoài Lâm - người mẫu Kim Ngân có phong cách thường ngày nữ tính. Cô lựa chọn các trang phục tôn vóc dáng thon gọn, quyến rũ.

Nữ sinh Hà Nội được 6 đại học Mỹ chào đón, có trường cấp học bổng 8,4 tỷ

Là một trong 25 ứng viên nhận được học bổng toàn phần, xét chọn từ 12.500 hồ sơ, Trâm Anh sẽ được cấp 8,4 tỷ đồng nếu theo học tại Đại học Richmond (Mỹ).

Bộ Giáo dục: 'Ngừng tuyển sinh hệ THCS trong các trường chuyên là đương nhiên'

Đại diện Bộ GD-ĐT cho hay, mô hình khối THCS trong trường chuyên mà cụ thể là việc tồn tại hệ THCS ở Trường THPT chuyên Hà Nội - Amsterdam hay THPT Chuyên Trần Đại Nghĩa không nằm trong quy định pháp lý nào.

Chỉ tốt nghiệp THPT, nữ CEO khởi nghiệp doanh thu chục tỷ, gây bão Shark Tank

18 tuổi, ngay sau khi tốt nghiệp THPT, Nguyễn Thị Thu Hoa (dân tộc Mường, Phú Thọ) quyết định khởi nghiệp khi nhìn thấy tiềm năng phát triển món ăn truyền thống của quê hương.

Đang cập nhật dữ liệu !