文章分類Article

典型詐欺車手的責任?可以減刑的事由?AI有辦法一次就答對嗎?

典型詐欺車手的責任?可以減刑的事由?AI有辦法一次就答對嗎?
為了讓AI在沒有任何提示的狀態下,一次性的正確回答,我試了整整兩天。
車手的問題提問簡單,但答案很複雜。剛好可以用來測試AI的功能。
AI最容易在兩個地方出錯。
第一是遺漏詐欺危害防制條例。
原因是AI的訓練模型是舊資料,常常忽視最近法律修訂和實務見解的更替,就算有上網搜尋功能,也可能因為資料過多,內容矛盾而產生誤判。
第二是洗錢罪的法條搞錯。
以前車手犯洗錢罪那一條實務見解分歧,後來統一見解為第14條。
但AI常常回答錯誤,出錯的原因和前面一樣。
經過兩天的磨合,我終於建立一條給AI的SOP指令,可稱為法學七步驟。
過程中我發現指令要非常明確,但又不能太死板,如何拿捏這個界線呢?最後我得出一個結論。
就是當AI正確回答時問他怎麼辦到的?
如何確認自己的答案是正確的?然後要求他把剛剛的思考流程寫成指令。
不過有時AI會像真的人一樣,自已以為知道正確答案就憑感覺自信回答,忽視我辛苦建立的sop,沒有去遵守,或者偷懶跳過幾個步驟。我建立法學七步驟的目的就是為了防止過於自信的錯誤啊。
不過大體而言,幾乎都能一次性的正確回答車手的問題了。
分享我對於各類AI的使用心得。
gemini pro2.5
遵守指令程度中等。正確率高。有死不認錯的毛病。但遣詞用字能力極高,法律系研究生以上程度。
像自負但出席率高的法律系研究生。
gpt5
遵守指令程度高。正確率中等。有死不認錯的毛病。遣詞用字能力中等,叫他不要像做筆記一樣回答問題,還是不改。
像偷懶但聰明出席率高的法律系大學生。
claude
遵守指令程度極高。正確率高。遣詞用字能力中等,但至少不是很筆記型回答。最大問題是處理過於複雜問題,例如回答車手的問題有機率直接當機,還有每日詢問額度低。
像認真聽話但身體不好常請假的法律系大學生。
grok4
遵守指令程度極高。正確率高。遣詞用字能力高。最大問題比別人貴,還有每日詢問額度中等,高於claude但低於gemini gtp。
像認真聽話但偶爾請假還要給他額外福利才工作的法律系研究生。
 
TOP