作者 sdfsonic (S音)標題 Re: [洽特] RisuAI的簡易上手指南時間 Thu Aug 14 21:51:04 2025
借串問一下.各位同好覺得甚麼模型表現的最好,我現在是用Gemini Pro 2.5作為主要跟
輔助模型(外掛用小惡魔).其實跑起來已經算是非常滿意了(文筆.劇情.色度)
只是速度上還是不能算是很快.等一次回應大概要等個30秒-1分鐘
所以我在想啊.其實我願意每個月花點錢訂閱更好的模型.只是不知道有甚麼更好的選擇
所以不懂就討論.各位覺得想要又好又快.甚麼模型才是最好的呢??
--
有時候,有些事比贏球更讓你感動
(Sometimes, this game is more than just the final score.)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.199.178 (臺灣)
※ 作者: sdfsonic 2025-08-14 21:51:04
※ 文章代碼(AID): #1edUdAJx (AC_In)
※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1755179466.A.4FB.html
※ 同主題文章:
… ×23
Re: [洽特] RisuAI的簡易上手指南
08-14 21:51 sdfsonic
推 driftcreator: 兩個選擇,一是調低上下文,然後把preset減肥
二是換Claude 3.7或GPT 4o直連API,模型記憶力較差1F 08/14 22:05
推 h0103661: 換輕量模型最實際,gemini-pro本來就是需要思考比較久的模型,你可以關掉思考或是換成gemini-flash3F 08/14 22:12
→ sdfsonic: 其實我是可以等的.我最注重還是文本跟劇情的品質
當然能夠又好又快速 那是最棒的5F 08/14 22:17
推 driftcreator: RisuAI關掉Gemini 2.5的reasoning需要會自寫外掛
門檻比較高,所以我直接兩組非思考課金模型了
對了,追求速度的話,不要用github copilot7F 08/14 22:18
推 wangmytsai: 雖然gemini2.5flash整天在那邊重複字詞,不過現在在跑的肥度還是不敢隨便換課金模型...10F 08/14 22:49
推 kimwang: 目前試用額度還沒用完還是用gemini-2.5-pro
但是重複字詞真的是看得有點煩 不過claude的api價格太貴怕大量玩的時候噴太多錢
是說最近因為custom API不能用gemini 改回用google cloud但是很容易發生輸出到一半被咖掉或者空白回覆的狀況
但是從請求記錄看 finishReason都是代表正常結束的STOP有人也有遇到類似的狀況嗎?12F 08/14 23:00
→ sdfsonic: gemini-2.5-pro用太兇我會遇到429的狀況19F 08/14 23:11
推 kimwang: RisuAI那邊討論是可能模型有更新造成的 這種就比較麻煩26F 08/14 23:23
→ kimwang: 現在在測新的preset幾乎沒辦法正常跑...28F 08/14 23:53
推 driftcreator: 這是Gemini API近期的大規模災情不限平台,所以無解29F 08/15 00:00
推 kimwang: 真慘 看來最近只能先不跑了嗎...不然就要找別的API
不過切回小惡魔又暫時不會了 那個preset是寫了啥才一直斷雖然小惡魔跑久了也會開始斷就是
看arca live說改用Vertex的API就不會 有申請的可以試試看30F 08/15 00:09
→ Fizban: 我還在用vertex的免費額度所以沒遇到截斷的狀況
是說Risu有官方DC群?裡面都是韓國人?34F 08/15 03:37
→ zseineo: risu首頁拉到最下面就有DC了37F 08/15 07:48
推 e04su3no: 這已經算快的了,酒館如果開記憶表格大概要80秒才會回截斷最近災情很嚴重不過掛cli 反代能解決38F 08/15 09:16
--