sillytavern吧 关注:45,224贴子:164,109
  • 3回复贴,共1

关于llm与ui交互的一点想法

只看楼主收藏回复

叠甲:一点点纯个人想法,我没写过卡,纯使用角度的感受的思考(
最近deepseek v4pro出了,不用折腾gemini&claude api了回坑玩,发现社区里很多状态栏&交互做的相当复杂相当有意思了,但是实现思路好像还是指定格式然后永正则套UI里去渲染
众所周知,llm有时候会抽风导致正则匹配不上,然后掉格式之类的
同时因为llm的消息没状态,一些连续性的UI展示性也不好,比如聊天室之类的,每次都渲染新的
此外纯html + css 写复杂UI交互其实挺麻烦的,复用性也低,重构也麻烦
这些问题在一些ai交互领域已经被解决了相当部分了,比如copilotkit以及其他llm交互的UI库,核心思路是UI组件作为一种function call之类的东西,按照json/yaml格式注入数据来实现渲染,用react来开发UI组件交互也好写一些,复用性难度也相对低
酒馆可能是受到纯文本思路的限制,走了这么一套正则的方案
说到复杂的交互,这里其实有另一种解法,就是游戏化/程序化的思路来做,比如现在很多市面上的侦探游戏,扮演游戏,但是这种定制化程度太高,不够酒馆自由,而且开发成本比较高,创作门槛比较高
其实游戏为主体,llm为辅助扮演还是llm为主体,图形化状态展示与交互算是天平两端?我觉得酒馆没有很好平衡
因为很多涉及数值的游戏,我个人觉得纯llm填数值不是特别好,我会担心llm乱填&反馈不明确的问题,我觉得应当是有一种更均衡的解法的,比如程序是主体,ai只负责每个stage/scene的演绎


疑似含AI内容
IP属地:云南来自Android客户端1楼2026-05-01 16:16回复
    错误的,正则已经是古董做法了,现在的状态栏基本是用muv之类的变量框架,然后根据变量进行渲染。由于变量结构固定,因此状态栏一般不会掉格式,就算llm输出不佳,也只是未能及时更新而已。
    游戏化确实是个好思路,社区里面也有不少大佬在朝这个方向做


    IP属地:黑龙江来自Android客户端2楼2026-05-01 19:57
    回复
      2026-05-03 04:01:41
      广告
      不感兴趣
      开通SVIP免广告
      我觉得根本性问题还是需要一个强约束,游戏是个很好的形式。我在某项目中做过llm驱动的对话玩法,但缺点很明显,成本比较高,参与率上不去。在目前的这个时间节点,只能说没什么商业潜力,愿意砸钱研发的人很少


      IP属地:浙江来自Android客户端3楼2026-05-02 01:15
      回复
        性价比还是minimax。。。50%的成本达到主流模型80%的能力,本质是低参打高参,维度上降低电费。deepseek还是需要参数量的,这就让他的成本根本上不去。目前市面上也就minimax可以做到真正的tokenplan无上限。。上个月我49块用了10亿token。。。性价比????


        IP属地:上海来自Android客户端4楼2026-05-02 11:42
        回复