About 50 results
Open links in new tab
  1. XSCT Bench: 找到让你产品成立的那个模型 — Product Model Fit

    Feb 15, 2026 · XSCT Bench 在开始构建之前,先找到最适配你产品的那个模型。 AI 产品的成败,往往在选模型那一刻就已决定。 我们用覆盖文本、图像、网页生成的真实产品场景测试,帮你在花时间 …

  2. 关于 XSCT Bench - 帮你找到产品的 Product Model Fit

    XSCT Bench 是独立运营的 AI 产品模型选型平台。帮助产品构建者在真实产品场景下验证模型能力、效果与成本,在大量投入前找到 Product Model Fit。所有测试数据透明可追溯,不接受厂商赞助。

  3. xsct.ai

    --- name: xsct-bench description: 基于 XSCT Bench 真实评测数据做模型选型顾问。帮助用户选模型、分析模型能力、对比两个模型、估算 API 成本、查找评测用例。当用户说「选模型」「哪个模型更好 …

  4. 小米 Mimo 系列 Agentic 场景工程化落地评测报告 - XSCT ...

    Mar 19, 2026 · XSCT Arena · Agentic & Web 场景深度评测 小米 Mimo 系列 Agentic × Web 场景工程化落地评测报告 全面评测 mimo-v2-pro 与 mimo-v2-omni 在 xsct-a Agentic 与 xsct-w Web 应用生成两 …

  5. MCP 使用技巧 - XSCT Bench 博客

    Feb 25, 2026 · Hi,我是洛小山,你学习 AI 的搭子。 前两天发了 XSCT Bench 平台,现在 DAU 已经破 500 啦~ !图片 有好多朋友非常仔细研究用例,我收到了许多 BUG 反馈,收获了一些小开心。 !图片 …

  6. 小米 Mimo 系列 Agentic × Web 场景工程化落地评测报告 · ...

    Mar 19, 2026 · 小米 Mimo 系列 Agentic × Web 场景工程化落地评测报告 全面评测 mimo-v2-pro 与 mimo-v2-omni 在 xsct-a Agentic 与 xsct-w Web 应用生成两大场景下的综合能力,

  7. 用例搜索 - 按场景查找大模型评测结果 | XSCT Bench

    接入 XSCT MCP 服务后,在 Cursor / Claude Desktop / Cherry Studio 里直接问:「搜索一下图像生成的测试用例」「有没有关于光影效果的评测?」AI 会实时查询并给出答案。

  8. 小米 mimo-v2.5 / mimo-v2.5-pro 深度测评报告

    Apr 29, 2026 · mimo-v2.5 以 84.9 分位列 XSCT Arena 第 23/30 名,数学、一致性、阅读理解三个维度在困难梯度下稳定在 89–92 分区间,但幻觉抵御(66.8)与中文拼音(63.1)维度存在超过 20 分的 …

  9. Google: Gemini 3.1 Pro Preview 评测报告 | XSCT Bench

    Google: Gemini 3.1 Pro Preview 在 XSCT Bench 场景化评测中的详细表现,包含多个维度评分、各难度级别得分、与其他模型的对比数据。真实场景实测,选型更有依据。

  10. 当 AI 把开发速度干到 10 倍,但交付还是慢得不行。 - XSCT ...

    Apr 20, 2026 · Hi,我是洛小山,你学习 AI 的搭子。 今天我们聊聊 AI 组织提效。 过去半年推动团队全面拥抱 AI 提效的过程中,有不少收获,也有不少困惑。 这篇文章是我对这些困惑的一次系统梳理,试 …