1/5

5条科技热门 Day 022 | llama.cpp 2× · CTF已死 · SANA-WM开源

Day 022 精选 5 条跨源最高热度内容:llama.cpp MTP 投机解码合并(27B 多轮对话快 22.5%,后续轮次 −26.5%);资深 CTF 选手论证公开赛事格式已被 GPT-5.5 彻底破坏;NVIDIA 发布 2.6B SANA-WM 开源世界模型(单 GPU 生成 1 分钟 720p 视频,推理 36× 基线);Fisker 破产后 1.1 万车主自建 FOA 开源汽车生态;codegraph GitHub 日榜冠军(+416⭐,Claude Code 预索引知识图谱减少 94% 工具调用)。

2026/05/17 09:47:09

ギャラリー

本地推理这周真的炸了 🔥
llama.cpp 刚把 MTP(多 Token 预测)合并进主干——27B 模型多轮对话直接快了 26%,生成速度翻倍。社区三个帖子同时刷屏,能看到 「LFG!!!」从评论区飘出来。

01 · llama.cpp MTP 正式合并 PR #22673,作者 am17an,Georgi Gerganov 协作。 Qwen3.6-27B 实测:5 轮对话总耗时 −22.5%,后续轮次再降 −26.5%。 关键是 decode 主导场景赢得最彻底——prefill 重的任务提升有限,具体跑哪个看你自己的工作负载。
02 · AI 正在杀死公开 CTF 竞赛 资深选手、TheHackersCrew 前成员写了一篇很沉的文章: GPT-5.5 已经能一键解掉 HackTheBox 最高难度堆利用题。 Plaid CTF 停办,老牌战队大批退场,积分榜现在比的是谁 token 烧得多。 「The format is dead.」他这么说,没留余地。
03 · NVIDIA SANA-WM 开源 2.6B 参数,单 GPU 生成 1 分钟 720p 可控视频。 RTX 5090 上 34 秒出 60 秒成片,推理吞吐量超开源基线 36 倍。 训练成本:64 张 H100 跑 15 天,用了约 21 万段公开视频。 混合线性注意力解决了全 softmax 在长视频上 OOM 的老问题。
04 · Fisker 车主自建开源汽车生态 Fisker 去年破产,1.1 万辆 Ocean 车主云服务断掉后车近乎变砖。 他们自己成立了 FOA(4000 人),逆向工程私有软件,发布 CAN 总线 DBC 文件,欧洲还建起移动维修网。 Vitalik Buterin 评论:「厂商倒闭→车变砖,已经快成行业默认设定了,很悲哀。」 这不是 Fisker 一家的问题。
05 · codegraph GitHub 日榜冠军 今日新增 +416⭐,Claude Code 的预索引代码知识图谱。 减少 94% 工具调用、探索速度快 77%,100% 本地运行,无需 API 密钥。 本周 GitHub Weekly 整体被 AI Agent 工具链包场:CloakBrowser(+8618⭐周冠)、DeepSeek-TUI(总星 30.5k)、anthropics/financial-services(+6935⭐)。

来源:Hacker News / r/LocalLLaMA / r/MachineLearning / GitHub Trending 窗口:2026-05-16 01:37 ~ 05-17 01:00 UTC+8
你现在本地跑哪个模型?评论区说说 👇
#科技日报 #AI 推理 #llamacpp #本地大模型 #CTF #NVIDIA #开源 #GitHub 热榜 #科技热点 #每日资讯

コメント